calcul numérique appliqué - maths - algorithme (Édition edp sciences)

556
F I hi M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ s L ‘4 cl Christian Guilpin Maître de Conférence, responsable de 1 ‘enseignement des mathématiques appliquées en maîtrise de Physique et Applications à l’université Paris VII-Denis Diderot /EDPI SCIENCES 7, avenue du Hoggar Parc d’activité de Courtabœuf, BP 112 91944 Les Ulis Cedex A, France

Upload: ines-rag

Post on 27-Jun-2015

2.343 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

FIhi M A N U E L D E C A L C U L

NUMÉRIQUE APPLIQUÉ

s

L‘4cl

Christian GuilpinMaître de Conférence, responsable de 1 ‘enseignement des mathématiques appliquées

en maîtrise de Physique et Applications à l’université Paris VII-Denis Diderot

/EDPISCIENCES

7, avenue du HoggarParc d’activité de Courtabœuf, BP 112

91944 Les Ulis Cedex A, France

Page 2: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Avant-propos

Ce livre de calcul appliqué trouve son origine dans un cours dispensé aux étudiants de maîtrisede physique et applications (MPA) à l’université Paris VII depuis 1984, ainsi que dans quelquespréoccupations de recherche au laboratoire.

Ce manuel ne constitue pas à proprement parler un cours au sens usuel du mot, et si certainschapitres ont des liens évidents et s’enchaînent naturellement, d’autres, plus isolés, ont été réunissous forme d’annexes pour préserver au mieux l’unité, mais leur importance n’est pas secondaire.

L’organisation de cet ouvrage vise à une présentation suffisamment concise et assimilable desalgorithmes numériques fondamentaux, développés jusqu’à leur mise en œuvre, de telle sortequ’ils soient susceptibles d’aider l’étudiant, le chercheur et l’ingénieur dans l’exercice quotidiende leur art : il s’agit de pouvoir obtenir des résultats numériques convenables chaque fois qu’uneméthode analytique fait défaut.

Pour ce qui concerne certains théorèmes très importants, nous nous sommes parfois bornéà les énoncer sans les démontrer, le contraire eut risqué de nous éloigner de notre préoccupa-tion majeure : le résultat numérique ; cependant, les indications bibliographiques permettentd’obtenir aisément ces démonstrations qui sont classiques.

Les objectifs poursuivis se situent sur deux plans que l’on a coutume de séparer mais qui sontindissociables de notre point de vue : l’acquisition d’algorithmes numériques indispensable à larésolution de problèmes usuels et la maîtrise du traitement des données expérimentales selon laméthode statistique. Traiter les données de l’expérience impose l’usage de techniques numériquesappropriées, et l’examen des résultats entachés d’erreur et d’incertitude impose l’usage de lastatistique. La propagation des erreurs à travers les algorithmes relève d’une analyse subtile quiest éternellement omise tant elle est délicate. Nous avons tenté de l’effleurer et c’est une desraisons qui nous a poussé à développer l’étude des lois de distribution ainsi que leurs fondementsdans une partie qui est davantage dévolue aux statistiques.

De même qu’il est impensable de vouloir apprendre à jouer du piano la veille de donner unconcert, de même il est impensable de vouloir apprendre l’algorithmique numérique le jour oùle besoin s’impose. Dans les deux cas, il convient de recourir aux gammes afin d’acquérir unesolide expérience. En calcul numérique il n’y a pas de voie royale, et aucun algorithme n’estcapable de fournir de résultats corrects quelles que soient les données fournies. Il est toujourspossible de mettre en défaut une procédure et d’obtenir des résultats abérrants pourvu que l’ons’en donne la peine... Un très bel exemple est étudié à l’occasion de la résolution des systèmeslinéaires dépendant d’une matrice de Hilbert.

L’expérience pratique prend alors toute sa valeur, et c’est ainsi que notre enseignementcomporte une séance hebdomadaire de trois heures sur calculateur arithmétique. Peu importe

3

Page 3: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

le langage et la manière, seul le «résultat correct 8 compte et ce n’est pas une mince affaireque de se faire une opinion sur les erreurs qui entachent les résultats finals. Ensuite viendrontéventuellement se greffer les problèmes d’élégance et d’optimisation.

En aucun cas, cet enseignement n’a pour but d’explorer et de recenser tous les algorithmesayant trait à un type de problèmes. Nous avons voulu présenter ceux qui se sont montrésparadigmatiques soit sous l’angle de la simplicité soit sous l’angle de l’efficacité. Il s’agit deconstruire des programmes que nous aurons soigneusement testés, dont nous connaîtrons leslimites et qui rempliront peu à peu notre boîte à outils.

Pour simplifier, nous dirons que ce livre peut se subdiviser en trois parties à savoir :

1. Études d’algorithmes numériques et leur mise en oeuvre.2. Analyse statistique des résultats d’expériences.3. Annexes, problèmes et corrigés.

Nous l’avons déjà dit, les deux premières parties interfèrent partiellement, et c’est une desraisons pour laquelle nous avons renoncé à présenter un ouvrage où tout ce qui est étudié dansun chapitre s’appuie nécessairement sur ce qui a été établi précédemment. Par souci d’unité nousavons préféré regrouper les titres par centre d’intérêt. Ainsi, il nous est apparu plus intéressantd’avoir rassemblé l’étude des polynômes orthogonaux plutôt que d’avoir dispersé l’informationdans différents chapitres concernant l’interpolation et l’intégration numérique.

Il aurait été dommage de ne pas avoir abordé, ne serait-ce que rapidement, les méthodes deMonte-Carlo d’une part, et les problèmes mal posés d’autre part. Ces domaines illustrent bienla synthèse des deux premières parties, d’autant plus qu’ils s’intègrent remarquablement dansles préoccupations des chercheurs et des ingénieurs. Qui, en physique, n’a pas eu à résoudrenumériquement une équation de convolution? Qui n’a pas tenté la résolution d’un problème aumoyen d’une simulation?

Pour terminer nous proposons un avant-dernier chapitre constitué d’un ensemble de problèmeset d’exercices qui illustrent quelques usages des méthodes qui ont été présentées; ils serventégalement à éclairer quelques points de théorie qui seraient venus alourdir le cours s’ils avaientété intégrés dans les divers chapitres : on montre par exemple que le coefficient de conformitéde Pearson obéit bien à une loi du x2. Le dernier chapitre donne les solutions des problèmesprésentés.

La plupart des chapitres font l’objet d’une illustration et se terminent par des programmesécrits dans le langage C : il s’agit du langage de base qui assure la portabilité. Ce point de vues’explique par la facilité qu’il y a à changer de langage : Fortran, Pascal, etc., sans avoir grandchose à modifier dans le programme source. On n’est pas obligé de partager ces vues, mais il esttrès facile de modifier les programmes proposés pour qu’ils apparaissent moins « archaïques ».

Pour en finir avec les algorithmes choisis et les programmes présentés, nous dirons qu’ilssont fournis sans garantie d’aucune sorte malgré le grand soin porté à ce travail. Ils peuventcomporter des imprécisions voire des imperfections, à ceci s’ajoute le fait qu’aucun algorithmen’est irréprochable dans la mesure où il est toujours possible de trouver des valeurs numériquesqui le mette en défaut.

Bien sûr, nous formons le vœu que cet ouvrage puisse apporter une aide solide aux étudiants,ingénieurs et chercheurs pour lesquels il constituera un outil dont le rôle favorise la réalisationde sa propre boîte à outils.

La rédaction d’un ouvrage ne se réalise jamais dans l’isolement, et il m’a fallu bien des oreillesattentives, bien des lecteurs vigilants, bien des conseillers éclairés. L’instant est venu de remerciertous ceux qui, à quelque titre que ce soit, m’ont apporté une aide inconditionnelle, je citeraipar ordre alphabétique : Claude Bardos, Jean Bornarel, Jacques Gacougnolle, Patricia Guilpin,

Page 4: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

AVANT-PROPOS

Michel Jacques, Claude Marti, Yvan Simon ainsi que l’équipe de physique théorique de ChaouquiMisbah.

Pour terminer, j’ajouterai une mention particulière à EDP Sciences qui m’a offert un contextede travail optimum afin d’obtenir la meilleure réalisation possible.

Christian GUILPIN

PROGRAMMES SOURCES ACCOMPAGNANT CE MANUEL

Les programmes sources cités dans ce livre sont disponibles sur le site Web d’EDP Sciences(adresse : http://www. edpsciences . com/guilpin/).

Chapitre 2 rutisacc . c sn-x. txt dfftinv.h Chapitre 26aitken-0.c dani1ev.c un-x. txt tf-image.c regres.cepsilon-0.c dsys1in.h vn-x.txt inv-imag.crichard.h Annexe Arichar-0.c Chapitre 6 Chapitre 12 Chapitre 17

sturm.cepsilon-1.c 1agpoly.c argent.c fredh-1.cepsilon-2.c ascend.c cotes-l. c gaussien.hepsilon-3.c dconvo1.c Annexe F

descend.c cotes-2.cepsilon-4.c 1ispline.c dconvo1.h bessel1n.c

aitken-2.c sp1ine.h Chapitre 13 intm0nte.h bessel1f.c

kacmarz1.c sudeter . c xa1eamen.h bessel2n.c

fredho1m.cepsi1on.h

multma. hbessel2f.c

combina. hnewton-1.c transpos . h retr0gra.c

Chapitre 18 besse1jf.h

dsys1in.h calcu1pi.c besse1jn.h

Chapitre 4runge . c

invers.h matmont e . c besse12f.h

dichot0.cpendu1e.cmoulton. c intm0nte.c

itera.c Chapitre 7 recuit .c Annexe 1bashf0rt.c

newton1d.c 1egendre.c tayl0r.c dzeta0.cnewt0npp.c decom1eg.c

Chapitre 20 dzeta1.ckacmarz . cnewton2d.c

r-1egend.c Chapitre 14 gauss1eg.h grosys1.c

getneme . h t r i o d e . cjacobi0.c

bairst0w.c Chapitre 22bairst0w.h chaleur.~

jacobi1.c

Chapitre 9 khi2.hcorde.~

pendule0.cracine.h student.h

1aguerre.cpredcor0.csouriau0.c

Chapitre 5 r-1aguer.c Chapitre 15 Chapitre 24 sudeter. csyst1in.c echanti1.c

Chapitre 10hist0gra.c sys1init.c

triangle. c gibbs.c ko1mogor.c tangent2.ctrian1in.c hermite . c dirac.c gradc0nj.chi1bert.c r-hermit.c fi1tre.c Chapitre 25 refrig1.ctrianinv.c teststat . c mathieu9.c1everier.c Chapitre 11 Chapitre 16 varian-1.c vanderp0.cgivens.c rn-x.txt dfftO.h varian-2.c card0.c

Page 5: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Sommaire

AVANT-PROPOS 3

1. GÉNÉRALITÉS SUR LE CALCUL NUMÉRIQUE 17

1 . La notion d’algorithme en calcul numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Le calcul numérique ne concerne que les nombres entiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. Le calcul numérique traite du problème pratique de l’approximation de fonctions

explicites ou implicites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4 . Solutions littérales et solutions analytiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 . Que sait-on calculer rigoureusement? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Les erreurs et les incertitudes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Un problème difficile : la propagation des erreurs en calcul automatique . . . . . . . . . . . . . . .8. Réexamen des erreurs du point de vue statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9. Sur la représentation des nombres en machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 71 8

1 82 02 02 12 22 6273 0

2. QUELQUES ALGORITHMES ACCÉLÉRATEURSDE LA CONVERGENCE DES SUITES 3 1

1. L’algorithme A2 d’Aitken (1895-1967). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 12. Le procédé d’extrapolation de Richardson (1881-1953). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 23. Présentation de l’epsilon-algorithme scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 54. L’epsilon-algorithme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

5. L’epsilon-algorithme matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

6. Remarques et propriétés de l’epsilon-algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 87. Propriétés remarquables du procédé A2 d’Aitken et de l'epsilon-algorithme . . . . . . . . . . . . 3 98. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

7

Page 6: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3. LESDÉVELOPPEMENTSASYMPTOTIQUES 43

1. Un exemple de développement asymptotique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432. Quelques propriétés utiles des développements asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 53. Développement asymptotique de quelques fonctions spéciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4. RÉSOLUTIONDES ÉQUATIONSNUMÉRIQUES 51

1. Généralités sur la résolution des équations f(z) = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 12. Résolution d’un système non linéaire de deux équations à deux inconnues ... . . . . . . . . . . 5 93. Racines d’un polynôme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5. ÉLÉMENTS DECALCULMATRICIEL 69

1. Multiplication de deux matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 92. Résolution d’un système linéaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703. Inversion d’une matrice carrée d’ordre n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 784. Calcul des valeurs propres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 95. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6. L'INTERPOLATION 89

1. De la légitimité de l’interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 902. Le polynôme de Lagrange (173661813). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 903. Évaluation de l’erreur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 24. Comment minimiser E(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 35. Autre disposition pratique du calcul du polynôme de Lagrange ... . . . . . . 9 46. Cas où les abscisses sont en progression arithmétique . . . . . . . . . . . . . . . . . . . 9 57. Les polynômes d’interpolation de Newton (164331727) . . . . . . . . . . . . . . . . . . . 9 68. Le polynôme d’interpolation de Stirling (169221770) . . . . . . . . . . . . . . . . . . . . . 989. Le polynôme d’interpolation de Bessel (178441846). . . . . . . . . . . . . . . . . . . . . . . 100

10. Erreurs commises en utilisant les polynômes d’interpolation ... . . . . . . . . . . 1 0 011. Programmes déterminant les polynômes d’interpolation . . . . . . . . . . . . . . . . . . 1 0 112. Interpolation par les fonctions-spline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0 113. Les fonctions-spline du troisième degré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0 214. Résolution d’un système linéaire dépendant d’une matrice tridiagonale 10415. Une application simple des polynômes d’interpolation . . . . . . . . . . . . . . . . . . . . 1 0 516. L’algorithme d’interpolation d’Aitken (1932) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10617. Approximation par une combinaison linéaire de fonctions . . . . . . . . . . . . . . . . 1 0 918. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1

7. LESPOLYNÔMESDELEGENDRE.MÉTHODED'INTÉGRATIONDEGAUSS-LEGENDRE 113

1. Les polynômes de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 32. Méthode d’intégration de Gauss-Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 2

8

Page 7: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

S O M M A I R E

8. LES POLYNÔMES DE TCHEBYCHEFF.APPLICATION À LA MÉTHODE DE GAUSS-TCHEBYCHEFF 1 3 3

1. Les polynômes de Tchebycheff (1821-1894) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 32. Une propriété essentielle des polynômes de Tchebycheff à coefficient principal réduit . 1343. Les racines des polynômes de Tchebycheff &+I(Z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 54. Calcul des poids Hk correspondant aux racines zk du polynôme T,+r(x). . . . . . . . . . . . . . . 1 3 55. Méthode d’intégration de Gauss-Tchebycheff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 6

6. Calcul de l’intégrale 1 = 7 f(x)~a dM d z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 6

7. Calcul de l’erreur commise lors de l’approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1378. Fonctions génératrices des polynômes de Tchebycheff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 99. Un exemple d’intégration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 9

9. LES POLYNÔMES DE LAGUERRE.MÉTHODE D’INTÉGRATION DE GAUSS-LAGUERRE 1 4 1

1. Relation de récurrence entre trois polynômes consécutifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 12. Relation de récurrence faisant intervenir la dérivée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 23. Les premiers polynômes de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 24. Calcul des coefficients des n premiers polynômes de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . 1435. Orthogonalité des polynômes de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 36. Calcul des racines des premiers polynômes de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 47. Calcul des poids HI, correspondant aux racines X~C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 58. Calcul numérique des poids Hk associés aux racines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 5

9. Calcul des intégrales du type 1 = Sexp(-z)f(s) dx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 5

10. Calcul de l’erreur commise lors de’l’approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14711. Fonction génératrice des polynômes de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 912. Calcul numérique de la transformée de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 913. Appendice : Les polynômes de Laguerre généralisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

10. LES POLYNÔMES D’HERMITE.LA MÉTHODE D’INTÉGRATION DE GAUSS-HERMITE 153

1. Relation de récurrence entre trois polynômes consécutifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Relation de récurrence entre polynômes et dérivées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. Les premiers polynômes d’Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Calcul des coefficients des premiers polynômes d'Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. Orthogonalité des polynômes d’Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Calcul des racines des premiers polynômes d’Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Calcul des poids HI, correspondant aux racines xk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8. Technique de calcul des intégrales du type 1 = 7 exp (-x2/2) f(x) dz . . . . . . . . . . . . . . . .

9. Autres notations très utiles . . . . . . . . . . . . . . . . . . . . . .y:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10. Calcul de l’erreur commise lors de l’approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11. Fonction génératrice des polynômes d’Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 5 31541541541 5 41 5 51 5 6

1 5 6

1571 6 01 6 21 6 3

9

Page 8: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)
Page 9: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

SOMMAIRE

15. LES SÉRIES DEFOURIER 229

1. Petit aperçu historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Orthogonalité des fonctions sinus et cosinus sur une période.. . . .3. Série de Fourier associée à une fonction périodique . . . . . . . . . . .4. Conditions d’égalité de f(z) et de la série de Fourier associée . . .5. Quelques propriétés remarquables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Approximation des fonctions par une série de Fourier tronquée..7. Cas où la fonction est discontinue à l’origine . . . . . . . . . . . . . . . . . . . . .8. Le phénomène de Gibbs (1839-1903) et l’epsilon-algorithme . . . .9. Représentation des séries de Fourier avec un terme de phase . . . .

10. Écriture du développement sous forme complexe.. . . . . . . . . . . . . .11. Approximation des fonctions au sens de Tchebycheff . . . . . . . . . . . .12. Application des séries de Fourier au filtrage numérique.. . . . . . . .13. À propos du développement des fonctions non périodiques.. . . . . .14. Calcul des séries de Fourier à coefficients approchés dans L2 . .15. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. .

. .

. . . 229

. . . 2 3 1

. . . 232

. . . 233. . . 234. . . 235. . 238. . . 238. . . 2 4 1. . . 241. . . 242. . . 244. . . 246. . . 246. . . 247

16. LESTRANSFORMÉESDEFOURIER 249

1. Extension des séries de Fourier au cas où la période est infinie . . . . . . . . . . . . . . . . . . . . . . . . . . 2492. Conditions d’existence des transformées de Fourier dans les espaces L1 et L2 .......... 2523. La transformée de Fourier dans l’espace L1 ................................................ 2534. Les transformées de Fourier dans l’espace L2 .............................................. 2555. Produit de convolution dans les espaces L1 ou L2 ........................................ 2566. Sur le calcul numérique des transformées de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2607. Cas des fonctions échantillonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2608. Calcul par un algorithme ordinaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2619. L’algorithme de Cooley-Tukey (1915- ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262

10. Programmes de calcul des transformées de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26611. Un problème fondamental : quelle doit être la période d’échantillonnage

de la fonction f(z)? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26712. La distribution de Dirac (190221984) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26913. Transformées de Fourier multidimensionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27114. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272

17. INITIATION AUX PROBLÈMES MAL POSÉS:ÉQUATIONS INTÉGRALE~,SYSTÈMES LINÉAIRES MAL CONDITIONNÉSETÉQUATIONSDECONVOLUTI~N 273

1. Un exemple de problème mal posé :le calcul des séries de Fourier à coefficients approchés dans L2 .......................... 273

2. L’équation intégrale de Fredholm (186661927) de première espèce . . . . . . . . . . . . . . . . . . . . . . 2743. Notion de problèmes bien et mal posés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2764. Méthode de régularisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2765. Application à la résolution approchée des équations intégrales

de Fredholm de première espèce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2806. Résolution d’un système linéaire mal conditionné . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2827. Résolution des équations de convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2838. Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285

11

Page 10: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

18. INTRODUCTION AUX MÉTHODES DE MONTE-CARLO 287

1. Le problème de Buffon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2872. Générateurs de nombres pseudo aléatoires à distribution uniforme . . . . . . . . . . . . . . . . . . . . . . 2883 . Calcul de 7r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2904. Calcul d’une intégrale définie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2905. Intégration de l’équation de Laplace en un point . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2926. Inversion d’une matrice carrée d’ordre n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2937. Méthode du recuit simulé : recherche du minimum absolu d’une fonction ... . . . . . . . . . . . 2948. Simulation d’autres lois de distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2959. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

19. ÉLÉMENTS DE CALCUL DES PROBABILITÉS 299

1. Introduction et notions fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2992. Évaluation de la probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3003. Notion de variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3014. Somme et produit d’événements. Théorèmes fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3015. Lois de répartition des variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3056. L’inégalité de Bienaymé (1796-1878) - Tchebycheff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3087. Le théorème de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3098. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309

20. LA LOI BINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE 3 1 1

1. La loi binomiale, schéma de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3112. Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3133. Loi de Gauss-Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3164. Changement de variable aléatoire dans les lois de répartition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3225. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

21. LA FONCTION CARACTÉRISTIQUE 325

1 . Définition et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3252. La distribution du x2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3283. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

22. LA LOI DU x2 ET LA LOI DE STUDENT 3 3 1

1. La loi du x2n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3312. Distribution d’une somme de deux variables aléatoires indépendantes

obéissant chacune à une distribution du x27L . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3333. La loi du J& à m degrés de liberté tend asymptotiquement vers la loi de Gauss

quand m tend vers l’infini.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3334. Distribution d’une variable aléatoire fonction de deux variables aléatoires indépendantes 3345. La distribution de Student (W. Gosset) (187661937) . . . . . . . . . . . . . . . . . . . . . . . . . 3366. La distribution d’une somme de deux variables aléatoires

indépendantes obéissant à une distribution de Student est-elle encore une distributionde Student? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339

7. La loi de Student à m degrés de liberté tend asymptotiquement vers la loi de Gaussquand m tend vers l’infini.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339

8. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

1 2

Page 11: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

SOMMAIRE

23. SYSTÈMES À PLUSIEURS VARIABLES ALÉATOIRES 341

1. Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Système de variables aléatoires, fonction de répartition . . . . . . . . . . . .3. Variables aléatoires liées et indépendantes . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Caractéristiques numériques, covariance, coefficient de corrélation5. Généralisation au cas de plusieurs variables . . . . . . . . . . . . . . . . . . . . . . . . .6 . Quelques théorèmes importants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Propriétés du coefficient de corrélation (démonstrations). . . . . . . . . . .8. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24. CRITÈRES DE CONFORMITÉ 3 5 1

341341343343345346348349

1 . Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Représentation des données numériques. Histogramme . . . . . . . . . . . . . . . . . . . . . . . .3. Conformité entre une répartition théorique et une répartition expérimentale

(ou répartition statistique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Le xi de Pearson (1857-1936) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. Critère de Kolmogorov (190331987) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Estimation des paramètres d’une loi inconnue. Estimateurs . . . . . . . . . . . . . . . . . . .7. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25. ÉTUDE DES DÉPENDANCE S DANS LE CAS LINÉAIRE 361

1. Les types de schémas de dépendance linéaire . . . . . . . . . . . . . . . . . . . . . . . .2. Fondements de l’analyse de corrélation-régression. . . . . . . . . . . . . . . . . . .3. Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

351352

353353356356359

361364369370

26. ANALYSE DE CORRÉLATION ET DE RÉGRESSION 371

1. La corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

371375379

ANNEXES 3 8 1

A. LES SUITES DE STURM. APPLICATION À LA DÉTERMINATIONDU NOMBRE DE RACINES RÉELLES D’UN POLYNÔME 383

1. Notion de variations d’une suite numérique . . . . . . . . . . . . . . . . . . . . . . . . . .2. Suite de Sturm générée à partir d’un polynôme . . . . . . . . . . . . . . . . . . . . .3. Quelques propriétés des suites de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Le théorème de Sturm (1829) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. Disposition des calculs, schéma de Routh (1831-1907) . . . . . . . . . . . . .6. Quelques exemples de suites de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Mise en œuvre du théorème de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

383383384385386386386387

13

Page 12: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

B. POLYNÔMES ORTHOGONAUX RELATIVEMENT À UNE FONCTION POIDS.GÉNÉRALISATIONDELAMÉTHODEDEGAUSS 389

1. Généralisation de la notion de polynômes orthogonaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

2. Décomposition d’une fonction f(z) sur la base des polynômes IV~(Z) orthogonauxsur l’intervalle (u,b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390

3. Racines des polynômes orthogonaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3924. Relation de récurrence entre trois polynômes orthogonaux consécutifs . . . . . . . . . . . . . . . . . . 3935. Généralisation de la méthode de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3936. Expression de l’erreur en remplaçant 1 par J . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3947. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

C. LES FRACTIONS CONTINUES 397

1. Un exemple de fraction continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. Les fractions continues finies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. Les fractions continues infinies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Développement en fraction continue à partir d’un développement

en série entière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. Développement en fractions continues de séries usuelles . . . . . . . . . . .6. Développement en fraction continue à partir d’un produit infini . .7 . Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

397398400

4 0 1402403404

D. LESAPPROXIMANTSDEPADÉETDEMAEHLY 405

1. Le théorème fondamental de Padé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4052. Sur le calcul effectif des coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4073. Estimation de l’erreur commise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4074. Développements de quelques fonctions en approximants de Padé . . . . . . . . . . . . . . . . . . . . . . . . 4085. Généralisation des approximants de Padé, méthode de Maehly . . . . . . . . . . . . . . . . . . . . . . . . . . 4146. Erreur liée à l’usage des approximants de Maehly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4187. Difficultés liées à la recherche d’une généralisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4198 . Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419

E. CALCULDESFONCTIONSDEBIBLI~THÈQUEÉLÉMENTAIRES 4 2 1

1. Calcul de exp(z) pour x appartenant à (-CO, +oo) . . . . . . . . . . . . . . . . . .2. Calcul de sin(z) et COS(X) pour 2 appartenant à (-CO, $00) .. . . . . . .3. Calcul de loge(z) pour z appartenant à (0, +oo) . . . . . . . . . . . . . . . . . . . . .4. Calcul de tangente et cotangente pour 5 appartenant à (-00, +~CI)5. Calcul de argtanh(z) pour z appartenant à (0,l) . . . . . . . . . . . . . . . . . . . .6. Calcul de arctan pour z appartenant à (0, +co) . . . . . . . . . . . . . . . . . .7. Calcul de arcsin et arccos pour 2 appartenant à (0,l). . . . . . . .8. Calcul de la racine carrée pour 2 appartenant à (0, oo). . . . . . . . . . . . . .9 . Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 2 1423425425426426426427427

1 4

Page 13: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

SOMMAIRE

F. CALCULNUMÉRIQUEDES FONCTIONSDEBESSEL 429

1. L’équation différentielle des fonctions de Bessel (1784.2. Relations de récurrence.. . . . . . . . . . . . . . . . . . . . . . . . . . . .

3. Représentation de Jy(z) par une intégrale définie.. . . .4. Technique de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5. Calcul de l’erreur sur Jo(z) . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1846)..................

......

......

..................... 429

..................... 430

. . . . . . . . . . . . . . . . . . . . . 431

. . . . . . . . . . . . . . . . . . . . . 431

. . . . . . . . . . . . . . . . . . . . . 432

. . . . . . . . . . . . . . . . . . . . . 432

G. ÉLÉMENTS SUCCINCTS SURLETRAITEMENTDU SIGNAL

1. Puissance et énergie d’un signal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2. La corrélation et ses propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3. Applications de la corrélation., . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4. La convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 . Notions sur le filtrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6. Notion de bruit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Éléments de bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

433

.......... 433

... . . . . . . . 435

.. . . . . . . . . 437

.. . . . . . . . . 439

.. . . . . . . . . 440

.. . . . . . . . . 441

. . . . . . . . . . 442

H. PROBLÈMESETEXERCICES 443

1. Généralités sur le calcul numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

2. Algorithmes accélérateurs de la convergence des suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446

3. Les développements asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447

4. Résolution des équations numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4475. Éléments de calcul matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4536 . L’interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461

7. Intégration des équations différentielles dans le champ réel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462

8. Intégration des équations aux dérivées partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465

9. Les transformées de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467

10. Introduction aux méthodes de Monte-Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 470

11. Éléments de calcul des probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47112. Lois (Binomiale, Poisson, Gauss-Laplace) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47213. La fonction caractéristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48014. La loi du x2 et la loi de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48115. Systèmes à plusieurs variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485

16. Critères de conformité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48517. Étude des dépendances dans le cas linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48718. Analyse de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49119. Les fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49420. Éléments de traitement du signal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495

15

Page 14: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1 . CORRIGÉS DES PROBLÈMES ET EXERCICES 4 9 7

1. Généralités sur le calcul numérique. . . . . . . . . . . . . . . . . . . . . . . . . . .2. Algorithmes accélérateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3. Les développements asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . .4. Résolution des équations numériques . . . . . . . . . . . . . . . . . . . . . . . . .5. Éléments de calcul matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6 . Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7. Intégration des équations différentielles dans le champ réel8. Intégration des équations aux dérivées partielles . . . . . . . . . . . .9. Les transformées de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10. Introduction aux méthodes de Monte-Carlo . . . . . . . . . . . . . . . . .11. Éléments de calcul des probabilités. . . . . . . . . . . . . . . . . . . . . . . . . . .12. Lois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13. La fonction caractéristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14. La loi du x2 et la loi de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15. Systèmes à plusieurs variables aléatoires . . . . . . . . . . . . . . . . . . . . .1 6 . Critères de conformité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17. Étude des dépendances dans le cas linéaire . . . . . . . . . . . . . . . . . .18. Analyse de régression-corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19. Les fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20. Éléments de traitement du signal . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . 497

. . . . . . . . . . . . . . . . . . . . . . 504

. . . . . . . . . . . . . . . . . . . . . . 504

. . . . . . . . . . . . . . . . . . . . . . 505

. . . . . . . . . . . . . . . . . . . . . . 513

. . . . . . . . . . . . . . . . . . . . . . 523

. . . . . . . . . . . . . . . . . . . . . . 523

. . . . . . . . . . . . . . . . . . . . . . 530

. . . . . . . . . . . . . . . . . . . . . . 530

. . . . . . . . . . . . . . . . . . . . . . 532

. . . . . . . . . . . . . . . . . . . . . . 532. . . . . . . . . . . . . . . . . . . . . . 534. . . . . . . . . . . . . . . . . . . . . . 543. . . . . . . . . . . . . . . . . . . . . . 545. . . . . . . . . . . . . . . . . . . . . . 550. . . . . . . . . . . . . . . . . . . . . . 551. . . . . . . . . . . . . . . . . . . . . . 553. . . . . . . . . . . . . . . . . . . . . . 560. . . . . . . . . . . . . . . . . . . . . . 563. . . . . . . . . . . . . . . . . . . . . . 564

INDEX 567

1 6

Page 15: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Le calcul numérique est une branche des mathématiques appliquées qui étudie les méthodespratiques destinées à fournir des solutions numériques aux problèmes formalisés dans le langagedes mathématiques pures. La plupart du temps, ce sont les ingénieurs et les chercheurs qui setrouvent concernés par l’usage de ces méthodes pratiques, car ce sont en définitive les nombresqui vont retenir leur attention. Face à un jeu d’équations plus ou moins complexes, ils devrontobtenir un ensemble de valeurs numériques qui pourra servir par exemple soit à la réalisation d’unédifice ou d’un prototype, soit à la confrontation des résultats expérimentaux et théoriques etc.

1. La notion d’algorithme en calcul numérique

Un algorithme est un procédé de calcul qui ne met en œuvre que des opérations arithmétiques etlogiques. L’étymologie de ce mot est arabe et c’est une altération du nom du mathématicien Al-Khwârizmi (t812?), probablement sous l’influence du mot grec (repris par les latins) 0 ccptOl.&le nombre.

Quoi qu’il en soit, c’est une dénomination commode qui sert à désigner l’ensemble desopérations qui interviennent au cours d’une démonstration conduisant à l’énoncé d’un théorème.Cependant sa portée ne dépasse pas celle de la « prose que chacun fait sans le savoir », et en aucuncas cette définition ne permet de donner une manière de construction des algorithmes. Il s’agitdonc d’un concept commode mais peu fécond qui sert à désigner un certain type d’organisationde propositions à caractère mathématique. Sans que rien ne soit changé, il est tout à fait possiblede remplacer ce mot par procédé de calcul, technique de calcul, procédure...

Pour illustrer ce concept, on peut évoquer, par exemple, la technique de résolution deséquations du deuxième degré à coefficients réels à condition toutefois d’admettre que l’ondispose outre les quatre opérations fondamentales (addition, soustraction, multiplication etdivision) de l’opération racine carrée. L’examen des mathématiques montre que le nombred’opérations proposées dans un algorithme peut être infini (mais dénombrable), c’est le casdes développements en série de fonctions : série entière, série de Fourier, etc.

Le concept d’algorithme en calcul numérique est quelque peu plus restrictif : le nombred’opérations élémentaires arithmétiques et logiques est obligatoirement fini. En outre, celaimplique que l’on ne peut manipuler que des nombres admettant une représentation finie cequi conduit à effectuer des troncatures et des arrondis au cours des opérations successives. Cetteremarque en apparence triviale doit pourtant être présente à l’esprit lorsque l’on fait usage d’unemachine arithmétique (mais aussi du calcul manuel...) : la première division venue, la première

17

Page 16: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

racine carrée venue ont toutes les chances d’introduire un nombre dont la représentation imposeune infinité de chiffres significatifs, il faudra les tronquer...

La connaissance de la manière dont les nombres sont représentés dans la machine utiliséeest fondamentale en ce sens qu’elle permet l’estimation de la précision attachée aux résultatsd’un calcul. Dès lors, on comprend tres bien que la recherche d’une grande précision imposeraune grande taille de mots-machine et par conséquent un grand temps de calcul. En revanche,une faible précision n’imposera qu’une petite taille du mot-machine ainsi qu’un faible temps decalcul. Le choix retenu est en général un compromis entre ces deux situations extrêmes.

Cette dernière étape intervient lors de l’évaluation de l’incertitude qui entache les résultatsd’un calcul, mais ce n’est pas la seule source. Le problème général de l’évaluation des incertitudeset erreurs est délicat qui plus est lorsque l’on fait usage d’une machine; nous l’aborderons unpeu plus en détail dans quelques paragraphes.

2. Le calcul numérique ne concerne que les nombres entiers

Ce n’est pas une boutade, et il faut bien admettre que l’on ne peut manipuler (au sensétymologique) que des représentations finies. La représentation dite en virgule flottante éclairece point de vue car en fait elle traite de nombres ayant une certaine quantité fixe de chiffressignificatifs (agrémenté d’un facteur de cadrage appelé exposant) et dans la réalité, à chaqueopération élémentaire sur les nombres il y a une opération de cadrage suivie d’une opérationarithmétique sur les nombres entiers, elle-même suivie éventuellement d’une opération detroncature ou d’arrondi.

Cette conception n’est pas tellement restrictive en soi, car les seules opérations arithmétiquespratiques que 1’Homme est susceptible de réaliser ne peuvent que concerner les nombresadmettant une représentation finie de symboles (chiffres significatifs) donc en fait des entiers.Pour ce qui concerne les machines arithmétiques, les deux représentations, entière et flottante, nedoivent pas masquer la réalité et il faut voir là uniquement deux représentations commodes. Enfin de chapitre, on trouvera un paragraphe traitant de quelques représentations assez générales.

3. Le calcul numérique traite du problème pratiquede l’approximation de fonctions explicites ou implicites

Un problème d’analyse se trouvant modélisé dans le langage des mathématiques pures, lapremière préoccupation consiste à rechercher la solution sous forme littérale à l’aide des fonctionsconnues qui sont les polynômes et les fonctions transcendantes élémentaires. On peut se poserla question de savoir si cette façon de concevoir est toujours possible.

Tous les problèmes ne sont pas algorithmiquement solubles, et force est de répondre non à laquestion posée. Pour s’en convaincre, il suffit de considérer un exemple, sous l’angle de l’histoire,qui illustre cette difficulté : la recherche des racines d’un polynôme de degré quelconque àcoefficients réels.

Si l’équation du deuxième degré est connue depuis l’ilntiquité, on peut dire qu’il revient àAl-Khwârizmi (fin VIII~, début IX~) et à Luca Pacioli (1445?-1514?) le fait d’avoir raffiné lessolutions.

L’école italienne de Bologne s’attaque à l’équation du troisième degré; on retiendra à sonpropos les noms de Tartaglia (1500?-1557), de Cardan (1501-1576) qui parvinrent à la solutionau travers de défis et de provocations qui semblaient être coutumiers à cette époque. Signalonstoutefois que les bases de l’étude sont dues à Del Fero (1465??1526).

1 8

Page 17: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉRALITÉ~ PUR LE CALCUL NUMÉRIQUE

Ensuite l’équation du quatrième degré fut abordée et résolue par Ferrari (152221565) qui futun élève de Cardan. Plus tard, les mathématiciens s’intéressèrent tout naturellement à l’équationdu cinquième degré et les recherches furent très riches d’enseignements dans la mesure où, selontoute vraisemblance pour la première fois dans l’histoire des sciences, le travail conduisit àl’énoncé d’un résultat négatif.

1. En 1608, Rothe (??1617) émit une proposition selon laquelle toute équation algébriquede degré n possédait n racines réelles ou complexes, et Gauss (177771855) en effectua ladémonstration rigoureuse en 1799.

2. Cette même année Ruffini (176551822) affirma l’impossibilité formelle d’obtenir la résolutiondes équations algébriques de degré supérieur à quatre. Il fallut attendre la publication destravaux d’Abel (180221829) pour obtenir la démonstration définitive de la proposition deRuffini (1826).

Ce résumé de l’histoire des équations algébriques nous mène à deux types de remarques :

Remarque 1 : Le fait de poser un problème dont la solution existe n’est pas suffisant pourpermettre d’exhiber effectivement ladite solution selon des moyens donnés. On peut se rappelerà ce propos le problème de la trisection de l’angle qui n’est pas algorithmiquement soluble si lesmoyens de construction autorisés sont la règle et le compas.

Aujourd’hui, on sait que les problèmes que l’on peut se poser sont de trois types à savoir :

a. les problèmes algorithmiquement solubles, l’équation du deuxième degré par exemple;b. les problèmes algorithmiquement non solubles, par exemple la quadrature du cercle à l’aide

de la règle et du compas;c. les problèmes indécidables pour lesquels on ne peut rien démontrer. Du reste, dans une

axiomatique donnée, on sait qu’il existe des propositions vraies que l’on ne peut pasdémontrer, à condition de considérer toutefois que les axiomes de l’arithmétique ne sontpas contradictoires (cf. Gode1 (190661978)).

Remarque 2 : Ce n’est pas parce qu’un problème est algorithmiquement insoluble que l’onn’est pas en mesure de proposer une solution approchée ~ généralement avec une précisionfixée à l’avance ~ et c’est justement la raison d’être du calcul numérique que de fournir detelles solutions; par exemple, on verra comment calculer les racines d’un polynôme de degréquelconque à coefficients réels.

En terminant ce paragraphe, nous remarquerons que les problèmes de calcul numérique sontuniquement des problèmes d’approximation de fonctions au sens le plus large. Souvenons-nousd’une des premières équations différentielles que nous avons rencontrée en Physique, il s’agitde l’équation du pendule pesant assujetti à osciller dans un plan. On écrit traditionnellementl’équation à laquelle obéit son mouvement :

d’Q(t)dt2

+ w2 sin O(t) = 0,

où Q(t) est l’angle que le pendule fait avec la verticale à un instant donné, w étant une constantedépendant de la longueur du pendule et de l’accélération. Alors, on apprend que l’on ne peutpas obtenir la solution sous forme littérale (t, 00, Oo, w”) à l’aide des transcendances usuelles (0,et 190 sont les conditions initiales sur l’angle et la vitesse angulaire). Pourtant, le théorème deCauchy-Lipschitz nous permet d’affirmer l’existence et l’unicité d’une telle solution qui est desurcroît une fonction analytique.

La tradition veut également que l’on ne s’intéresse qu’au cas des petits angles pour lesquels onpeut écrire le développement de sin O(t) au premier ordre. Alors, dans ce cas particulier, on sait

1 9

Page 18: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

obtenir la solution sous forme littérale. Cependant, chacun sait que les pendules sont capricieux,et tous n’ont pas le bon goût de vouloir limiter l’amplitude de leurs oscillations. C’est le rôle ducalcul numérique que d’apporter une réponse à ces types de problèmes et l’on verra chaque foisde quelle manière.

4. Solutions littérales et solutions analytiques

À propos du pendule, nous avons dit que la solution e(t, 00, w2) ne pouvait être exprimée sousforme littérale c’est-à-dire que l’on ne pouvait pas donner une expression formelle en fonctiondes transcendances usuelles et des polynômes. Cela ne signifie nullement que la solution n’est pasune fonction analytique. À ce sujet, rappelons qu’une fonction est dite analytique lorsqu’elle estdéveloppable en série entière, que la fonction soit réelle ou complexe, que les arguments soientréels ou complexes. D’ailleurs, sans préjuger de la suite, on peut ajouter que le calcul numériquefait amplement appel aux développements en série dans de nombreuses méthodes, et d’unefaçon tout à fait générale, on peut affirmer que toutes les solutions numériques sont des valeursnumériques de fonctions analytiques. En résumé, pour éviter tout abus et toute ambiguïté, ilconvient de distinguer l’expression formelle d’une fonction avec son expression analytique.

5. Que sait-on calculer rigoureusement?

Comme nous ne pouvons traiter que de nombres admettant une représentation finie de chiffressignificatifs, seules l’addition, la soustraction et la multiplication donneront des résultatsrigoureux lors de l’exécution des différentes opérations (encore avons-nous fait abstraction desréels problèmes de la taille réservée pour représenter les nombres). La première division venuea statistiquement toutes les chances d’introduire un résultat comportant un nombre infini dechiffres significatifs.

Sur le plan du calcul des fonctions, seuls les polynômes (dont le degré est évidemment fini)sont susceptibles d’être calculés rigoureusement (ou avec une précision souhaitée à l’avancedans la mesure où le calcul peut faire intervenir la division). Là repose le grand intérêt desdéveloppements en série (de MacLaurin (1698-1746) et Taylor (168551731)) qui fournit uneexpression calculable sachant que l’on se fixe à l’avance une précision donnée et sachant que l’onpeut majorer convenablement l’expression du reste de la série. Au passage, il est bon de noterque l’on sait en général réaliser une opération formelle importante : la dérivation, indispensableau calcul des coefficients du développement en série.

Considérons une fonction f(x) régulière c’est-à-dire continue, dérivable autant de fois que l’onveut dans un domaine D contenant a et a + h, son développement en série de Taylor s’écrit :

f(a + h) = f(a) + f”(a)-h2+-+ f(“)(a)-+” -t R~+In.

où R~+I est l’expression du reste lorsque l’on tronque par nécessité le développement à l’ordre72. Ce reste s’écrit :

R f@+‘)(t) hTZ+ln+l = ( n + l ) !

où < est un nombre compris entre a et (a + h).Il est quasiment impossible de connaître 6 et, conformément à l’usage, on cherche un majorant

de GI dans l’intervalle (a, a + h). À ce propos, rappelons que si R,+l tend vers zéro quand

20

Page 19: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉR.~LITÉ~ suRLE ~AL~~LNuMÉRIQuE

n tend vers l’infini, pour une fonction pourvue d’une infinité de dérivées, le développement deTaylor devient une série entière appelée série de MacLaurin.

En définitive, nous ne savons calculer que peu de choses avec une extrême rigueur, mais lespolynômes en font partie, et cela leur confère un rôle particulièrement intéressant en calculnumérique. À bien y réfléchir, cela met en relief une autre facette du théorème d’approximationde Weierstrass (1815-1897) qui date de 1885 et sur lequel nous aurons le loisir d’insisterultérieurement à propos de l’interpolation (chapitre 6).

6. Les erreurs et les incertitudes

Un algorithme donné permet d’obtenir des résultats numériques qui, malheureusement, sontentachés d’erreurs dont les sources proviennent d’origines différentes.

Tout d’abord, il faut évoquer l’erreur au sens trivial du terme, c’est-à-dire la méprise; ellemérite quelques commentaires tout simplement parce qu’elle est polymorphe et qu’elle n’est pastoujours évidente à détecter. Cela peut aller de l’erreur de méthode ou d’algorithme à la simplefaute de copie ou de transcription. Que d’ennuis liés à la transmission de mauvaises données,alors que le programme est tout à fait convenable. C’est la raison pour laquelle, derrière touteinstruction de lecture, il est impératif de réécrire la donnée communiquée et c’est du reste unebonne façon de la voir figurer sur la feuille de résultats.

Ici, comme ailleurs, il n’y a pas de règles universelles qui permettent d’éviter la bévue;cependant, lors de la phase de mise au point, évitons les compilateurs tolérants, vérifions quenous retrouvons les résultats connus liés à certains types de problèmes, sollicitons le jugementéclairé d’un collègue.. .

Maintenant, dans l’hypothèse où l’algorithme retenu est adéquat, et que sa programmationapparaît sans faille (ce qui implique de surcroît que l’algorithme soit adapté aux donnéestraitées), on peut envisager l’étude des erreurs entachant les résultats numériques obtenus.

6.1. Erreurs à caractère mathématique

La différence entre la solution strictement mathématique et la solution approchée fournit unterme d’erreur : c’est le cas fréquemment rencontré lors de l’étude des séries infinies, des suitesinfinies, des produits infinis, etc. Dans tous les cas classiques, on arrive à connaître un majorantraisonnable des restes qui sont abandonnés.

6.2. Erreurs liées à l’exécution des calculs

Les données numériques confiées à une machine ont deux origines : ce sont des nombres d’originestrictement mathématique (calcul d’une intégrale par exemple) ou des données provenant demesures lesquelles sont déterminées dans un intervalle (autrement dit à une certaine précisionprès), c’est ce que le physicien dénomme incertitude. Quelle que soit leur origine, les donnéescomportent une erreur ou une incertitude, car même dans le premier cas, les opérations deconversion et d’arrondi introduisent statistiquement une erreur.

La machine traite ces données selon un certain algorithme et procède à chaque étapeélémentaire à une opération d’arrondi. L’arrondi est une opération qui consiste à ajouter àla mantisse du nombre la valeur 0,5 puis à tronquer le résultat, ce qui permet de diviser leserreurs machine par deux.

Après l’exécution de tous les calculs, on doit se demander inévitablement quelle est la précisiondu résultat final. Il s’agit de voir comment l’incertitude finale a été propagée au cours de toutes

2 1

Page 20: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

les opérations d’arrondi. Le problème n’est pas si simple que cela et dépend essentiellement dela manière dont l’algorithme propage les erreurs indépendamment des calculs effectués.

7. Un problème difficile : la propagation des erreurs en calcul automatiqueSi les calculs font intervenir des fonctions transcendantes usuelles que l’on trouve sur toutesles machines, il faut alors avoir recours au manuel du fabricant de logiciels pour connaîtrel’incertitude attachée à l’usage de telle ou telle fonction, incertitudes qui dépendent, en règlegénérale, de la taille de l’argument. Nous faisons allusion plus spécialement aux fonctionsdites fonctions de bibliothèque : sinus, cosinus, tangente, arc sinus, arc cosinus, arc tangente,exponentielle, logarithme, racine carrée (annexe E)... Toutefois les erreurs affectant les résultats(fournies par le fabricant) ne sont pas la majoration de l’erreur relative ou absolue mais plussimplement l’écart quadratique moyen ; cela fournit une valeur bien plus raisonnable de l’erreurqui serait sans cela toujours exagérément surestimées. Cette conception est tout à fait convenabledans la mesure où l’on peut supposer que les erreurs obéissent à la loi de Gauss-Laplace, maiscette hypothèse admet des limites qu’il convient de ne pas franchir et nous en verrons un exempleun peu plus loin.

En résumé, les calculs sont réalisés au moyen d’opérations introduisant des arrondis et defonctions de bibliothèque affectées d’une précision limitée. Que peut-on conclure quant à laprécision des résultats finals? Il n’est pas possible d’apporter une réponse à la question ainsiposée car les erreurs dépendent de la manière dont l’algorithme les propage et la limite supérieurede l’erreur finale n’est pas nécessairement un majorant de la somme de la borne supérieure dumodule des erreurs évaluées à chaque opération élémentaire. Pour s’en convaincre, il suffit deprocéder selon cette technique et l’on s’apercevra bien vite que cette façon de concevoir lesincertitudes se révèle très exagérée et très surestimée; en effet, il n’y a aucune chance pour quetoutes les opérations du calcul soient systématiquement l’objet d’une erreur maximum.

L’algorithme propage des erreurs, mais pour bien situer le problème disons que, de ce pointde vue, on rencontre deux types d’algorithmes : ceux qui font appel à des calculs cumulatifsreposant sur l’addition (au sens large) et les calculs itératifs reposant sur la répétition du calculavec chaque fois une nouvelle valeur donnée par le précédent tour.

7.1. Les calculs itératifs

Comme nous l’avons dit ce sont des calculs répétitifs que l’on limite nécessairement à un certainordre, et qui consistent à réintroduire dans le calcul la dernière valeur calculée. Le plus souvent,la procédure n’a d’intérêt que dans la mesure où la suite générée est convergente.

La limite obtenue ne dépend alors que de la précision de la machine utilisée (représentationdes nombres, fonctions de bibliothèque, . ..). Cependant, il convient d’ajouter qUe le cumul deserreurs au cours d’un tour de calcul interviendra au niveau de la vitesse de convergence duprocessus.

Exemple de calcul répétitif - Calcul de la racine carrée d’un nombre positif N.Désignons par ao une première approximation de fl et par eo l’erreur liée à cette estimation.

On a la relation :

~4 = a0 + eo.

Nous allons essayer d’obtenir une approximation de eo. Pour cela développons au premierordre l’expression :

N = (ao + e0)2.

22

Page 21: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉRALITÉSSUR LE CALCUL NUMÉRIQUE

On obtient :

N = ao(a0 + 2eh),

expression dans laquelle es est remplacée par eh qui en est une approximation. On déduit :

4 = (N/~O -a~)/%

soit encore :

a1 = a0 + eh = (N/u0 + ao)/2.

La somme ao + eh constitue une meilleure approximation que ao sous réserve toutefois quele développement soit convergent. Dans ce dernier cas, rien ne nous empêche de recommencerles calculs avec la dernière approximation évaluée ur (itération), et ceci jusqu’à ce que l’on aitobtenu le meilleur résultat que la précision de la machine puisse permettre d’obtenir. De toutefaçon, il faudra choisir un critère tel que le nombre d’itérations soit fini, encore faut-il que lasuite de nombres générée soit convergente.

Pour s’assurer de cette convergence, il faut et il suffit que :

Donc pour débuter les itérations on peut prendre uo = N par exemple. L’erreur sur le calculdépend de la limite de l’erreur mathématique ej qui ne tend pas vers zéro du point de vuenumérique. e0, admet une limite non nulle e, parce que nous avons affaire à des erreurs detroncature. Cela conditionne la précision de la valeur finale, mais cela peut avoir pour effet dedonner une suite (ak) qui, lorsque k est grand, fournit alternativement deux valeurs limites. Nousaurons l’occasion d’examiner plus en détail ce problème en étudiant les racines des équations.

Dans cette classe de problèmes où les erreurs ne sont pas cumulées dès le début de l’algorithme,on peut intégrer d’autres types d’algorithmes qui relèvent de la même analyse parmi lesquels onpeut citer la dichotomie (cf. chapitre 4).

7.2. Les calculs cumulatifs

Il s’agit de calculs dont le résultat dépend de tout l’ensemble des calculs intermédiaires. Lesexemples les plus immédiats concernent la somme d’une série numérique ou encore le calcul d’uneintégrale. Le résultat définitif dépend évidemment, toujours du point de vue de la précision, dunombre de termes calculés et du nombre de chiffres significatifs dont la machine dispose. À cetégard, une méfiance toute particulière doit être manifestée lorsque l’on traite des séries lentementconvergentes ou lentement divergentes, car il est possible d’obtenir à peu près n’importe quoi,l’erreur pouvant devenir quasiment infinie. L’exemple le plus connu qui illustre parfaitement cespropos repose sur la série harmonique qui est très lentement divergente.

Le calcul effectif de la série divergente ~~=rl/n donne toujours un résultat fini en faisantusage des machines usuelles, car la somme partielle S, obtenue par sommation des p premierstermes qui apportent effectivement une contribution à la somme est toujours très inférieure àla taille du plus grand nombre représentable dans lesdites machines. Pour fixer les idées, si laprécision relative fournie par la machine est 10- lr, le nombre p sera obtenu lorsque :

l/(p - l)/S, < 10-“.

Autrement dit le terme (p + 1) ne peut plus modifier la somme partielle déjà calculée, il ensera de même des termes suivants qui sont encore plus petits.

23

Page 22: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Si la série avait divergé plus rapidement, nous aurions pu être alerté par un dépassementde capacité qui aurait arrêté l’exécution des calculs c’est-à-dire qu’à partir d’un certain rang lasomme partielle aurait dépassé le plus grand nombre représentable en machine, malheureusementil n’en a rien été. Ces considérations sur les séries attirent deux autres remarques :

1. Un dépassement de capacité signalé ne signifie pas obligatoirement que l’algorithme utiliséest divergent, mais tout simplement qu’au cours du calcul la somme partielle s’est montréesupérieure au plus grand nombre représentable. Il est facile de donner un tel exemple enconsidérant le développement de exp(z) :

x2 x3exp(x) = z + 2 + 3 +. . . + 5 +. .

Utilisons ce développement toujours convergent (rayon de convergence infini) pour calculerexp(-1000). Nous savons que cette valeur est très petite, mais bien que le développementde exp(x) soit absolument convergent le calcul de la série alternée va poser des problèmesquasiment insurmontables. Grosso modo la somme partielle va croître jusqu’à ce que n!l’emporte sur xn, donc lorsque 1000” N n!. En passant aux logarithmes puis en faisantusage de la formule de Stirling log,(n!) = nlog,(n) - n, on aboutit au résultat suivant :

72 10g,(1000) = R log,(n) - n,

d’où

l o g , 12 =( )

1 .1000

On obtient n, en écrivant que n/l 000 = e (e est la base des logarithmes népériens). Soit n =2 718. Il n’est peut-être pas inutile d’insister sur la taille immense des nombres intermédiairesqui doivent être calculés (2 718! - 10s154) et qui dépasse de très loin la capacité des mots-mémoire les plus optimistes. Cet exemple montre à l’évidence que les fonctions de bibliothèquene sont certainement pas calculées au moyen de développements de ce type. Nous avonsconsacré les annexes C, D, E, à la technique de calcul des fonctions de bibliothèque.

2. Le calcul numérique n’exclut pas de ses méthodes l’usage de certaines séries divergentes(encore appelées séries semi-convergentes) : on verra des applications lors de l’étude des déve-loppements asymptotiques et lors de l’étude de l’epsilon-algorithme appliqué aux fonctionsadmettant un prolongement analytique (chapitre 2).

Revenons un instant sur les séries lentement convergentes; elles constituent un piège redou-table car rien ne permet de se défier du résultat si ce n’est justement un calcul d’erreur.Nous pensons plus particulièrement aux séries de Fourier (1768-1830) lorsque les coefficientsdécroissent comme l/n. Dans ce domaine, rien n’est simple car la majoration abusive des erreursconduit tout aussi inévitablement à pénaliser voire à rejeter des résultats qui pourraient êtreacceptables.

Un exemple de calcul d’erreur sur la somme d’une série convergente - Dans le simple butde supprimer les cadrages des nombres intermédiaires, et donc de raisonner plus facilement surles erreurs absolues, nous allons examiner en détail le calcul d’une série banale et connue dontla somme vaut l’unité, soit :

&‘+&+i+L+...+ 11 x 2 3 x 4 4 x 5 n x (n+l)

+...

24

Page 23: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉRALITÉS SUR LE CALCUL NUMÉRIQUE

C o m m e1 1

n(n + 1) - n~~

(ni 1)’on voit que la somme partielle limitée au me terme s’écrit :

STn=l- (m;l).

En effectuant un passage à la limite quand m devient infini, on en conclut que la limite dela série est égale à 1. Ce n’est pas l’examen mathématique de cette série qui va retenir notreattention, mais uniquement le calcul numérique effectif ainsi que l’erreur qui en résulte.

Quand on limite la somme aux m premiers termes, on peut majorer l’erreur de troncature decette série, c’est une erreur mathématique qui est majorée par le premier terme abandonné dela série convergente alternée :

e --.m- (mkl)

À présent supposons que les calculs soient réalisés sur une machine qui travaille avec desnombres représentés sur 5 octets. Chaque étape du calcul introduit une erreur de l’ordre de(cf. 09) :

f& = 10-9J32.

Comme il n’y a pas d’erreur sur les multiplications (pas de troncature), seules sont prisesen compte les erreurs sur les inversions et sur les additions : soient au total 2m opérationssusceptibles d’apporter une contribution à ce que nous appellerons l’erreur globale J!&. On peutmajorer Eg :

E, = 2me,.

Nous donnons ci-dessous un tableau (Tab. 1.1) où sont portés m, S,, l’erreur globale, l’erreur

statistique et 1 ~ S - & .

/ 1 - S - & 1 est un terme qui représente les erreurs cumulées au cours des opérations réaliséesen machine, ce terme est désigné par erreur réelle dans le tableau. Nous avons choisi de fairevarier m de 10 000 en 10 000 jusqu’à 50 000, puis de passer à la valeur 100 000.

Tableau 1.1.

m S err. globa. 108 err. stat. 106 err. réelle 106

10 000 0,999 900 0,931 0,475 0,32920 000 0,999 950 1,86 0,672 0,44030 000 0,999 967 2,79 0,822 0,25540 000 0,999 975 3,72 0,950 2,8850 000 0,999 980 4,66 1,06 2,30

100 000 0,999 991 9,31 1,502 77,0

Il est facile de constater que les erreurs globales Eg majorées a priori ne représentent pasdu tout la réalité, et pour m = 50000, Eg est environ 500 fois trop grand. On en conclut quecette manière de concevoir les erreurs n’apporte rien et surtout n’est pas réaliste. Il est bienpréférable de raisonner en termes de probabilité. Du reste, la probabilité pour que l’erreur soiteffectivement égale à Eg est pratiquement nulle.

25

Page 24: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

8. Réexamen des erreurs du point de vue statistique

Supposons que l’on utilise une machine qui travaille sur des mantisses de n chiffres significatifs.On va alors raisonner sur la valeur absolue de la mantisse considérée comme un nombre entier.

Faisons l’hypothèse que l’erreur de troncature puisse être considérée comme une variablealéatoire continue que l’on désigne par X à valeur sur (0,l).

8.1. Cas où la distribution des X peut être considérée comme rectangulaire

On peut aisément calculer les caractéristiques de la variable aléatoire X. On calcule d’abord lamoyenne :

s

1m = (X) = XdX = 0,5;

0

puis l’écart quadratique moyen 0’ :

o2 =s

I(X - m)2dX = 0,083 3,0

d’où l’on tire o = 0,288 7.À chaque opération, on peut associer à l’erreur une variable aléatoire X. S’il y a N opérations

dans la procédure globale et si l’on suppose que les erreurs sont indépendantes, l’erreur totalesera la variable aléatoire :

Y=&.3=1

D’après le théorème central limite, Y est une variable aléatoire gaussienne de moyenne m etd’écart quadratique moyen CT :

CT; = Na2

ce qui donne en définitive une mesure de l’erreur donnée par l’écart type :

cy = 0,288 74%.

fly constitue en général une bonne estimation de l’erreur et nous rappelons à ce sujet que laprobabilité pour que l’erreur soit inférieure en module à gy est 68%, à 2a, est 95% et à 3a, est99,7%.

En réalité la variable aléatoire X” prend ses valeurs sur l’intervalle (0, 0,5) puisque la machineeffectue non pas des troncatures mais des arrondis, ce qui divise chaque erreur élémentaire par2. Il s’ensuit que : m = (X) = 0,25, g2 = 1,042 10P2, soit CT = 0,102, et cy = 0,102fi.

8.2. Cas où X n’est plus à distribution rectangulaire

Reprenons l’exemple précédent et cherchons à calculer la somme de la série « à la précision de lamachine », c’est-à-dire que l’on va arrêter les calculs lorsque S,/(n + l)/(n + 2) sera plus grandque 10g932 si l’on dispose de 4 octets pour représenter la mantisse.

À partir d’un certain rang K < n, la division va introduire une erreur systématique qui vagarder le même sens très longtemps. La distribution ne sera plus du tout rectangulaire et lesestimations effectuées au moyen des erreurs gaussiennes deviennent caduques.

Grosso modo, la précision optimum est obtenue pour une valeur de n voisine de 100000que nous avons portée dans le tableau. On voit très bien que, pour ce type de problèmes, lesgrandeurs statistiques ne sont plus des estimateurs acceptables de l’erreur, cependant elles ledemeurent pour n allant jusqu’à 50 000 environ.

2 6

Page 25: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉRALITÉS SUR LE CALCUL NUMÉRIQUE

9. Sur la représentation des nombres en machine

9.1. Les nombres entiers

Pour les entiers positifs la représentation retemre est la représentation binaire pure et pour lesentiers négatifs la représentation binaire en complément à deux. Nous allons montrer de quellefaçon se réalisent ces représentations sur une machine travaillant sur des mots-mémoire de kbits (bit est la contraction de binary digit signifiant chiffre binaire).

Le nombre de configurations différentes susceptibles d’être obtenues est alors 2”, on peutdonc représenter 2” nombres entiers en binaire. La plupart du temps il est convenu d’utiliserle premier bit à gauche pour exprimer le signe du nombre et l’on adopte la valeur zéro pourdésigner un nombre positif et la valeur un pour désigner un nombre négatif.

En ce qui concerne les nombres négatifs, on préfère utiliser la représentation en complémentà deux qui permet alors d’effectuer l’addition des nombres et non la soustraction. Ajoutons quel’on gagne un chiffre dans la représentation car il n’y a qu’une seule configuration pour zéroalors qu’il y en aurait deux en signant les nombres négatifs : une pour les positifs et une pourles négatifs.

Si l’on se limite au point de vue opératoire, la représentation en complément à deux consisteà écrire le nombre en binaire pur, puis à changer le symbole zéro en symbole un et le symboleun en symbole zéro, et enfin à ajouter un. Ainsi, de cette façon, on représente les nombres surl’intervalle fini (-2”-l, +2’-l ~ 1).

Exemple - On suppose que le mot-mémoire a la taille d’un octet (8 bits), donc on peutreprésenter 256 configurations différentes, soit encore les nombres de -128 à +127.

On désire réaliser l’opération c = a + b avec a = 57 et b = -36. Les représentations binairessont les suivantes :

a 00111001 Ibl 00100100

b 11011100 C 100010101

report

On s’aperçoit alors, qu’à l’exécution, il y a un dépassement de la capacité du mot-mémoire.La plupart des compilateurs masquent ce dépassement de capacité (report) et l’on génère desnombres entiers modulo 2’. Cette propriété sera exploitée pour générer des nombres pseudo-aléatoires (cf. chapitre 19).

9.2. Les nombres décimaux ou flottants ou réels

La représentation entière ne permet pas une large dynamique et se trouve mal adaptée à lareprésentation des nombres de grande taille (grand module de l’exposant). Pour fixer les idées,considérons un nombre de l’ordre de 101”. Il faudrait des mots-mémoire constitués de 300 à 350bits pour le représenter en binaire pur ce qui est prohibitif dans la mesure où statistiquementpeu de nombres aussi grands sont utilisés, alors que toutes les opérations arithmétiques devrontporter sur tous les bits sans exception ; cela montre que la machine passerait le plus clair de sontemps à travailler pour rien... Tout bien considéré, même si la taille de la mémoire devait êtreconsidérable, le problème des très petits nombres fractionnaires resterait entièrement posé.

En définitive, il s’agit de trouver un compromis acceptable entre la précision de la repré-sentation et la taille du mot-machine, ce qui a une incidence directe sur le temps d’exécutiondes opérations et la taille de la mémoire centrale. Avant d’envisager la manière de stocker un

27

Page 26: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

nombre en machine, il nous faut parler des nombres normalisés qui permettent d’optimiser lareprésentation. Un nombre, quel qu’il soit, s’exprime soit dans le vocabulaire écrit courant, soitau moyen d’une représentation symbolique écrite dans une base donnée (à l’aide de chiffres) ;c’est évidemment la seconde option qui est utilisée pour représenter l’information codée. Cecipeut apparaître comme une évidence, il n’en est rien; pour s’en convaincre il suffit d’écriredeux nombres en chiffres romains et d’en effectuer la division. On s’aperçoit sans difficulté quel’écriture en chiffres romains n’est pas bien adaptée à la réalisation effective de cette opération.

Un nombre peut toujours être représenté dans une base B quelconque selon l’expression :

N = ” /lnBn avec {Bk} = (0, 1, 2,. . (B - 1)).n=TlLl

On remarque que mi et rn2 sont des nombres entiers finis dès qu’il s’agit de calculs effectifs(positifs, négatifs ou nuls). On peut encore écrire :

Cette dernière représentation est dite normalisée à condition toutefois d’avoir ,&, # 0.Comme la base n’a pas besoin d’être explicitement exprimée, on écrira N sous la forme :

N = (0, Pm-2 Pm2-1.. . Pm, ; m2 + l},

la suite ordonnée des & s’appelle la mantisse tandis que la puissance de la base s’appellel’exposant. Il s’agit donc d’une représentation semi-logarithmique particulière dans la mesureoù le premier chiffre significatif est différent de zéro. Sa raison d’être s’explique par la recherched’une représentation optimum qui permet d’occuper la place mémoire la plus petite. Pour cefaire, on stocke uniquement la mantisse et l’exposant ; la base est une donnée implicite qui n’estpas stockée avec le nombre mais qui est évidemment indispensable pour effectuer les calculs.

a - Une représentation des nombres flottants sur quatre octets - C’est une représentationqui a été fréquemment retenue par les constructeurs de grosses machines dans les années 60,aussi mérite-t-elle qu’on s’y attarde un peu. Le mot-machine est constitué de quatre octetsnumérotés de gauche à droite de 1 à 4, et la base implicite est 16.

Les chiffres utilisés sont donc les symboles hexadécimaux 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C,D, E, F; chacun de ces symboles peut être codé en binaire sur un demi-octet, car un chiffrehexadécimal se code sur quatre bits.

Par convention, la mantisse s’exprime sur les octets 2, 3 et 4, ce qui limite la représentation à6 chiffres hexadécimaux. Comme les nombres sont normalisés, le premier demiioctet de l’octet2 doit être différent de zéro.

L’octet 1 contient le signe du nombre dans le premier bit et l’exposant dans les sept bitssuivants. Comme précédemment le signe plus est codé par un 0 et le signe moins par un 1(premier bit).

Pour ce qui concerne l’exposant, on pourrait concevoir une représentation entière affectéed’un signe puisque les exposants peuvent être négatifs ou positifs. Ce n’est généralement pas lasolution retenue. Comme on peut représenter 128 configurations possibles sur les 7 bits affectésà l’exposant, la convention veut que les configurations comprises entre 0 et 64 soient attribuéesaux exposants négatifs (et l’exposant nul) et les configurations comprises entre 65 et 127 auxexposants positifs. En définitive, il suffit d’ajouter 64 à l’exposant avant de procéder au stockage.

28

Page 27: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1. GÉNÉRALITÉSSUR LE CALCUL NUMÉRIQUE

b - Précision de la représentation - La troncature du nombre porte sur la mantisse seule-ment. Dans le cas le plus défavorable on aura négligé une suite infinie de F en notationhexadécimale (ce serait une suite infinie de 9 en notation décimale, ou une suite infinie de1 en notation binaire). Toujours est-il que cette suite infinie, quelle que soit sa base, a pourlimite l’unité, et par conséquent, représente une erreur absolue de 1 unité sur le dernier chiffresignificatif de la mantisse du nombre stocké; autrement dit, on aura une erreur absolue de 1unité sur la mantisse considérée comme un nombre entier. Cette façon de concevoir n’est pastoujours la mieux adaptée au calcul des erreurs, aussi préfère-t-on raisonner en terme d’erreurrelative sur la représentation du nombre, qui se réduit à l’erreur relative sur la mantisse :

1e, =

mantisse

Ici encore le cas le plus défavorable se rencontre lorsque la mantisse est la plus petite possible.Puisque la représentation est hexadécimale et normalisée, la plus petite mantisse vaut 16”, ils’ensuit que l’erreur relative la plus défavorable vaut :

e, = 9,54 10e7,

soit environ 1OW.Compte tenu de la présence d’un digit supplémentaire utilisé en mémoire centrale lors de

l’exécution, on ne réalise pas des troncatures mais des arrondis ce qui a pour conséquence dediviser les erreurs par deux, soit :

e, = 0,5 10Vj.

Ce type de représentation permet d’obtenir une dynamique s’étendant de 10V78 à 10-75approximativement.

Il existe également une double précision qui occupe huit octets. Les quatre octets supplémen-taires sont uniquement affectés à la mantisse. La dynamique n’est pas affectée tandis que laprécision relative de la représentation est passée à 10-16 environ.

c - Représentation usuelle des nombres flottants dans les Basics - La plupart du tempsla représentation s’effectue sur 5 octets et la base implicite est 2. Cette conception conduit,comme on va le voir, à une précision plus grande mais aussi à une dynamique plus faible quecelle précédemment étudiée.

L’octet 1 est utilisé pour représenter l’exposant tandis que les 4 derniers octets servent austockage de la mantisse. Comme le nombre est normalisé en notation binaire, le premier bitde l’octet 2 est inévitablement 1. Cela constitue une information sans grand intérêt et certainsconstructeurs utilisent ce bit pour y stocker le signe du nombre, soit 0 si le nombre est positifet 1 si le nombre est négatif. Le premier octet permet de représenter 256 configurations qui sedécomposent de la façon suivante : les exposants négatifs ou nuls sont représentés de 0 à 127 etles exposants positifs de 128 à 255. La précision relative est majorée par :

e, = 1/231 = 4,710V10.

Le plus petit nombre représentable est de l’ordre de 10V3’, tandis que le plus grand est del’ordre de 1038.

29

Page 28: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

d - Représentation des entiers et des flottants dans certains langages utilisés avec lesmicro-ordinateurs - Selon les logiciels et les ordinateurs utilisés, la représentation entières’effectue sur 2, 4 voire 8 octets : en binaire pur pour les entiers positifs et en complémentà deux pour les entiers négatifs. Dans le cas de deux octets, on dispose de nombres compris dansl’intervalle (-32 768, +32 767).

Remarque : En général, en arithmétique entière, au cours des calculs les dépassements decapacité sont automatiquement masqués et les calculs sont effectués modulo 2m, avec m = 8k - 1où k est le nombre d’octets retenus pour la représentation. Cette propriété sera utilisée pourgénérer des nombres pseudo-aléatoires.

La représentation des nombres flottants s’effectue sur des doubles mots soit 4 octets. Lesystème est identique à celui utilisé pour les Basics à la différence près toutefois qu’on nedispose plus que de 3 octets au lieu de 4 pour écrire la mantisse. En conséquence de quoi ladynamique est évidemment la même, tandis que la précision se trouve un peu réduite, elle sesitue au voisinage de :

e, = 1/223 = 1,210F7.

e - La double précision - Par exemple, en C, dans les micro-ordinateurs usuels, la repré-sentation des nombres en double précision s’effectue sur 8 octets, soit 16 demi-octets. Les troispremiers demi-octets contiennent le bit de signe du nombre suivi de l’exposant, ce qui permet unedynamique de l’ordre de 10~so8 à 10308 La mantisse est représentée sur les treize demi-octets.restants. La plus petite mantisse est donc 8 x 1612 sur laquelle l’erreur d’arrondi est 0,5. Laprécision relative la plus défavorable est donc de l’ordre de 0,2 10p16.

10. Éléments de bibliographie

N. BAKHVALOV (1976) Méthodes Numériques, Éditions MIR.C. BERNARD~, B. METIVET et R. VERFURTH (1996) A review of a posteriori errer estimation

and adaptive mesh-refinement techniques, Wiley.H. BESTOUGEFF, GUILPIN Ch. et M. JACQUES (1975) La Technique Informatique, Tomes 1 et II,

Masson.B. DÉMIDOVITCH et L. MARON (1979) El. éments de Calcul Numérique, Éditions MIR.P. HENRICI (1964) Elements of Numerical Analysis, Wiley.F. HILDEBRAND (1956) Introduction to the numerical analysis, Mc Graw-Hill.D. Mc CRACKEN et W. DORN (1964) Numerical Methods and Fortran Programming, Wiley.E. NAGEL, J. NEWMAN, K. GODEL et J.-Y. GIRARD (1989) Le théorème de Godel, Seuil.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Dunod.H. RUTISHAUSER (1990) Lectures on numerical mathematics, Springer-Verlag.J. STOER et R. BULIRSCH (1993) Introduction to numerical analysis, Springer-Verlag.

3 0

Page 29: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 de la convergence des suites

Au cours de ce chapitre, nous allons présenter quelques algorithmes très puissants qui ont pourbut d’accélérer la vitesse de convergence des suites. Il s’agit de l’algorithme d’Aitken, du procédéd’extrapolation de Richardson et de l’epsilon-algorithme, ce dernier ayant vu le jour en 1956 àla suite des travaux de P. Wynn. Nous nous attacherons essentiellement à leur présentation età leur mise en ceuvre dans la mesure où nous ferons souvent appel à eux au cours des différentschapitres.

Sans entrer dans des considérations théoriques de haut niveau, il est possible de dire qued’une part l’epsilon-algorithme est une généralisation du procédé d’ilitken, et que d’autrepart il est relié aux approximants de Padé et aux fractions continues (cf. annexes C et D).Il n’est pas question d’effectuer ici les justifications théoriques relatives à ces algorithmes etnous limiterons nos ambitions à en apprendre le maniement. Cependant, le lecteur intéressé parles fondements des techniques d’accélération de convergence pourra avoir recours à l’excellentouvrage de C. Brézinski : Algorithmes d’accélération de la Convergence. Étude Numérique, auxÉditions Technip, Paris (1978). Dans cet ouvrage figurent d’autres procédures d’accélération dela convergence, de nombreux exemples d’applications et des programmes rédigés en Fortran. Pourtout ce qui a trait aux procédures d’accélération de la convergence, il est nécessaire d’insistersur le fait que les résultats proposés ne concernent que les nombres susceptibles de pouvoir êtreeffectivement calculés avec une précision suffisante.

1. L’algorithme A* d’Aitken (1895-1967)

Supposons que nous connaissions une suite numérique convergente So, Si, . . . , S,. Par exempleles Sk peuvent être constitués par les sommes partielles d’une série, ou encore par la suite desapproximations successives de la racine d’une équation f(x) = 0 obtenues par une méthodeitérative. À partir de cette suite de (n + 1) termes, nous allons construire une autre suite den termes et ainsi de suite. Nous définissons une procédure récurrente, et pour les besoins dela cause, nous allons numéroter des suites ainsi formées au moyen d’un exposant placé entreparenthèses. Ainsi, la suite initiale s’écrit :

s(O) cyx0 > 1 >“‘> S(O).n

3 1

Page 30: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUE

1.1. Présentation de la méthode

Considérons une suite numérique S,(O), S’$a), SP) . , S$” dont la convergence est lente. À partir

de la suite des S(o), on forme une nouvelle suite Sj” obtenue de la manière suivante :

s(l) = &pj2 -

$0)lct2 - s&] 2

ks(O) + s,, - 2sg1 .k

À partir de la dernière suite formée, celle des S(1), on obtient une autre suite au moyen dumême procédé. On note qu’à chaque construction d’une nouvelle suite, le nombre d’élémentsde la suite diminue de deux unités. L’application successive de ce processus nous conduit àl’obtention de la suite qui n’est plus constituée que d’un seul terme à condition toutefois que lenombre de termes de la suite initiale soit impair. Le terme général s’écrit alors :

s(“+l) - s(4)k - k+2- (2.1)

1.2. Un exemple numérique

On se propose d’appliquer cet algorithme à la suite des sommes partielles obtenue par lasommation de la série :

qui est bien connue pour sa convergence lente. En retenant les cinq premiers termes de la suiteon trouve S = 0,834 920. L’usage de l’algorithme d’Aitken, avec les mêmes nombres, permet detrouver S = 0,785 526. Autrement dit, l’erreur relative sur T passe de 6,3 10P2 à 5,l 10V4.

On trouvera sur le Web(*) un programme aitken0. c mettant en œuvre cet algorithme.

2. Le procédé d’extrapolation de Richardson (1881-1953)

On désigne toujours par S’(O) avec j = 0, 1,2. . TX, la suite initiale que l’on désire voir convergerplus rapidement, et par 2: une suite auxiliaire « choisie convenablement » Nous aborderons unpeu plus loin le problème du choix de la suite auxiliaire. La méthode de Richardson consiste àformer une suite de « vecteurs » au moyen de la relation suivante :

(2.2)

avec m, Ic = 0, 1,2,. . . n. La succession des opérations est symbolisée par le tableau 2.1, pageci-contre.

Dans la mesure où les x, sont indépendants des Sg’, il est aisé de s’apercevoir qu’il s’agitd’un algorithme en triangle et que S$+r) est une combinaison linéaire de SC;, et S, ,11 s’ensuit,<d .

alors, que le procédé de Richardson est une transformation linéaire de suites.

Remarque : Dans le cas particulier où l’on choisit comme suite auxiliaire la suite :

2 - &y1 - sp = a$‘,m -

*http://www.edpsciences.com/guilpin/

32

Page 31: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2. QUELQUESALGORITHMESACCÉLÉRATEURSDE LA CONVERGENCE DE~ SUITES

Tableau 2.1.

$0)0

$)

Sp

s(O)2

s(O)4

Sp

Sp

@

s(l)3

Sf ’

42)1

Sp

SO”’

Sj3)

on obtient alors un algorithme qui n’est plus en triangle et qui n’est plus linéaire. La relationgénérale est donnée par l’expression :

As(“)s’k’s(L+l) _ m m+l - ASE)tk+lSgJ

’m AS(“’ - ASEik+l (2.3)

2.1. Quelques éléments de théorie

Revenons à la suite initiale Si”’ qui converge vers S ainsi qu’à la suite auxiliaire 21, indépendante

des Sj”’ que l’on suppose d’une part strictement décroissante et d’autre part tendre vers zérolorsque n tend vers l’infini. Le procédé d’extrapolation de Richardson est fondé sur la formule deNeville-Aitken qui donne une façon de construire les polynômes d’interpolation pour une valeurparticulière de la variable (cJ chapitre 6 sur l’interpolation). En effet, Sj”’ est la valeur en zéro

du polynôme d’interpolation de degré Ic, lequel, aux abscisses xpr prend les valeurs SF’ p o u rp=j,j+l,...,j+ k.

À présent nous allons énoncer quelques théorèmes importants, mais dont nous ne donnonspas la démonstration.

a - Théorème / - Pour que S!“) tende vers S quel que soit j > N, il faut et il suffit que

sg’=s+g-

3

z-r aixi, quel que soit m > N.Autrement dit, les Sj’) peuvent s’exprimer sous la forme d’un rapport de deux déterminants,

ce qui constitue une autre expression de ce théorème :

s(O)3 . . . S!O)J+kxj . . xj+k

. . . . . . . . . . . . . . .

,$k) = x: ‘.. x:+k3 1 . . . 1

xj . . . xj+k. . . . . . . . . . . . . .

x3" . . xt+k

33

Page 32: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Théorème II - Si la suite X~C (formée de nombres réels positifs, décroissante et tendantvers zéro lorsque n tend vers l’infini) vérifie la relation :

pour tout n, alors la limite de la suite Sj”’ tend vers S quand k tend vers l’infini. La conditionénoncée est nécessaire et suffisante. Ce théorème nous donne des indications sur les choixpossibles de la suite des xj, Par exemple, il est raisonnable de retenir la suite x, = om etde l’assortir de la condition 0 < Q < 1.

c - Théorème III - Dans le cas où Sj(O) = @(xj) e t que a(x) est suffisamment dérivable, etque le module de la dérivée (k + 1)” demeure borné sur l’intervalle 1 (1 est le plus petit intervallecontenant le point zéro et toute la suite 2,) par un nombre M indépendant de ~ç, alors (k)S,

tend vers S quand 1 tend vers l’infini. Si de plus M est indépendant de k, alors S/“) tend versS lorsque k tend vers l’infini.

d - Théorème IV - (Ce théorème concerne l’accélération de la convergence.) Dans le cas oùles conditions du théorème II sont satisfaites, pour que la suite Si”:+‘) converge plus vite que la

suite S!“I il faut et il suffit que :3 ’

lim ~ quand m tend vers l’infini.

Cependant, force nous est de reconnaître que cette condition n’est pas aisément vérifiabledans les cas pratiques.

2.2. Généralisation du procédé de Richardson

On considère une fonction Q(x) définie, continue et strictement croissante sur l’intervalle (0, /3)avec /3 > 0. Alors, dans la relation (2.2), on peut remplacer zq par [a(~~) - Q(O)] sans que riende ce qui vient d’être établi ne soit modifié. On obtient alors la relation :

S!“+I) = P(%I - q(o)1 sj+1 - [fqZj+,+,) - Q(O)] sj”’ .3

'(xj) -*bj+k+l)

Le théorème 1 s’énonce alors de la façon suivante :

Théorème V - Pour que S!“)3 tende vers S quel que soit j > N, il faut et il suffit que :

sg = s-t &@Xj) - q(o)).i=l

Voici quelques choix possibles pour les fonctions *I(Z) :

(2.4)

@I(x) = xqQ(x) = cf

Q(x) = log,(l +x).

avec 4 2 1

avec a > 1

3 4

Page 33: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2. QUELQUES ALGORITHMES ACCÉLÉRATEURS DE LA CONVERGENCE DES SUITES

Remarque : Si *i(X) et *z(X) vérifient les conditions de la généralisation, alors les fonctions :

g1(2) = a191(2) + a2*2(5)

92(x) = @l(X) .@2(x)

vérifient aussi les conditions de la généralisation.

2.3. Relation entre le procédé A* d’Aitken et celui de Richardson

Revenons à l’expression (2.3) obtenue en remplaçant 2, par &S’~“‘. Elle vérifie les conditionsdes théorèmes précédents, et si l’on fait Ic = 0, nous obtenons :

s(O) $1s(1) = 3 3+2 - sec&,

.3 S!OI -3+2 2s!O)3+1 +

S!OI3

On reconnaît le procédé d’Aitken en réduisant au même dénorn~;$eur l’expression (2.3), et dureste on verra un peu plus loin que ce vecteur de composantes Sj est également la deuxièmecolonne du tableau de l’epsilon-algorithme.

Un exemple numérique - Nous allons appliquer l’algorithme de Richardson à la suite dessommes partielles de la série :

szl+;+$+;+$+...=g = 1,644 934 066 8. . .

Ici il nous faut en plus choisir une suite auxiliaire, et nous avons retenu arbitrairement lasuite classique 2, = 6 convergente et qu’il ne faut pas confondre avec la série harmonique quidiverge.

Nous avons effectué les calculs avec les 25 premières sommes, et voici les résultats trouvés :

S(25) = 1,605 723 403

S(Richardson) = 1,644941.

En comparant avec le résultat connu on voit que l’erreur relative sur la somme est de 5,0 10-‘.On trouvera sur le Web (*) un sous-programme richar0. c qui réalise cet algorithme.

3. Présentation de I’epsilon-algorithme scalaire

Il s’agit sans doute, dans l’état actuel des connaissances, du plus puissant algorithme permettantd’accélérer la convergence des suites. Comme précédemment on conserve les notations introduitesau cours de ce chapitre, à l’exception toutefois de la suite initiale qui prend le rang 1 au lieu durang zéro. Autrement dit, la suite initiale s’écrit : St).

Les termes de la deuxième suite s’expriment au moyen des relations suivantes :

$2) = s(O) + 1k k+l s(1)

k+l- s(1)

*http://www.edpsciences.com/guilpin/

35

Page 34: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

où k = 0, 1, . . , (n- 1), et avec comme convention S(o) = 0 quel que soit k. On forme la troisièmesuite au moyen de la relation :

s(3) = s(1) 1k rc+1+ s(2)

k+l

et d’une manière tout à fait générale, la pe suite sera donnée par :

SA’ = sp+;2) + 1$+;l) _ s(P-1)

k

où k = 0, 1, . . (n ~ p + 1). On poursuit les calculs jusqu’à ce que l’on n’obtienne plus qu’unseul terme qui est SP’. Il s’agit maintenant non plus d’un algorithme en triangle mais d’unalgorithme en losange. On se persuade facilement que les résultats intéressants figurent dans lessuites de rang impair, il faut donc choisir un nombre impair de données au départ, soit (n + 1)impair, pour que le terme SC’ soit une approximation de la limite de la suite Sa(l). Les suitesde rang pair ne constituent que des intermédiaires de calcul.

3.1. Exemples numériques

On désire calculer la somme de la série alternée déjà évoquée au cours du premier paragraphe :

sd+;-;+;- . ..= +J8539&2.

Sur le tableau 2.2, nous avons donné les suites successives S(Q) en limitant la suite initiale à5 termes :

Tableau 2.2.

s(1) s(2) s(3) 94) s(5)

1- 3

0,666 666 6 0,791666 6+5 - 1 1 5

0,866 666 6 0,783 333 3- 7 +329

0,723 809 5 0,786 309 5+9

0,834 920 6

0,785 585

L’erreur relative sur la valeur donnée par St) est 2,4 10P4

3.2. Calcul de la somme d’une série de Fourier

La fonction qui vaut -1 entre -T et 0 et +1 entre 0 et T admet le développement en série deFourier :

f(x) = ; (siy I siy I . . . + sin [;g);ll)~l + . .)

36

Page 35: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2. QUELQUESALGORITHMESACCÉLÉRATEURSDELA CONVERGENCEDES SUITES

Cette série sera étudiée chapitre 16 et elle servira d’introduction à l’étude du phénomène deGibbs. Du fait de la discontinuité de première espèce de la fonction, la série converge lentementet, qui plus est, nous sommes en présence du phénomène de Gibbs. En appliquant l’epsilon-algorithme à la suite des onze sommes partielles formées entre le terme d’ordre 40 et le termed’ordre 50 dont voici les valeurs :

SC’)

S;‘)

= 1 002 194 232 20

= 1’043 240 233 83

S@)

5’;‘)

= 1017439

1’052 942

936 43 S@) = 1 031279 464 80

5”‘) = 1’064 575 093 01 S”)

=

1’066 278

746 94 S”” = 1’060 110 382 5 3

S”’ S;‘) = =

49

= 1’061704 573 49

) 50

= 1’055 820 967 14 5’;‘)48 1’065 271752) 62

7

20184.

on obtient la valeur : S = 1,000689 pour la valeur 5 = 0,l.Conclusion : l’epsilon-algorithme fait disparaître le phénomène de Gibbs, c’est-à-dire les lentes

oscillations au voisinage de la discontinuité.

4. L’epsilon-algorithme vectoriel

Les suites S(Q) ne sont plus des grandeurs scalaires mais des grandeurs vectorielles. Il est doncnécessaire de préciser la technique de calcul des opérations proposées notamment en ce quiconcerne la grandeur :

l/ (SF& - SF’) .

La différence de deux vecteurs ne pose pas de problème, et il nous reste à définir l’inverse Vpl(= l/V) d’un vecteur V. Cette opération n’est pas définie habituellement, mais pour le cas quinous préoccupe, on admettra qu’elle est réalisée en multipliant numérateur et dénominateur parle vecteur V* dont les composantes sont les composantes complexes conjuguées du vecteur V.Ainsi nous avons :

v-1 = v* = u*.v. v* v2

Cette précision apportée, rien n’est modifié dans la conduite du calcul.Si la suite à traiter est formée de nombres complexes, rien ne nous empêche de considérer

un nombre complexe comme un vecteur à deux dimensions et d’appliquer l’epsilon-algorithmevectoriel.

Cet algorithme vectoriel trouvera son emploi chaque fois que le résultat d’un calcul itératif estdonné par un ensemble de valeurs (Uj) que l’on peut alors considérer comme les composantesd’un vecteur. Par exemple, nous étudierons la méthode de Picard qui permet d’obtenir paritérations un échantillon d’une certaine fonction solution d’une équation différentielle. Cetteméthode converge très lentement et il va de soi que nous pourrons l’accélérer au moyen del’epsilon-algorithme vectoriel.

5. L’epsilon-algorithme matriciel

Ici, il n’y a aucune difficulté à définir la différence de deux matrices carrées de même ordre etl’inverse d’une matrice, pourvu que cette dernière soit régulière. La technique de calcul se trouve

37

Page 36: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

inchangée. Il est bon de remarquer que l’epsilon-algorithme ne s’applique qu’à des matricescarrées ; il s’ensuit qu’une suite convergente de matrices rectangulaires ne peut pas être accéléréepar ce procédé puisque ces matrices ne possèdent pas d’inverse mais seulement deux pseudo-inverses qui ne peuvent pas faire l’affaire.

En revanche, sur le plan pratique, il est tout à fait possible d’appliquer l’epsilon-algorithme àune suite de matrices rectangulaires ou carrées pour en accélérer la convergence et cela en faisantusage de l’epsilon-algorithme vectoriel appliqué à chacun des vecteurs-lignes ou chacun desvecteurs-colonnes. Cette remarque prend toute sa signification lorsque la suite des matrices estconstituée de ce que l’on appelle des matrices mal conditionnées. Dans ce cas, il est extrêmementfréquent d’obtenir des erreurs de calcul très importantes qui se répercutent sur l’ensemble deséléments de la matrice notamment lors de l’opération d’inversion. Cet aspect négatif des chosesse trouve alors réduit par l’usage de l’epsilon-algorithme vectoriel.

L’epsilon-algorithme matriciel peut trouver une application lors des problèmes de résolution del’équation de Laplace (174991827) (ou de Poisson) par la méthode itérative de Gauss-Seidel dansle cas particulier où la représentation du maillage conduit à une matrice carrée. Toutefois, quelsque soient la géométrie et le maillage retenu pour intégrer l’équation de Laplace, dès lors quel’on utilise une méthode itérative, il est toujours possible d’utiliser ou bien l’epsilon-algorithmescalaire ou bien l’epsilon-algorithme vectoriel.

6. Remarques et propriétés de I’epsilon-algorithme

1. Nous venons de voir la forme scalaire de l’epsilon-algorithme, la forme vectorielle et laforme matricielle. Pour information, il existe aussi deux formes topologiques que nous nouscontentons de mentionner.

2. Lorsqu’on applique l’epsilon-algorithme à une suite, il n’est pas nécessaire de débuter lescalculs à partir du premier terme de la suite et l’on peut très bien prendre les termes de 4 en4 à partir du rang k pour former la suite initiale (cJ l’exemple concernant le phénomène deGibbs).

3. L’epsilon-algorithme ne peut donner que ce qu’il a, c’est-à-dire qu’il peut accélérer laconvergence à condition toutefois que la précision des termes retenus soit suffisante. Enaucun cas il ne peut fournir une précision supérieure à celle ui a servi à faire les calculsdes termes initiaux. Autrement dit, si le dernier élément S,” de la suite initiale a été4

obtenu à la « précision de la machine », c’est-à-dire que l’addition du terme suivant de lasérie laisse inchangée la valeur de SC’, il est inutile de vouloir appliquer l’epsilon-algorithmequand bien même bénéficierait-on d’un accroissement de précision pour réaliser cette dernièreopération. Par exemple, si nous avons obtenu SC’ en simple précision, l’application del’epsilon-algorithme en double précision n’apportera strictement rien. Il n’est pas possibled’extraire une information qui n’est pas contenue dans les données.

4. À l’occasion de l’étude des séries de Fourier, on rencontre un phénomène gênant qui semanifeste au voisinage des points de discontinuité de première espèce (lorsque la fonctiondéveloppée présente ces discontinuités) : c’est le phénomène de Gibbs (183991903). L’epsilon-algorithme supprime le phénomène de Gibbs qui se traduit normalement par des oscillationsde grande amplitude lesquelles s’amortissent très lentement avec le nombre de termes de lasérie de Fourier.

38

Page 37: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2. QUELQUESALGORITHMESACCÉLÉRATEURS DELA CONVERGENCEDESSUITES

5. Il est possible qu’à un moment donné la quantité(

S(p)k+l - SF)) soit nulle ce qui fait tomber

en défaut le mécanisme d’accélération de la convergence puisque l’inverse de cette grandeurproduit un dépassement de capacité en machine. Dans la plupart des cas cette difficulté serencontre lorsque les SF’ ont été calculés à un moment donné « à la précision de la machine »et il s’ensuit que l’on retiendra ce résultat. S’il n’en est pas ainsi, bien qu’il existe des règlesparticulières qui peuvent être utilisées, il est souvent préférable d’abandonner la procédure.En conséquence de quoi, il est recommandé d’effectuer un test sur les différences (Si,, - S(p))dans le programme et de procéder à l’arrêt des calculs lorsque l’une de ces différences est nulle.Au préalable, on aura pris soin d’enregistrer ou de faire imprimer les résultats partiels quidemeurent susceptibles d’être exploités.

Réalisations pratiques - Sur le Web (*), on trouvera deux programmes réalisant l’un l’epsilon-algorithme scalaire epsilon. h et l’autre l’epsilon-algorithme vectoriel evectr0. h.

L épsilon-algorithme dans les autres chapitres

1. Calcul des limites de suites, application au calcul numérique des intégrales.

2. Calcul des séries de Fourier, suppression du phénomène de Gibbs, calcul des dérivées ayantun développement divergent.

3. Résolution des équations f(z) = 0.

4. Accélération de la convergence des méthodes itératives utilisées lors de l’intégration deséquations différentielles.

5. Accélération de la convergence lors de la recherche des valeurs propres des matrices.

6. Accélération de la convergence lors de la résolution des systèmes linéaires et non linéaires.

7. Intégration des équations aux dérivées partielles de type elliptique.

8. Résolution des équations intégrales de Fredholm de deuxième espèce (série de Liouville-Neumann).

On trouvera sur le Web (*) des illustrations de ces différents problèmes : aitken2. c, epsil0. c,epsill. c, epsil2. c, epsi14. c, kacmarzi . c et newtono. c.

7. Propriétés remarquables du procédé A* d’Aitkenet de I’epsilon-algorithme

7.1. Le prolongement analytique

Si une fonction admet un développement en série de puissances convergent dans le disque D,on peut en général effectuer le prolongement analytique de cette série en dehors du disque deconvergence. Alors il est possible d’appliquer l’un des algorithmes à la suite des sommes partielles

*http://www.edpsciences.com/guilpin/

3 9

Page 38: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

même si celle-ci est divergente, c’est-à-dire hors du cercle de convergence. Considérons parexemple la série :

1~ = 1 - x + 52 - x3 + x4 + . . .1+x

Cette série a un rayon de convergence strictement plus petit que 1. Appliquons les algorithmesà la valeur x = 99. En limitant le nombre de termes à 5, on obtient les résultats suivants

5’; = 1,000 000 000 0 E + 00S; = -9,8000000000 E+ 01

S; = 9,7030000000 E+03S; = -9,605960000OE+05Si = 9,5099005000 E+07.

11 est évident que cette suite diverge; cependant l’application des algorithmes donne commelimites :

Aitken S = 1,000 000 536 4 E - 02

Epsilon-algorithme S = 1,000 000 000 0 E - 02

alors que le calcul direct de la fraction donne S = 10-‘.Sur le Web (*), on donne les programmes aitkenl . c et epsi13. c qui réalisent ces opérations.

7.2. Les développements asymptotiques

Il est une autre série divergente extrêmement intéressante qui concerne les développementsasymptotiques sur lesquels les algorithmes d’accélération de la convergence donnent de remar-quables résultats. Sur le plan théorique, il est aisé de rattacher ces développements auxprolongements analytiques, car on passe de l’un à l’autre par une inversion, c’est-à-dire enposant x = 1/x. Il n’est plus nécessaire de choisir z « grand » ni de limiter strictement la sommepartielle à calculer à un ordre bien précis N donné par le calcul des erreurs.

Voici quelques exemples de développements asymptotiques et les différents résultats obtenusau moyen des procédés d’accélération de la convergence.

f(x) = /t-l exp(z - t) dt avec CE > 0.

z

admet comme développement asymptotique l’expression (cJ chapitre 3) :

f(x) = b - g + g - $ + . . . + (-l)d& +. . .

*http://www.edpsciences.com/guilpin/

4 0

Page 39: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2. QUELQUES ALGORITHMES ACCÉLÉRATEURS DE LA CONVERGENCE DES SUITES

Pour z = 1, f(1) = 0,596 336, tandis que les quinze premières sommes partielles sont :

s; = 1,o

s: = 0,o

s; = 2,0

s3’ = - 4 , 0

si = 20,o

si = -100,o

SG’ = 62,0

S; = -442,O

SA = 3 590,o

Sg’ = -3,26980 E + 05Si, = 3,301820 E + 06Si, = -3,661498 E + 07S;, = 4,423 866 20 E + 08

S;, = -5,784634 18 E + 09>Si, = 8,139 365 702 E + 10.

Voici les résultats obtenus :

A’d’Aitken Epsilon-algorithme

0,596 347 0,596 572

7.3. La série de Liouville (1809-1882) - Neumann (1832-1925)

Considérons une équation intégrale de Fredholm (1866- 1927) de deuxième espèce :

1

x(t) - P J K(t, ~)X(S) ds = y(t),

0

que l’on écrira de façon plus concise :

x-pAx= y

où A est l’opérateur « intégrale » qui est évidemment linéaire.Sous réserve de convergence, la série de Liouville-Neumann donne la solution du problème :

x = y + pAy + p2A2y + p3A3y + . . . + pnA”y + .

On reconnaît la série géométrique dont la convergence sera assurée si

- > Ixkl,ii

où 1x1~ 1 est la plus grande valeur propre de A en module (cf. Jean Bass, Cours de mathématiques,Masson, 1968 et Lichnerowicz, Algèbre et Analyse linéaires, Masson, 1955).

Ici encore, l’application de l’epsilon-algorithme vectoriel à une suite divergente conduit aubon résultat.

4 1

Page 40: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Exemple

1U(z) = expz2 + 51 (cos(zr) + L&sin(rz)(y - 0,5)) U(y) dy.

0

On a retenu neuf vecteurs, c’est-à-dire les sommes partielles jusqu’à psA8y. Chacune des cesfonctions a été échantillonnée sur vingt et un points. Nous avons obtenu pour les éléments dudernier vecteur l’ordre de grandeur de 104 car la série de Liouville-Neumann est divergente.

La technique de résolution de l’équation de Fredholm est une méthode self-consistante quipermet d’obtenir aisément l’erreur. L’epsilon-algorithme donne une erreur inférieure à 10-12 ausens du sup.

On trouvera sur le Web (*) le programme f redholm. c qui réalise ce calcul.

8. Éléments de bibliographie

C. BRÉZINSKI (1978) Algorithmes d’Accélérution de la Convergence, Étude Numérique, ÉditionsTechnip, Paris.

J.P. DELAHAY (1988) Sequence transformations, Springer-Verlag.A. RALSTON et R.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Éditions Dunod.

42

Page 41: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Les développements asymptotiques, encore appelés séries semi-convergentes, constituent une fortbelle application numérique des séries divergentes. Le but est d’associer à une certaine fonctionf(z) un développement du type :

Sous certaines conditions que nous allons évoquer, le développement divergent, tronqué àun ordre convenable, permet de calculer numériquement la fonction f(z) avec une précisiond’autant plus grande que le module de l’argument est plus élevé. Par exemple, on rencontre enanalyse classique un tel développement quand on veut calculer la constante d’Euler (1707-1783)avec une grande économie de moyen (cj. annexe H, exercice l-4).

1. Un exemple de développement asymptotique

Considérons la fonction cosinus intégral :

Ci(x) = -.I

cas(t)t dt avec x > 0.

Intégrons successivement par parties, nous obtenons :

sin(x) COS(X) 2 sin(x)Ci(x) = - - ~ - ~

5 X2 X3

+ ~COS(Z)-+...X4

+ (2k + l)!smcos(t) &~t2”+2 ’

z

Soit encore :

Page 42: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Ce développement est divergent comme le montre le critère de d’Alembert. Pour la série ayantsin(z)/z en facteur, on obtient :

(2n+2)!22” ~ $y(2n)!L?+f2 X2

quel que soit x. On peut trouver n suffisamment grand pour que 4n2 > x2 ce qui montre lecaractère divergent de la série. On a le même résultat avec la seconde série ayant COS(~)/~comme coefficient, mais une seule série suffit... pour montrer la divergence. On aurait pu direaussi que le terme général de chacune des séries ne tend pas vers zéro quand n tend vers l’infini,ce qui suffit à assurer la divergence.

Désignons par Szk(x) la somme constituée des deux séries qui sont tronquées chacune àl’ordre k :

il est alors facile de calculer l’erreur liée à l’approximation :

E2kC5) = Ici(x) - S2k(X)I

que l’on peut écrire encore :

l.&(x) = (2k + l)!Oo cas(t)J~ d t 5 (2k+l)!

O3 dtJ ~t2”+2 t2k+2z z

On s’aperçoit que I&(z) est une fonction croissante en k et décroissante en x. Pour connaîtrel’ordre k du développement pour lequel l’erreur est minimum, il suffit d’écrire que :

E2k(~) = E2(k+l)(x) (ou encore = Ez(~-I)(x)).

On en déduit immédiatement, dans le cadre de notre exemple particulier, que :

(2k)!= (2k + 2)!x2k+l x2k+3

d’où l’on tire : x zz 2k + 1.Donc, pour x fixé, il suffit de calculer 2k termes de la série asymptotique en choisissant k

donné par l’expression :

lC=x - l- - - , s o i t kzz.

2

Considérons un exemple numérique en supposant que x = 10, on en déduit immédiatementque k = 5. On peut alors évaluer :

Elo(x) = $ = 0,36 10F4.

44

Page 43: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

3. LES DÉVELOPPEMENTS ASYMPTOTIQUES

Rappelons que cette erreur est liée strictement à la troncature des deux séries; lors del’exécution des calculs, il faudra ajouter les erreurs effectuées sur chacun des termes constituantles sommes.

Il suffit donc de calculer la somme des cinq premiers termes des deux séries pour connaîtreCi(l0) avec une précision supérieure à 0,36 10V4. La somme Szk(lO) donne : S2k(lO) =-0,454 81 10V2 et l’on peut donc voir que l’algorithme proposé permet d’obtenir les trois premierschiffres significatifs exacts. En définitive :

Ci(l0) = 4,548 10-2 310,003 6 10-2.

Pour la petite histoire, il semble que ce soit Stokes G.G. (181991903) qui ait pressenti lepremier l’intérêt d’une telle procédure, et c’est à Poincaré H. (185441912) que revient le mérited’avoir développé la théorie (1886), essentiellement dans le but de résoudre quelques équationsdifférentielles apparaissant en mécanique céleste et en mécanique analytique.

Ajoutons que ces développements servent principalement à approcher les fonctions dites« spéciales B pour des arguments dont le module est élevé ~ disons de plusieurs unités oudizaines d’unités.

Les travaux de Poincaré permettent d’apporter quelques précisions sur la notion de dévelop-pement asymptotique et ce sont ses propres idées que nous allons rappeler succinctement.

Définition

On dira que la série Sri(z) représente un développement asymptotique de la fonction f(z)au voisinage de l’infini si, sur un certain intervalle 1]a, oo[ auquel appartient z, les conditionssuivantes sont remplies :

En posant Rn(z) = X~(~(X) - &(z)), on doit avoir :

lim &(z) = 0 quel que soit 72 même lorsque2+03lim Rn(z) > 00 quel que soit II: fixé.

n+cL!

Il en résulte que l’on pourra toujours prendre 11: suffisamment grand de telle sorte que l’inégalitésuivante soit vérifiée :

où E est un infiniment petit positif fixé à l’avance.Pour utiliser au mieux le développement asymptotique, on choisit n de telle façon que l’erreur

commise sur l’approximation soit la plus petite possible.

2. Quelques propriétés utiles des développements asymptotiques

Unicité du développement asymptotique - Quand une fonction f(z) admet un développe-ment asymptotique, alors ce développement est unique.

L’affirmation inverse est fausse car deux fonctions différentes peuvent avoir le même dévelop-pement asymptotique. En effet, supposons que les deux fonctions diffèrent de exp(-crz) avecla partie réelle de hi positive, alors, les coefficients du développement asymptotique de cettequantité sont identiquement nuls.

45

Page 44: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Toutes les fonctions f(x) n’admettent pas nécessairement un développement asymptotique,cependant, il se peut qu’il existe une fonction Q(Z) telle que la fonction :

cc

admette un développement asymptotique c 2. Alors on peut écrire :j=o

f(x) = C#(x) 2 3j=o

Intégration d’un développement asymptotique - Supposons que la fonction f(x) admette undéveloppement asymptotique que nous écrirons :

ao + ?A + 5 + $ + . . + $ + .

X

avec ao # 0 ; alors on peut intégrer le développement sur l’intervalle x < t 5 CC pour les grandesvaleurs de 5. Nous obtenons donc :

On comprendra immédiatement la nécessité de retrancher les deux premiers termes quiconduiraient inévitablement à des divergences.

Différentiation d’un développement asymptotique - La différentiation des séries en généralest une opération délicate et il faut des conditions assez fortes sur les fonctions développées pourqu’il y ait égalité entre la dérivée de f(x) et la dérivée du développement asymptotique. Pourcommencer, il faut que f(x) admette une dérivée f’(x), de plus, il faut que f’(x) soit continueet admette un développement asymptotique ; alors l’opération de dérivation devient légitime.

Combinaison linéaire de développements asymptotiques - Si deux fonctions f(x) et g(x)admettent chacune un développement asymptotique que nous écrirons sous la forme :

f(x) = F $ e tn=O

g(x) = 2 f,n=O

alors la fonction Q(x) = Xf(x)+pg( )x , où X et p sont deux nombres, admet pour développementasymptotique :

Q(x) = 2 X”kx;fibk .k=O

Produit de deux développements asymptotiques - Si deux fonctions f(x) et g(x) admettentchacune un développement asymptotique alors la fonction Q(x) = f(x). g(x) a pour développe-ment asymptotique :

QI(x) = 2 $ 2 a&-k.n=O k=O

46

Page 45: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

3. LES DÉVELOPPEMENTS ASYMPTOTIQUES

Rapport de deux développements asymptotiques - Si deux fonctions f(x) et g(x) admettentchacune un développement asymptotique alors la fonction R(z) = f(x)/g(x) a pour développe-ment asymptotique :

à condition toutefois que be soit différent de zéro.

- Si une fonction f(x) admet un développement asymptotique et si une fonction @[j(x)]possède un développement en série entière convergent dans le cercle de rayon If] < p, alors ledéveloppement asymptotique de 0 s’obtient en portant le développement asymptotique de fdans le développement en série entière de 0 .

3. Développement asymptotique de quelques fonctions spéciales3.1. Sinus intégral

Si(x) = x !!$ &s0

3.2. Cosinus intégral

Ci(x) = - m!!!!$) &s23.3. Exponentielle intégrale

I (x) = m exp(x - t)s t

dt pour x > 0

z

I(x) = c<-l)n&. . . + (-l)n+l(n + l)! JO3 dz - t) dtp+2n=O 5

3.4. Les fonctions erf(x) et cerf(x)z

erf(x) = Ls

&O

exp( -t2) dt

cerf(x) = 1 - erf(x)

= exp(-x2)

(

1 . 3l-&+--

1.3.5

Xfi 22x4-+

23x6. . . + (-1)” l. 3;S122n-2

. . . (2n - 3) . . .

1

47

Page 46: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3.5. Les intégrales de Fresnel (1788-1827)

C(x) = z COS(&~/~) dt et S(X) = J sin(xt2/2) dtJ’0 0

3.6. Les fonctions de Bessel (1784-1846)

Le calcul numérique des fonctions de Bessel fait l’objet d’un chapitre à part (annexe F),cependant le calcul de ces fonctions pour les grandes valeurs de l’argument trouve sa placedans ce chapitre.

Les fonctions de Bessel de première et de seconde espèces notées respectivement Jn(z) etN,(z) sont solutions de l’équation différentielle :

Les développements asymptotiques sont donnés par les expressions :

A,(z) COS(U) - B,(z) sin(U))

A,(z) sin(U) - B,(z) COS(U))

dans lesquelles on a noté :

u=x++a,;,

An

= 1 _ (4n2 - 12)(4n22!(82)2

- 32) + (4n2 - 12)(4n2 - 32)(4n2 - 52)(4n2 - 72)-...

4!(82)4

B7L

= (4n2 - 12) _ (4n2 - 12)(4n2 - 32)(4n2 - 52)

1!(8x) 3!(82)3+...

48

L

Page 47: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

3. LES DÉVELOPPEMENTS ASYMPTOTIQUES

4. Éléments de bibliographie

A. ANGOT (1972) Complément de Mathématiques, Masson, Paris.K.W. BREITUNG (1994) Asymptotic approximations for probability integrals, Springer-Verlag.R.B. DINGLE (1973) Asymptotic expansions, Academic Press.F.W.J. OLVER (1974) Asymptotics and special functions, Academic Press.E.T. WHITTAKER et C.N. WATSON (1927) A course of modern analysis, Cambridge University

Press, 4e édition.R. WONG (1989) Asymptotic approximations of integrals, Academic Press.

49

Page 48: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Dans ce chapitre, nous étudions quelques méthodes de résolution des équations du type f(x) = 0suivi de quelques méthodes de résolution de systèmes non linéaires d’équations, puis nousterminons par l’étude d’une méthode spécifique concernant les équations algébriques. Nouslimitons notre étude aux fonctions réelles, mais, comme nous le verrons, bien des méthodespourront être étendues sans grande difficulté au cas de la variable complexe ; et dans la mesureoù les calculateurs utilisés permettent d’effectuer les calculs en complexes, il n’y aura que peude changements à apporter aux algorithmes et programmes proposés.

On a l’habitude de classer les équations f(x) = 0 en deux types qui sont les équationsalgébriques (polynômes) et les équations transcendantes c’est-à-dire celles qui ne sont pasréductibles à un polynôme. Toutes les méthodes qui s’appliquent à la résolution d’équationstranscendantes s’appliquent également aux équations algébriques et cela sans préjuger des ennuispossibles de calcul numérique. En revanche, pour ce qui concerne les polynômes, il existe quelquesméthodes spécifiques dont certaines sont très utiles à connaître, c’est la raison pour laquelle nousétudions d’abord les méthodes générales avant d’aborder les méthodes spécifiques.

1. Généralités sur la résolution des équations f(x) = 0

1.1. Localisation des racines des équations

Avant d’entreprendre le calcul à proprement parler d’une ou de plusieurs racines, il convientde localiser soigneusement ces racines pour ne pas avoir à rencontrer de surprises désagréables,telles que l’arrêt inopiné de la machine... Plusieurs possibilités s’offrent à nous pour localiser lesracines, en voici quelques-unes.

a. On peut avoir recours à certains théorèmes de mathématiques nous fournissant ces renseigne-ments. Ce sont par exemple les théorèmes généraux concernant les polynômes orthogonauxrelativement à une fonction poids W(X) donnée.

b. On peut, dans le même ordre d’idée, effectuer une étude particulière de la fonction f(x) eten effectuer la représentation graphique.

c. On peut aussi tabuler la fonction f(z) avec un pas variable pour tenter d’obtenir le maximumde renseignements.

d. Dans certains cas, on pourra essayer d’utiliser les suites de Sturm (1803-1855), mais il fautbien dire que l’intérêt de telles suites est essentiellement théorique, et l’utilisation devientdélicate même pour les polynômes à coefficients entiers (de quelques unités cependant) dont

51

Page 49: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

le degré ne dépasse pas la dizaine. Nous examinerons en détail cette méthode dans l’annexe A.La localisation préliminaire des racines peut être plus difficile qu’il n’y paraît en premièreanalyse notamment lorsque f(x) présente des extremums au voisinage de l’axe des 2 etcela sans préjuger qu’il y ait des racines ou non. Ces valeurs approchées des racines vontservir de point de départ à tout un ensemble de méthodes, le plus souvent itératives, quiconvenablement utilisées vont permettre d’obtenir des valeurs précises des racines.

1.2. La dichotomie

Étymologiquement ce mot d’origine grecque signifie action de couper en deux. Le principe de laméthode est le suivant : supposons que l’on sache qu’une racine ait été localisée dans l’intervalle(a, b) et que cette racine soit unique dans cet intervalle. Nous allons étudier le signe de f(x)dans (a, b). Pour cela nous comparons les signes de f(u) et de f (y). S’ils sont identiques celasignifie que la racine est comprise dans l’intervalle (9, b) ; s’ils sont différents cela veut direque la racine appartient à l’intervalle (a, y). 0 n recommence la procédure dans l’intervalle oùse situe la racine, mais on s’aperçoit que la taille de l’intervalle a été divisée par deux. On vapoursuivre ainsi jusqu’à ce que l’on obtienne la précision souhaitée. Il est facile de connaître lenombre de tours que doit comporter la procédure à partir du moment où l’on sait quelle est laprécision de la machine utilisée et que la racine a fait l’objet d’une localisation raisonaable.

Combien de fois devons-nous répéter la division de l’intervalle par deux ? - Désignons par x0la racine : f(xe) = 0, et par (a, b) l’intervalle sur lequel on exécute la dichotomie, ICO appartenantà (a, b).

Après n tours, la dichotomie définit l’intervalle minimum ~1 qui sera le dernier susceptible demodifier effectivement la valeur ~0, c’est-à-dire :

&1 =(&a) ;

0

n

soit en valeur relative :

L’inégalité (u) définit le nombre de tours à effectuer pour obtenir la précision optimum, soiten passant aux logarithmes :

0,301n - logiol l--f SP,

o,yol (p+logl~~~,).soit encore : 12 = -

Comme on a effectué une localisation de x0 telle quedisons 10 pour fixer les idées (ce qui résout lal’ordre de :

soit de l’ordre de quelques unités,cas réels rencontrés), n sera de

Si p vaut 9, on trouve alors 33 tours de calcul, si p vaut 15 on obtient 53 tours de calcul.

52

Page 50: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

Comme le montre l’expression donnant n, quand bien même la dynamique de l’intervalleserait multipliée par 10, cela ne ferait qu’ajouter une unité à p + 1, ce qui ne changerait pasgrand-chose, et, dans l’exemple précédent, on trouverait alors 36 et 56 tours.

Quoi qu’il en soit, la prudence la plus élémentaire exige toujours de reporter la prétendueracine dans l’équation et d’afficher le résultat... À ce sujet, encore une remarque : quel doit êtrel’ordre de grandeur de f(zo) ?

On s’attend à trouver zéro, mais en général il n’en sera rien. Cela dépend de la fonction f(x)dont le calcul est agrémenté d’une erreur congénitale liée d’une part aux approximations utiliséespar l’algorithme, d’autre part aux propagations des erreurs de troncature entre autres. Dans lescentre de calcul, il est possible de consulter une documentation fournie par le fabricant de logicielqui informe l’utilisateur sur ce type d’erreur. Pour des valeurs de l’argument appartenant à uncertain domaine, un écart type est fourni, car il s’agit dans ce cas d’une erreur statistique.

Comme f(~s) = 0 et f(Xc + Er) ? 0, un développement au premier ordre donne l’ordre degrandeur de f(zo + ~1) :

f(xo +a) = f(xo) +%f'(ZoL

d’où f(~,, + ~1) - f(~o) = ~rf’(~o) 2 10-P~of’(~o).

Cette technique est simple à mettre en œuvre car elle ne fait appel qu’au calcul de la fonctionelle-même, en outre elle offre l’avantage de conserver la suite des solutions approchées dans levoisinage retenu ce qui n’est pas le cas avec d’autres méthodes comme celle de Newton parexemple. Sur le Web (*) on trouvera le programme dichot . c réalisant la recherche de racine pardichotomie.

1.3. Méthode d’approximations successives ne faisantintervenir que la fonction

Le problème qui consiste à rechercher la racine d’une équation f(x) = 0 dans un certain domainepeut être modifié en ajoutant simplement z à chacun des deux membres, soit : f(x) + 2 = IC.Par goût de la simplicité, on peut poser f(x) + z = g(z) sans changer quoi que ce soit.

Nous allons décrire une méthode itérative qui ne fait apparaître que la seule fonction f(x) (oug(z)) à condition toutefois que la fonction f(x) obéisse à certaines règles de régularité telles quela continuité et la dérivabilité (dérivée première continue). À partir de la première approximation20 obtenue par un des procédés proposés précédemment, on forme la suite :

Xl =S(~OI

x2 =Ll(a)/,l . . . . . . . . . . . ./I Gl= LT(&-1)

> 1 Pour aue cette technique soit efficace, il est indispensable que la suite des X~C soit convergente.

i - -Dans l’hypothèse où f(x) est continue et où la suite des ~k converge, alors la limite de la suiteque nous désignerons par x* est racine de f(x) = 0. E n effet, quand k tend vers l’infini xket xk+r tendent vers x*. La continuité de f(x) entraîne celle de g(x) qui entraîne à son tour

*http://www.edpsciences.com/guilpin/

5 3

Page 51: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

que limk+oo xk+i = limg(xk) = x* = g(x*). Mam enant. t il nous faut examiner quelles sont lesconditions qui assurent la convergence des xk.

À la suite des xk associons la série des uk définie ainsi :

un = xn - G-1 avec uo = x0.

On peut d’ores et déjà remarquer que la convergence de la série un entraîne celle de la suite x,et que la suite x, et la série associée un. admettent la même limite x*. En effet si nous appelonsS, la somme des (p + 1) termes de la série, nous avons :

sp&u~=xp,k=O

ce qui démontre la dernière proposition.Développons le terme général Uk de la série :

uk = xk - xk-1 = g(xk-1) - g(xk-2)

Appliquons le théorème de Rolle à la dernière expression, cela donne :

uk = g(xk-1) - g(sk-2) = (xk-1 - xk-2)&)

avec [ compris dans l’intervalle (X&i - xk-2). En utilisant la relation de définition de la série,nous pouvons écrire :

uk = uk-d(t).

La règle de d’Alembert (1717-1783) va nous donner la condition de convergence de la série uk :

On en déduit que l’algorithme converge lorsque la condition lg’(t)l < 1 est vérifiée dans toutle domaine voisin de la racine dans lequel on effectue les itérations.

1.4. Généralisation de la méthode

Au cas où lg’(<)i > 1, la suite des itérations est divergente. Pour pallier cet inconvénient, aulieu d’ajouter x aux deux membres de l’équation f(x) = 0, il suffit d’ajouter mx et de choisirconvenablement m pour que la convergence soit assurée. Nous pouvons écrire : f(x) +mx = mx,puis l’on pose f(x) + mx = g(x) ; d’où la nouvelle suite des X~C :

xk = dxk-l)~.m

La condition de convergence de la suite des xk est :

, soit encore : - 1 < f'(x) + m < +1m

Il est toujours possible de choisir m positif ou négatif, de taille suffisante, pour assurer cettedouble inégalité à condition que la dérivée soit bornée et que f(x*) # f’(x*) si x* est une racine.

54

Page 52: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

a - Représentation géométrique de la méthode - On porte sur le même graphe les fonctionsy = mx et y = g(x) = f(x) + mx.

Cela va nous permettre de localiser non seulement la ou les racines mais aussi de connaître ladérivée au voisinage des racines donc éventuellement d’ajuster le coefficient m selon le cas quise présente. Sur le graphe de la figure 4.1, on peut suivre la suite des points générée à partir dela première approximation x0 :

x0 9(x0)x1= 9(x0) 9(x1)

x2 =g(x1) S(Q)

.Y

b - Précision sur la détermination de /a racine - On désigne par M la limite supérieure dela valeur absolue de la dérivée dans le domaine où l’on effectue les itérations. Nous pouvonsdonc écrire :

/un1 = M Iu,-11 avec M < 1.

Si nous arrêtons les itérations après n tours, nous aurons :

x,=~u,=s,,p=o

et l’on déduit que l’erreur e sur la racine x*, en adoptant x* comme approximation, est :

e = F UP.p=n+1

55

Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Page 53: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On en conclut que :

el C (up(=(u,j(K+K2+K3+...I.p=n+l

On reconnaît une progression géométrique de raison K et de premier terme K. Donc :

Comme en général on arrête les itérations lorsque deux valeurs consécutives sont égales à laprécision relative de la machine on peut alors écrire :

En pratique, on peut estimer K de la façon suivante :

K = dxn) - dxn-d .X?L - X,-l

Sur le Web (*), on trouvera le programme itera, c qui calcule les racines par cette méthodeitérative.

1.5. La méthode de Newton (1643-1727)

Nous avons déjà rencontré la méthode de Newton à propos du calcul de la racine carrée d’unnombre et il nous reste donc à généraliser cette technique à la recherche d’un zéro d’une fonctionquelconque f(x).

Supposons qu’un travail préliminaire nous ait permis de localiser une racine dans l’intervalle(a, b). On désigne par x0 la première approximation de cette racine. Comme x0 n’est qu’uneapproximation, la racine x* que l’on recherche s’exprime de la façon suivante : x* = x0 + ho.Nous allons chercher à calculer ho ou plus exactement une approximation de ho. Nous pouvonsécrire :

f(x*) = f(xo i- ho) = 0.

Linéarisons le problème, c’est-à-dire que nous développons la fonction f(x) au premier ordreau voisinage de x0. Nous obtenons :

f(xo -t ho) = 0 = f(xo) + hof’bo)

ce qui va permettre d’obtenir la valeur approchée de ho :

*http://www.edpsciences.com/guilpin/

56

Page 54: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

Cette valeur nous permet d’obtenir, sous certaines réserves, une meilleure approximation quenous écrivons :

f (x0)Icl = Iço - f’(xo)

Rien ne nous empêche, excepté toutefois l’absence éventuelle de convergence, d’itérer succes-sivement la procédure jusqu’à ce que l’on obtienne la racine x* avec la précision souhaitée. Onaura formé la suite :

.fcxk)xk+1 = Içk - f,(xk) ’

Dans la mesure où l’on dispose non seulement de la fonction mais aussi de sa dérivée on peutespérer obtenir une vitesse de convergence rapide du moins dans le cas où les racines sont simples.Au reste, l’interprétation géométrique est très parlante. Représentons la courbe y = f(x) sur undiagramme (cJ Fig. 4.2) ainsi que la première approximation x0. La linéarisation du problèmeconsiste à remplacer un arc de courbe de f(x) par un segment de droite qui est tangent à lacourbe dans le cas général. Traçons la tangente au point [x0, f(xo)]. Elle coupe l’axe des x aupoint x1 donné par l’expression :

f (x0)x1 = ILo - f’(xo)

Figure 4.2. Méthode de Newton. 0

La répétition du processus nous permet d’obtenir sans problème les points suivants qui sont%2,x3,...

a - Ennuis possibles avec la méthode de Newton - En l’absence de difficultés, la méthodede Newton assure une convergence très rapide de la suite de xk. Dans le cas de racines simples, laconvergence est même quadratique ce qui confère à cette technique un intérêt particulier quandon dispose déjà d’un chiffre significatif. Nous utiliserons cet algorithme pour réaliser une partiede la fonction de bibliothèque calculant la racine carrée, et nous verrons ultérieurement dansquelles conditions.

57

Michaël Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël Sévrain
Page 55: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Malheureusement des problèmes peuvent surgir qui sont liés à la nature de la fonction,de sa dérivée ainsi que du point 20 à partir duquel s’effectuent les itérations. En effet dansle domaine voisin de la racine où l’on travaille, la courbe peut présenter des changementsde concavité ou encore présenter des extremums. Si un point xk tombe au voisinage d’unextremum, alors f’(x) est proche de zéro, et la technique de Newton nous donnera un pointzk+i qui pourra être très loin de la solution recherchée. Pour peu qu’il y ait une racinedans le voisinage de zk+i, on aura toutes les chances de la calculer en croyant être dans unautre voisinage. Cela laisse la porte ouverte à quelques désastres possibles... Lorsque l’on setrouve dans un cas analogue, on doit obligatoirement le savoir avant d’entamer les calculspuisqu’on a pris les précautions d’usage. Pour éviter qu’au départ la suite générée présentedes instabilités ou des divergences locales, on combine la méthode de Newton avec celle desparties proportionnelles.

b - Estimation de la précision de la méthode de Newton - La plus grande sagesse veut quel’on reporte la valeur X~C que l’on estime être une approximation raisonnable de la racine dans lafonction f(x). On note : ek = f(xk). Si ek est de l’ordre de grandeur de l’incertitude introduitepar le calcul de f(xk), cela ne signifiera certainement pas que xk soit une racine, mais qu’il n’y apas de contradiction avec le fait qu’elle puisse en être une. En revanche, si ek est trop grand, il ya lieu de s’inquiéter et d’examiner de nouveau le problème. C’est une attitude identique à cellequ’on adopte lorsque l’on fait usage de la preuve par 9 ou par 11. Seul un résultat négatif donnela certitude d’une erreur, tandis qu’un résultat positif ne donne pas la certitude d’une exactitudemais seulement une probabilité plus ou moins élevée pour que se présente cette éventualité.

Deux cas peuvent se présenter : ou bien la suite générée est une suite encadrante, ou bienla suite générée est une suite monotone croissante ou monotone décroissante du moins à partird’un certain rang.l La suite est encadrante - Il faut bien avouer que c’est un cas d’école qui se présenterarement, car cela impose que la racine soit aussi un point d’inflexion. On retiendra les deuxdernières valeurs de xk et zk-1 car on sait que la racine se situe entre ces deux dernièresvaleurs entachées toutefois des inévitables erreurs d’arrondi et des erreurs dues à l’approximationdes fonctions de bibliothèque. Du fait de ces erreurs, il est fort possible que l’on trouve deuxlimites en machine. Bien entendu, l’estimation de l’incertitude est liée intimement à la différenceIX~ - xk-il sans oublier les erreurs entachant les calculs de f(xk-1) et f(xk). À partir de là, onretombe dans le calcul standard des erreurs.l La suite est monotone à partir d’un certain rang - À partir d’un certain rang r, tous leszq générés sont donc classés par ordre croissant ou décroissant. Il faut s’assurer que lorsque deuxvaleurs consécutives xk et xk+i sont égales à la précision de la machine, le reste des opérationsnégligées n’apporterait plus de contribution à la précision du calcul, autrement dit il faut que :

2 jxk+l - xki = 2

j=k+l j=k+l

soit négligeable.Comme il n’y a aucune raison particulière pour que la tangente soit verticale, la seule condition

de convergence est que f(zk) tende effectivement vers zéro quand k tend vers l’infini. C’est alorsque la précision de la machine utilisée intervient ainsi que la nature de la fonction f(x). Pourobtenir une estimation raisonnable de l’erreur, il faudra chaque fois faire une étude particulièredont il est possible de donner les grandes lignes : il est facile de donner à la valeur approchéex* de la racine une suite d’accroissements f dz, *2 dz, f3 dz.. , +A dz avec dz = lOFPz*

58

Page 56: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

où 10-P est la précision relative de la représentation en machine. Peu de valeurs suffisent. Ontabulera alors la fonction f(z) pour ces différentes valeurs et l’on notera l’intervalle dans lequels’effectue le changement de signe. Compte tenu de la précision de la représentation on pourraestimer un intervalle dans lequel se trouve effectivement la racine. C’est une évaluation directede l’erreur qui constitue un garde-fou contre les mauvaises surprises.

On trouvera sur le Web(*) 1 e programme newtonid. c qui calcule les racines par la méthodede Newton.

1.6. Méthode de Newton et des parties proportionnelles

En général, cette méthode est utilisée lorsque dans l’intervalle où l’on recherche la racine, peutse trouver un point d’inflexion ou un extremum. Donc, pour éviter que la valeur de la dérivéeapparaissant dans la méthode de Newton notamment durant les premiers tours d’itération, neprovoque des instabilités préjudiciables à la bonne conduite du calcul, on lui associe la méthodedes parties proportionnelles qui ramène les valeurs des approximations dans un domaine quel’on espère généralement plus raisonnable. Soit zo la première approximation et [zo, f(zo)] lepoint A sur la courbe y = f(z). 0 n effectue une deuxième approximation :

f (x0)x1 = x0 - f’(xo) .

à laquelle correspond le point B sur la courbe.La méthode des parties proportionnelles consiste à choisir comme approximation suivante le

point d’intersection de l’axe des x et de la droite joignant les points A et B. Désignons par 22l’abscisse de ce point, nous obtenons :

x2 = ~Of(Q) - Rf(~o)

f(Q) -.f(xo)

À nouveau on calcule le point x3 par la méthode de Newton puis le point x4 par la méthodedes parties proportionnelles et ainsi de suite (cf. Fig. 4.3, page suivante).

On trouvera sur le Web (*) le programme newtonpp. c qui calcule les racines au moyen de laméthode de Newton et des parties proportionnelles.

Remarque : Les ennuis de stabilité liés à l’usage de la méthode de Newton naissent essentielle-ment du choix de la première approximation qui parfois est trop éloignée de la racine que l’onrecherche ou encore quand une abscisse de la suite formée se situe trop près d’un extremum.Quand on tient un certain nombre de chiffres significatifs, il faut rappeler qu’en l’absence deracines multiples, la méthode converge quadratiquement et pratiquement seules les erreurs detroncature viennent altérer la précision du résultat.

2. Résolution d’un système non linéaire de deux équations à deuxinconnues

Nous nous proposons de résoudre un système non linéaire de deux équations à deux inconnuesque nous écrivons :

f(X> Y) = 0

dX,Y) = 0.

*http://www.edpsciences.com/guilpin/

59

Page 57: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Figure 4.3. Méthode de Newton

et des parties proportionnelles.

Comme chaque fois en pareil cas, il sera nécessaire de commencer l’étude par une représenta-tion graphique laquelle permettra de se faire une idée des éventuelles difficultés qui peuvent seprésenter, et de déterminer une première approximation (x0, yo). Le système étant non linéaire,nous allons commencer par le linéariser puis par effectuer des itérations sur le système linéarisé.Nous admettrons que les fonctions sont deux fois continûment différentiables dans un domaineD du plan (x, y) qui contient la racine recherchée et que le déterminant fonctionnel (ou encorele jacobien) :

w hl w- a!?J(X,Y) = zs - - -

ay a x

est différent de zéro pour la valeur de la racine.

2.1. La méthode de Newton

Nous généralisons sans difficulté la méthode étudiée lors de l’étude de l’équation f(x) = 0. Soitx0 et yo une première approximation. On note par dx et dy les écarts à la solution exactec’est-à-dire : x* = 1x70 + dxo et y* = y0 + dyo.

Le système s’écrit :

f(x*,y*) = 0 = f(x0 + dXo,Yo + dY0)

g(x*,Y*) = 0 = g(xo + dXo,Yo + dYo)*

Pour linéariser le problème il suffit d’effectuer un développement au premier ordre desfonctions f et g au voisinage de x0 et yo. Nous obtenons :

aff(Xo,Yo) + dxo-

afax + dyo- = 0.

aY

ail agg(x0, yo) + dxoz + dyo- = 0.

aY

6 0

Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Page 58: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

Il nous reste à résoudre le système linéaire de deux équations à deux inconnues pour obtenirdzc et dyc. On trouve alors :

golf%dxo = af dg

dYaf dg- -

dx ay dy dz

dvo =f&g

af &l af &l- -dz dy ay dz

expressions que l’on calcule au point (xc, y~).Bien entendu on obtient dans des conditions convenables une meilleure approximation :

x1 = x0 + dz0

YI = YO + dyo

à partir de laquelle il va être facile de réitérer la procédure. Ici encore la méthode convergeraquadratiquement en l’absence de racines multiples. Cependant il existe des méthodes à conver-gence simple qui font apparaître elles aussi les dérivées. Au premier examen on peut s’interrogersur l’intérêt présenté par de telles méthodes puisque, avec des moyens semblables, les méthodesquadratiques sont beaucoup plus performantes. Ceci n’est vrai qu’en apparence car dans certainscas les instabilités de calcul rendent inopérantes les méthodes quadratiques tant qu’un certaindegré de précision n’a pas été atteint. En revanche ces problèmes disparaissent avec les méthodesà convergence simple. Du reste, comme la vitesse de convergence est éventuellement une source depréoccupation, il est intéressant d’accélérer la convergence de la suite formée en se servant d’unalgorithme accélérateur de la convergence des suites : l’epsilon-algorithme par exemple. C’estpar ce procédé que nous calculons des diagrammes de phase théoriques lorsque les conditionsdeviennent délicates.

Le lecteur trouvera le programme newton2d. c sur le Web (*).

2.2. La méthode de Kacmarz (1937)

Nous allons présenter la méthode, d’abord élaborée pour les systèmes multilinéaires, sur unsystème linéaire de deux équations à deux inconnues à partir duquel on pourra effectuertoutes les généralisations souhaitables : soit la transposition au cas d’un système multilinéaire,soit la transposition au cas non linéaire que l’on traitera au moyen d’une procédure itératives’appliquant sur le système linéarisé.

Soit le système

six + biy + ci = 0 (droite 01)

a2x + b2y + ca = 0 (droite Dz) avec alb2 # a2bl.

Ce système admet une solution désignée par (x*, y*). Partant d’une première approximationA de coordonnées (1~0, yo), on projette ce point sur la droite Di, on obtient le point Al de

*http://www.edpsciences.com/guilpin/

61

Page 59: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉR~QUEAPPLIQUÉ

coordonnées (ICI, yr). Ensuite, on projette le point Al sur la droite Dz ce qui nous donnera lepoint AZ. On poursuit en projetant le point A2 sur la droite Dl et ainsi de suite jusqu’à ce quel’on obtienne la précision désirée. À présent écrivons les coordonnées de la suite des points ainsiformée. Nous avons :

alR1Xl = x0 - ~

a: + bl

hR1Y1 = Y0 - ~

a: + b’favec R1 = allco + blyo + cl.

Le point (21, yr) est projeté sur la droite Dz, à partir duquel on calcule le point (52, ya) :

ad%x2 = Xl - ~

aa + b$b&

Y2 = Y1 - ~aa + bg

avec R2 = a2x1 + b2yl + cg,

et ainsi de suite. Il est possible de montrer que cette méthode est toujours convergente maisqu’elle est seulement à convergence linéaire. L’intérêt de cette méthode repose avant tout sur lefait qu’elle est transposable aux équations non linéaires.

Application au cas des équations non linéaires - Le système des équations linéarisées quenous avons obtenu au paragraphe traitant de la méthode de Newton sera simplement résolu parla méthode de Kacmarz. Nous avions :

8.f a.ff(xo,~o) + dxo- + dya- = 0dX dY

%ldxo, YO) + dxog + dyo- = o.dY

Si l’on pose :

a1 = afdX

aga2 = -

dX

b =af1ac/

b2 zz -dY

RI = f(x>~)

R2 = dz, YY),

on obtient les suites des xk et des yk données par les expressions :

Yk = yk-1 - ~cif + bl

62

Page 60: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

expressions calculées au point (5k-1, Yk-r)

xk+l = xk ~ ~a2 + bz

bd&!/k+l = yk - ~

aa + bz

expressions calculées au point (xk, yk). La convergence n’est plus systématiquement assuréecomme dans le cas linéaire. Dans certains calculs, elle a retenu notre attention pour sa grandestabilité, et nous avons pu accélérer la vitesse de convergence au moyen de l’epsilon-algorithme.

Le lecteur trouvera sur le Web(*) 1 e programme kacmarz. c permettant l’usage de cetteprocédure.

3. Racines d’un polynôme

3.1. Méthode de Bairstow (1914)

Ici encore, nous allons limiter nos préoccupations à l’étude des polynômes à coefficients réelsque l’on notera de la façon suivante :

P,(x) = aOxn + alx n-l + a2xnp2 +. . + an-lx + a,

avec comme condition quasi évidente ao # 0. Nous savons qu’un polynôme de degré n admetn racines réelles ou complexes et nous allons étudier une méthode très élégante pour obtenirlesdites racines.

L’idée générale du calcul repose sur le schéma suivant : dans le cas où n est supérieur à deuxon peut diviser P,(x) par un trinôme T(z) de la forme :

T(x) = x2 + ux + u

ce qui nous permet d’obtenir une expression nouvelle de P,(x) à savoir :

P,(x) = T(x)Q,-2(x) + Ax + B

où Qn-z(x) est un polynôme de degré (n - 2) et (Ax + B) un monôme exprimant le reste de ladivision. Nous allons faire en sorte que A et B qui sont des fonctions implicites de u et ‘u soientnulles ; on réalisera cela en ajustant convenablement les valeurs de u et u apparaissant dans letrinôme. Lorsque nous y serons parvenus, le polynôme s’écrira sous la forme d’un produit strictd’un trinôme et d’un polynôme de degré (n ~ 2). Ainsi, les racines du trinôme seront égalementles racines du polynôme P,(x), et l’on sait qu’il n’y a pas de difficultés particulières à calculerles racines d’un trinôme.

Rien ne nous empêche de faire subir le même traitement au polynôme Q+2(2), et ainsi desuite jusqu’à ce que Q,(z) soit un polynôme de degré 1 ou 2. En définitive, tout le problèmerepose sur la détermination des paramètres u et v qui annulent simultanément A et B. Nousavons donc à résoudre un système non linéaire de deux équations à deux inconnues que nousécrivons :

A(~U) = 0

B(u,v) = 0

*http://www.edpsciences.com/guilpin/

6 3

Page 61: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

système que l’on résoudra par la méthode de Newton ou de Kacmarz, de toute façon au moyend’itérations. Si ue et vo constituent une première approximation, la méthode de Newton nouspermet de calculer les corrections du et dv qu’il convient d’apporter, soit :

&!!-A!Edu = a’ D “’

;I--BE!du = du D h,

dA d B 8A i3Bavec D = - - - - - .du du du du

les fonctions étant calculées au point (uo, 210).Nous serons effectivement capable de calculer du et dw dans la mesure où nous serons

capable d’exprimer A et B ainsi que leurs dérivées partielles et c’est sous cet aspect que nousallons envisager les calculs. Explicitons le polynôme &,-a(~) :

Qn-z(x) = box n-2 + b1C3 + . . + b,pz.

Par identification de P,(z) et de T(z)Qn-2(z) + Az + B on obtient les relations de récurrencesuivantes :

bo =a0bl = a1 - ubob2 = a2 - ubl - wbo

. . . . . . . . . . . . . . . . . . . . . . . .~;““‘~ aj - ubj-l- d-2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .b,-2 = an-2 - ub,-3 - ub,-gA = u,-~ - ub,-2 - vb,-3B = a, - vbnp2

À présent nous savons calculer A et B en fonction des coefficients du polynôme P,(s) et desparamètres u et U. Calculons maintenant les dérivées partielles de A et B par rapport à u et ‘ulesquels sont - rappelons-le - des paramètres indépendants. Pour ce faire, dérivons la formegénérale de la relation de récurrence par rapport à u :

et posons

i3bjcj-1 = -

dU

nous obtenons ainsi la relation de récurrence suivante :

cjpl = -b,pl - ucje2 - UC~-~.

64

L

Page 62: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

Nous explicitons à nouveau l’ensemble des relations :

CO = -boCl = -b1 - UC0c2 = 42 - UC1 - UC0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .en-3 = -bnp3 - UC,-~ - UC,-~dA- =

2

-bn-2 - ucn-3 - UC,-4

dU= -UC,-3

Recommençons le calcul en tout point semblable en dérivant la relation de récurrence initialepar rapport à v.

Posons

d.- =dbj3 2 dV

ce qui nous permet d’écrire la relation de récurrence :

dj+2 = -bj-2 - udjp3 - vdj+

qu’à nouveau nous explicitons complètement :

do = -bodl = -bl - udod2 = -b2 - udl - vdo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .dnp4 = -bn-4 - ud,p5 - vd,-cj8A- =

ii

-bnp3 - udn-4 - vd,-5

dV= -b,pz - ud,-q.

Remarquons immédiatement que les suites cj et dj sont identiques, il n’est donc pas nécessairede calculer la suite dj , et l’on obtiendra les dérivées partielles par rapport à ‘u à partir de la suitedes cj :

dA- = -bn-3 - ud,-4 - vd,-5 = ~-3au-=-b- -UC-.0 72 2 12 4

3.2. Conduite du calcul

Il nous faut donc calculer les fonctions A et B ainsi que leurs dérivées partielles. Connaissantune première approximation (uo, ~0) nous sommes donc en mesure de déterminer les termes

65

Page 63: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

correctifs du et dv à chaque tour d’itération (on utilisera les relations de Newton par exemple).Bien sûr nous recommençons le même calcul à partir des nouvelles valeurs :

161 = Uo + du

v1 = vo + du

et ainsi de suite. Nous avons défini une procédure itérative que nous arrêterons en machinelorsque du/u et dv/v seront inférieurs à la précision de la représent,ation en machine.

Regroupons la liste des opérations utiles (cf. Tab. 4.1.).

Tableau 4.1. Liste des opérations utiles.

bo = a0

h -~ a1 - ubo

b2 = a2 - ubl - vbo

. . . . . . . . . . . . . . .bj = aj -d-l -d-2

. . . . . . . . . . . . . . .b,-2 = an-2 - ub,-3 - vb,-b

A = u,-~ - ub,p2 - vb,-3

B = a, - ubnp2

CO =

Cl =

c2 =

. . . . . .

cj =

c,-3 =

dA--du8BduaA- -audB- -dV

-bo-bl - uco

-b2 - uq - vco. . . . .

-bj - UC~-~ - v+~

. . . . . . .-bne3 - UC,-~ - VC,+~

-bn-2 - UC,-~ - uc,_4

-UC,-3

G - 3

-b,-2 - UC,-4

Comment choisir les valeurs de départ ug et VO?Une bonne méthode pour débuter les itérations consiste à choisir les valeurs suivantes :

an-1 a,uo = ~ e t vo = ~ .G - 2 an-2

On calcule la suite des uk et des vk jusqu’à obtenir la précision souhaitée. Pour réaliser cesopérations il ne faut surtout pas utiliser de tableaux pour stocker les bk et les C~C, car nousn’avons besoin que des trois dernières valeurs calculées. Il suffira alors de réaliser des décalagessur seulement trois variables. Cette remarque permet de gagner un temps considérable en calcul ;ensuite quand on a obtenu l’annulation du reste Ax + B, on calcule la suite des bk dans le mêmetableau que celui qui a servi à stocker les valeurs des ak. Alors il est possible de pouvoir chercherdeux nouvelles racines grâce à la même procédure. Dans le but de simplifier l’usage des relationsde récurrence, on programme les relations générales données par bj et cl, et l’on démarre lescalculs avec :

b-1 = b-2 = 0 e t c-1 = ck-2 = 0.

6 6

Page 64: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

4. RÉSOLUTION DES ÉQUATIONS NUMÉRIQUES

Mise en œuvre de /a méthode - On trouvera sur le Web (*) les programmes bairstow. c etbairstow . h réalisant l’algorithme de Bairstow. Toutefois ces programmes appellent plusieursremarques :

1. Le programme peut être mis en défaut lorsque le polynôme présente des racines multiples etnotamment des racines doubles car le jeu des erreurs peut nous faire basculer vers des valeursnégatives du discriminant et peut nous donner l’illusion de deux racines complexes conjuguées.Cela mérite évidemment un examen attentif. En fait l’erreur absolue sur le discriminant estde l’ordre de 10p16 et par conséquent la partie imaginaire sera de l’ordre de 10-‘.

2. Hormis l’ennui précédemment cité, il n’y a pas lieu de procéder à une détermination localepréalable des racines qui peuvent du reste être complexes.

3. On pourrait mettre en œuvre une méthode qui utilise un binôme au lieu d’un trinôme, maisseules seraient calculées les racines réelles du polynôme à coefficients réels, ce qui ôte toutattrait à ce procédé. Cependant, dans le cas où les coefficients du polynôme sont complexes,la réécriture de la méthode de Bairstow appliquée à la division par un binôme donne uneexcellente manière d’opérer (voir les problèmes).

3.3. Racines d’un polynôme et valeurs propres d’une matrice

L’usage des mathématiques veut que la détermination des valeurs propres des matrices passepar l’intermédiaire de l’équation caractéristique dont on recherche ensuite les racines. L’équationcaractéristique est en fait un polynôme dont les zéros sont les valeurs propres de la matrice. Ainsi,quand nous aurons obtenu l’équation caractéristique, la méthode de Bairstow nous donnera lesvaleurs propres de la matrice.

Ce n’est pas la meilleure technique pour calculer les valeurs propres d’une matrice etl’on étudiera d’autres méthodes directes qui nous permettront de les obtenir. Cependant,réciproquement, si l’on sait associer une matrice carrée d’ordre n à un polynôme de degré nqui est le polynôme caractéristique de ladite matrice, on pourra utiliser les méthodes directesde calcul des valeurs propres pour obtenir les zéros des polynômes.

Pour simplifier le problème sans pour autant nuire à la généralité, on s’intéressera auxpolynômes à coefficient principal réduit que nous écrirons donc :

H,(z) = zn + Ulrc n-1 + a22n-2 + . . . + un-12 + a, = 0.

Il suffit alors d’associer la matrice suivante (une des formes canoniques de Frobenius (1849-1917)) :

’ 0 1 0 0 0 0 . . 00 0 1 0 0 0 . . 0

A = 0 0 0 1 0 0 . . 00 0 0 0 1 0 . . 00 0 0 0 0 0 . . 1

,-an -a,-1 -an-2 -G-3 -un-4 . -a1

La première surdiagonale de cette matrice est constituée de 1 et la dernière ligne est formée parles opposés des coefficients du polynômes caractéristique ordonnés selon les puissances crois-santes, partout ailleurs il y a des zéros. On montre que (-l)nIII,(~) est l’équation caractéristique

*http://www.edpsciences.com/guilpin/

67

Page 65: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

de cette matrice. Il est facile de former cette matrice puis de chercher ses valeurs propres parune méthode directe, on obtiendra alors les zéros de II,(x).

On donne sur le Web (*) froben. c un programme qui forme la matrice A à partir des

coefficients du polynôme. Ceci appelle une remarque importante. Si la matrice est mal condi-tionnée, nous aurons beaucoup de difficultés à calculer des valeurs propres correctes. Le lienentre l’équation caractéristique et la matrice associée montre également que les coefficients despolynômes peuvent aussi être mal conditionnés et dans ce cas les algorithmes peuvent donnerdes résultats aberrants.

*http://www.edpsciences.com/guilpin/

68

Page 66: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Ce chapitre est constitué de deux rubriques consacrées l’une à la résolution de systèmes linéaires,l’autre au calcul des valeurs propres des matrices carrées. Nous allons voir comment résoudre cepremier problème selon deux méthodes générales, puis nous examinerons une solution propre aux<< matrices » de Vandermonde rencontrée en interpolation. La résolution d’un système linéairenous conduira directement au calcul d’un déterminant et à l’inversion des matrices (carrées).Pour terminer, nous aborderons quelques méthodes de calcul des valeurs propres des matrices.Auparavant, nous traiterons des opérations élémentaires sur les matrices.

Si l’on se réfère au calcul d’un déterminant d’ordre n selon la méthode de Cramer (1704-1752),on voit que ce procédé exige environ n! opérations ce qui devient rapidement irréalisable du pointde vue pratique. Il nous faut utiliser des méthodes beaucoup plus économiques et celles que nousprésentons utilisent grossièrement n3 voire n4 opérations. Du reste le dénombrement exact estfacile à obtenir en modifiant très légèrement les programmes proposés : il suffit d’ajouter uncompteur d’opérations.

Tout au long de ce chapitre, on note par des lettres majuscules les matrices et les vecteurs, etpar des lettres minuscules (généralement indicées) les éléments des matrices et les composantesdes vecteurs.

1. Multiplication de deux matrices

Soient deux matrices A(n, m) et B(m, Z) expressions dans lesquelles le premier terme de laparenthèse représente le nombre de lignes et le second le nombre de colonnes. C(n, 1) le produitdes matrices A et B s’écrit :

avec

cjk = CLjibik.i=l

Le nombre d’opérations est environ 2m x n x Z. On trouvera le sous-programme multma. h

calculant le produit de deux matrices sur le Web (*).

*http://www.edpsciences.com/guilpin/

6 9

Page 67: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2. Résolution d’un système linéaire

On considère un système linéaire de n équations à n inconnues que l’on écrit sous une formematricielle :

AX=B.

Les coefficients de la matrice A (d’ordre n) sont notés selon l’habitude classique : ulk (dansl’ordre ligne colonne). X (de composantes zj) est le vecteur des inconnues et B (de composantesbj)le vecteur second membre. La notation du vecteur inconnu est sans intérêt dans la manièredont on résout le problème et seules les grandeurs que nous allons manipuler sont les alk etles bj.

2.1. Méthode des pivots

Nous allons traiter simultanément l’ensemble des données du problème et pour ce faire nousformons un tableau T(A, B) en juxtaposant les éléments de la matrice A et les composantes duvecteur B selon l’expression ci-dessous :

a11 a12 a13 . . ah ha21 a22 a23 . . azn b

T(A, B) = a31 a32 a33 . . mn b3a41 a42 a43 . . adn b4. . . . . . . . . . . . . . . . . . . . . . . . . . . .a,1 an2 an3 . ann bn

On voit que le tableau T(A, B) représente une forme multilinéaire avec les propriétéssuivantes :

a. La permutation de deux lignes ne change rien au tableau.b. La multiplication d’une ligne par un nombre ne change rien au tableau.c. L’addition terme à terme de deux lignes ne change rien au tableau,d. La combinaison linéaire de deux lignes du tableau ne change rien au tableau.

Quand le système linéaire est soluble et résolu, le tableau T(A, B) se présente sous la forme :

1 0 0 . .0 1 0 . .

0 &0 s2

T(I,S)

0 0 1 . . . 0 s3=0 0 0 . 0 s4

. . . . . .OY 0 . .

. . . . . . . .1. s,

où 1 est la matrice unité d’ordre n et S le vecteur solution.Comme T(A, B) = T(I, S), nous allons voir comment passer du tableau T(A, B) au tableau

T(I, S) par les opérations linéaires décrites en a, b, c et d au moyen de la méthode des pivots.Nous allons transformer le tableau T(A, B) de telle sorte que nous obtenions le vecteur colonne

(l,O, 0,. . . , 0). Pour y parvenir il faut d’abord diviser la première ligne du tableau par l’élémenta11 que l’on suppose différent de zéro. La première ligne s’écrit alors :

1 a:21ch13 . . 1

ah b;.

70

Page 68: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

Pour annuler les autres termes de la première colonne, il suffit d’opérer ainsi :les éléments de la première ligne multipliés par ~21 sont retranchés des éléments correspondants

de la deuxième ligne. Ensuite, d’une façon tout à fait générale, les éléments de la première lignemultipliés par ski sont soustraits des éléments correspondants de la k” ligne. Donc, pour k > 1 :

CL~& = ski - uklc& e t b) = bk - uklb:.

Les éléments de la première colonne du tableau transformé équivalent sont nuls pour k > 1,seul le premier élément vaut 1. Après cette première phase, le tableau s’écrit :

T(A,@ =

1 ui2 u& . . a;, b;0 ui2 c& . . CL;, b;0 c& & . . . ain b;0 ui2 u&, . . . ain b;. . . . . . . . . . . . . . . . . . . . . . . . . . .0 un2 CL;~ . . . a& b;

À présent, nous allons traiter le deuxième vecteur colonne de la matrice A. Nous divisonstoute la deuxième ligne par l’élément u&, à condition qu’il soit différent de zéro. Cette deuxièmeligne devient :

ensuite, les éléments de la deuxième ligne multipliés par uk2 sont soustraits des élémentscorrespondants de la k” ligne, et cela pour k # 2. Ainsi on aura :

2uki = uki - uk2u& e t b2 = b1 - a1 b2k k k2 2’

À présent la deuxième colonne du tableau a été transformée selon nos vœux.Il n’y a pas de difficultés à poursuivre de la même façon les transformations de la troisième

ligne puis des lignes suivantes, et ainsi de suite jusqu’à la ne ligne. À la fin du calcul, nousobtenons la configuration souhaitée :

1 0 0 . . . 0 bf0 1 0 . . . 0 b;

T(I, b”) = 0 ; ; “’ 0 ; .. . .. . . . . . . . . . . . . . . . . . . .0 0 0 . . . 1 b;

Les b: sont les solutions recherchées du système linéaire.L’élément upk q ui se trouve sur la diagonale principale a vu sa valeur changer dynamiquement

au cours des calculs tant que m est inférieur à k. Quand m = k, on procède à la division de laligne k par cet élément qui porte le nom de pivot d’où le nom de la méthode.

Au cours des calculs, nous avons supposé que le pivot rencontré n’était jamais nul. Qu’arrive-t-il si l’on rencontre un pivot nul? De deux choses l’une, ou bien la matrice n’est pas inversibleet son déterminant est nul, ou bien elle est inversible et son déterminant est différent de zéro.

Il nous est toujours possible de permuter la ligne k avec une des lignes qui suivent, doncnumérotées de k + 1 à n. Il n’y aura d’intérêt à réaliser cette permutation que si au moins un

7 1

Page 69: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

élément de la colonne k est différent de zéro. Si tel est le cas, on échange les deux lignes, rienn’est changé dans le tableau T et l’on poursuit les calculs. Si la permutation ne permet pasd’amener un pivot non nul, c’est que la matrice est singulière. Si, à partir de la k” ligne onne peut plus permuter de lignes, la matrice est dégénérée d’ordre n - k. Seules k lignes ou kcolonnes sont linéairement indépendantes.

Remarque 1 : La prudence la plus élémentaire exige que l’on reporte la solution trouvée dansles équations d’origine afin de déceler éventuellement un écart sensible avec le second membre.Remarque 2 : Une matrice dégénérée possède une infinité de solutions. À bien y réfléchir, ilest peu probable qu’un calcul de pivot amène la valeur zéro, tout simplement parce que le jeudu cumul des erreurs et des troncatures a peu de chances de réaliser un tel événement. Donc onrisque fortement à un moment donné de diviser une ligne par un pivot qui aurait dû être nulsans qu’il le soit dans la réalité. Nous allons obtenir une solution parmi l’infinité de solutionspossibles dans un tel cas.

Comment prévenir une telle infortune? Il est nécessaire de détecter un tel dysfonctionnement,et, on peut y parvenir en exécutant plusieurs fois les calculs sur des présentations différentesdu tableau obtenues en intervertissant les lignes. Ainsi on fera apparaître plusieurs solutionsdifférentes du même système linéaire et notre attention sera attirée par sa singularité.

Dans le cas où l’on ne rencontre pas un pivot nul, on peut évaluer de façon approchée lenombre d’opérations : n3. Sur le Web(*), on trouvera le programme systlin. c qui réalise lecalcul selon la méthode des pivots.

2.2. Méthode de la décomposition de la matrice A en un produitde deux matrices triangulaires

Nous nous proposons de décomposer la matrice A en un produit de deux matrices triangulairesnotées D et G où D est une matrice triangulaire inférieure et G une matrice triangulairesupérieure telles que A = DG, puis d’appliquer cette technique de décomposition à la résolutiond’un système linéaire. Notons que ce type de décomposition sera encore employé pour inverserles matrices et pour calculer les valeurs propres.

La matrice A étant d’ordre n il en sera de même des matrices D et G, et l’écriture de A = DGconduit à écrire n2 équations à (n2+n) inconnues. Nous sommes donc libre de choisir n inconnuesà notre convenance : choisissons d’écrire les éléments de la diagonale principale de D égaux àl’unité. Les deux matrices D et G s’écrivent :

10 0 . ..odz1 1 0 . . . 0

D = ;;; ;;; 1 "' 0d43 . . .

. . . . . . . . . . . . . . . . . . . . . .d 7Ll dn2 dn3 . . 1

G =

911 QI2 913 ... g1n

0 5722 Q23 . . g2n0 0 933 . . . g3n

0 0 0 .'. 9472. . . . . . . . . . . . . . . . . . . . . . .

0 0 0 . . . gnn

*http://www.edpsciences.com/guilpin/

72

i

Page 70: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

i

t

5. ÉLÉMENTS DE CALCUL MATRICIEL

Par identification, on trouve :

1. la première ligne de G :

911 = a11 Q12 = a12 ‘. . Sln = a171

2. la deuxième ligne de D, soit l’élément &r qui s’obtient à partir de :

a21 = d21g11

3. la deuxième ligne de G s’obtient au moyen des relations :

a22 = &m2 + g22 a23 = dzlgl3 + m

4. la troisième ligne de D est donnée par :

. . . mn = d21gln + an

a31 = &gll a32 = &lm + &m2

5. la troisième ligne de G est obtenue au moyen de :

~33 = &lgl3 + dm23 . . an = &lgln + &mn + an

6. On poursuit en calculant alternativement la ligne suivante de D puis la même ligne de Gjusqu’à la ligne 72.

On trouvera sur le Web(*) 1 e programme triangle. c qui réalise une telle décomposition.

2.3. Application à la résolution du système linéaire AX = B

Nous pouvons donc écrire :

A X = D G X = B

il est possible de poser 2 = GX, et donc d’obtenir aisément le vecteur 2 dont les composantessont données par le système d’équations DZ = B qui se décompose de la manière suivante :

~1 = dl &y1 + y2 = dz dayl + dxzyz + y3 = d3 . . . d,lyl + d,zya + . . + yn = d,.

Cet ensemble d’équations permet de déterminer les composantes de 2. Connaissant 2, il estaisé de calculer le vecteur X au moyen de l’équation Z = GX dont les composantes donnent :

Qn-ln% + gn-ln-lXn-1 = G-1

. . . . . . . . . . .

Qln% + Qln-lG-1 + . . . + 912x2 + Q12X2 + 911x1 = 21.

Donc à partir des récurrences ainsi définies nous sommes en mesure de résoudre un systèmelinéaire.

Remarque : Si la matrice est singulière, elle ne peut pas être décomposée en un produit dedeux matrices triangulaires.

On trouvera sur le Web (*) 1 e programme trianlin. c mettant en œuvre cet algorithme.

*http://www.edpsciences.com/guilpin/

7 3

Page 71: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2.4. Calcul d’un déterminant

Après la présentation des algorithmes de résolution de systèmes linéaires, il résulte que ledéterminant A d’une matrice carrée W est égal au produit des pivots multiplié par (-l)P,p étant le nombre de permutations de lignes effectuées au cours du calcul. Il est aussi égal auproduit des éléments de la diagonale principale de la matrice triangulaire G.

Remarque à propos de la méthode des pivots - On rencontre souvent l’idée selon laquellela méthode des pivots peut être améliorée si, à chaque fois que l’on traite une ligne, on amènecelle qui possède le plus grand pivot en valeur absolue.

Cette façon de voir est complètement erronée pour la raison qui suit. Le calcul propageles erreurs cumulées sur chacun des pivots obtenus avec une ultime soustraction (susceptiblede fournir une redoutable erreur relative). Le produit des pivots TT étant constant et égal audéterminant A, le fait d’utiliser les grands pivots au début du calcul impose les petits pivotsà la fin... Donc le déterminant, le système linéaire etc. verront croître les erreurs au fur et àmesure que se déroule le calcul, et cela d’une manière plus rapide que la simple proportionnalitéau nombre des opérations arithmétiques réalisées.l Que faut-il faire alors ? - Comme nous avons : A = nn=, pk, l’erreur relative sA sur Aest donnée par l’expression :

car les erreurs absolues dpi sont grosso modo les mêmes. On peut encore écrire :

Le membre de gauche sera majoré par la somme des modules des pivots (à une constantemultiplicative près). C’est lorsque les pivots sont égaux en module que la somme des modulesest minimum puisque le produit des pivots doit être constant.

En conséquence, la seule méthode raisonnable consiste à choisir le pivot qui est toujours le plusproche en module de m. Pour cela il faut obtenir une première valeur de A et procéder paritérations jusqu’à ce que deux valeurs consécutives du déterminant soient égales à la précisionde la machine.

2.5. A est une matrice de Vandermonde (1735-1796)

Nous rencontrerons à nouveau ce type de problème à propos du polynôme d’interpolation deLagrange ; on cherche à calculer les coefficients du polynôme de degré n qui passe par les (n + 1)points d’un échantillon (c-uj, &) avec j = 0,1,2,. . . ,n. La seule restriction consiste à supposer queles abscisses ~j sont toutes différentes les unes des autres.

Le polynôme s’écrit sous la forme :

p,(x) = 2 a@‘.k=O

74

Page 72: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL M.~TRICIEL

Nous obtenons ainsi le système linéaire suivant :

On se propose de résoudre ce système d’ordre n + 1 au moyen des déterminants de Vander-monde dont nous rappelons la propriété essentielle suivante :

Ici, l’ordre du déterminant de Vandermonde est n + 1, d’où la notation Acn+‘) (cy ). On exprimealors ao sous la forme du rapport classique de deux déterminants que l’on note :

avec A, , =

ao = A<n+l> (a) ’

Divisons la première ligne de A,, par ai, puis la deuxième ligne par a!: et ainsi de suite, nousobtenons :

En développant ce déterminant par rapport à la première colonne, on voit que A,, est unecombinaison linéaire de déterminants de Vandermonde d’ordre n notés :

75

Page 73: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MA N U E L DE CALCUL NUMÉRIQUE APPLIQUÉ

soit encore :

À présent, on sait calculer a0 ; on peut donc reporter sa valeur dans les équations de départet faire disparaître la première ligne qui devient inutile puisque nous connaissons effectivementas. Le calcul de ai, ~2,. . . , a, se ramène à la résolution du système linéaire d’ordre n suivant :

n-1‘1 cr; . . . Qi a1 Pl - aon-11 a; . . a2

. . . .

a2 1 P2 - ao

cavec C = fiai.

i=l1 cr; . . . a(;-1 a, Bn - ao

L’opération qui consiste à calculer une valeur u3 (d’abord us) puis à éliminer une ligne s’appelledéflation. À présent, nous sommes en mesure de calculer ai par le même procédé, toutefois,l’ordre de la matrice a baissé d’une unité, us ayant disparu. En poursuivant les opérations, oncalcule de proche en proche toutes les valeurs ak.

Cas CJÙ un des ai est nul - L’algorithme semble tomber en défaut si l’un des (hi est nul. Iln’en est rien. En effet, si la valeur crj est nulle, c’est la seule par hypothèse, donc on peutpermuter la ligne j avec la ligne zéro sans que rien ne soit changé. Dans ces conditions, onconnaît immédiatement la valeur as = ,& puisque la première ligne de la matrice ne contientque des zéros à l’exception du premier élément qui vaut un. Après déflation, nous revenons auproblème précédemment traité.

Nous donnons sur le Web (*) 1 e programme vdmonde . c qui réalise ces opérations. Remarquonsque ce programme utilise très peu de place mémoire : seuls les vecteurs y sont utilisés.

2.6. A est une matrice de Hilbert (1862-1943)

Une matrice de Hilbert A d’ordre n est une matrice symétrique dont les éléments &k sont donnéspar l’expression suivante :

1

uzk= l+k+1avec 1, k = 0, 1,2,. . , n - 1.

C’est une matrice bien connue pour son mauvais conditionnement. Pour s’en convaincre, ilsuffit de choisir le vecteur inconnu X et de calculer le second membre B. Prenons pour compo-santes du vecteur X d’ordre n les entiers successifs de 1 à n, soit 20 = 1, ~1 = 2,. . . ,~,-r = n.Le produit AX donne le second membre B. À partir de A et de B proposons-nous de déterminerX pour n = 5,10,15 et 20. Rapidement les résultats deviennent aberrants. C’est la raison pourlaquelle on dit que la matrice A est mal conditionnée. Il est facile de calculer chaque fois ledéterminant de la matrice A qui tend rapidement vers zéro avec l’ordre n. Pour n = 15, ontrouve un déterminant de l’ordre de 10V78... on comprend ainsi où se situent les pertes designification.

*http://www.edpsciences.com/guilpin/

76

Page 74: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL M.~TRICIEL

On donne sur le Web (*) 1 e programme hilbert . c qui fournit les résultats de ces calculs.

2.7. A est une matrice creuse

On considère à présent un système linéaire AX = D dont la matrice A d’ordre N est constituéede trois bandes tridiagonales de sous-matrices carrées d’ordre n et notées Ak, Bk et Ck commele montre la figure ci-dessous :

Bl CI XlA2 B2 C2 x2

A3 B3 G x3. . . . . . . . . . . . . . . . . . . . . . . . . . . .

cm-, x,-I

A, Bm -Gl

Dl02

03. . . . . .

Dm-1

D,

le vecteur inconnu X et le vecteur second membre D étant partitionnés en sous-vecteurs den composantes. On dit que la matrice A est creuse. Comme l’inverse d’une matrice creuse estune matrice pleine, on va mettre en œuvre une méthode spécifique qui n’est rien d’autre quela généralisation de la méthode exposée lors de l’étude des fonctions-spline (cf. chapitre 6). Aumoyen d’opérations linéaires, le but est de faire disparaître les matrices Ak et de remplacer lesmatrices Bk par la matrice unitéd’ordre n notée 4 : cm obtient alors la disposition suivante :

Il Wl12 w2

13 w3. . . . . . . . . . . . . . . . . . . . . . . .

WTT-1I m

On obtient aisément les expressions suivantes :

W, = BilC1W, = [Bz - AzW,]-’ C,. . . . . . . . . . . .

GIG2

G3

ii,L'I

G,

W, = [Bh - AkW,_,]-‘C, pour k = 2,3,. . . m - 1,

GI = BFID1Ga = [B2 - A2W,]-’ [Dz - A2G1]. . . . . . . . . . . .Gk- = [B,+ - AkWk-J1 [Dk - AkGkel]. . . . . . . . . . . .G, = [B, - A,W,J1 [D, - A,G,-l].

On calcule alors facilement X, = G,, puis en remontant on calcule par récurrence :

Xk=Gk-WkXk+l pour k=m-l,m-2,...1.

*http://www.edpsciences.com/guilpin/

7 7

Page 75: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3. Inversion d’une matrice carrée d’ordre n

3.1. Méthode des pivots

Soit une matrice carrée A d’ordre n que l’on suppose inversible. Le problème consiste àdéterminer la matrice A-’ telle que :

AA-l = A-lA = I

expression dans laquelle 1 est la matrice unité d’ordre n.Dans un premier temps, portons notre attention sur le système linéaire suivant :

A X = E ,

où Ei est le vecteur colonne unité qui possède la valeur zéro partout sauf sur la ligne i où lavaleur est un. Nous pouvons écrire :

X = A-lEi = Ai1

autrement dit, la résolution de ce système linéaire fournit la ie colonne de la matrice inverseA-l.

Nous savons résoudre ces n systèmes linéaires, mais il est plus habile de les résoudresimultanément car, sinon, nous effectuerions inutilement n fois la transformation de la matrice.Au lieu d’accoler à la matrice A le vecteur second membre, il suffit de lui accoler la matrice unité(les n vecteurs unité), puis de procéder à la même transformation que celle qui a été proposéepour résoudre un système linéaire, à la différence près que l’on traitera n seconds membres aulieu d’un seul.

Sur le Web (*), ‘11 es proposé le programme matinv . c qui inverse une matrice carrée.t

3.2. Méthode par triangularisation

L’inverse d’une matrice triangulaire supérieure est une matrice triangulaire supérieure, et I’in-verse d’une matrice triangulaire inférieure est une matrice triangulaire inférieure. Commençonspar traiter la matrice D dont la matrice inverse est A. Nous avons :

A D = I

qui fournit les équations :

dkkdkk = 1

et, pour 1 > k

611, = - hk+ldz+l,k + &,k+dz+z,lc + . . + &ldlkdkk

soit encore :

h = -(hk+lh+l,k + h,k+2d~+&k +. . + &dlk)bkk.

*http://www.edpsciences.com/guilpin/

78

Page 76: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

Après avoir calculé les dkk, on calcule ligne à ligne à partir de la dernière, et dans chaqueligne les éléments colonne par colonne à partir de la dernière colonne.

On procède d’une façon tout à fait identique pour la matrice G dont la matrice inverse est l?.Nous écrivons :

rG=I

qui fournit les équations :

ykkgkk = 1

et, pour 1 < k

Ylk = -Yllglk + Yl,l+lgl+l,k + %,1+2g1+2,k + ” ’

gkk

soit encore :

?‘lk = -(?‘llglk + %,l+l~l+l,k + %,1+2&+2,k + ‘. ’ )?“kk.

Après avoir calculé les Ykk, on calcule ligne à ligne à partir de la première, et dans chaqueligne les éléments colonne par colonne à partir de la première colonne.

Sur le Web (*), on trouvera le programme trianinv . c qui inverse une matrice carrée au moyende cette procédure.

Remarque : Quelle que soit la méthode utilisée, il est prudent d’effectuer toujours les vérifica-tions usuelles. Il sera bien venu de procéder ou bien à la multiplication de A et de A-’ qui doitredonner - aux erreurs près - la matrice unité, ou bien à l’inversion de la matrice inverse quidoit fournir la matrice de départ ~ toujours aux erreurs près.

4. Calcul des valeurs propres

Il s’agit de calculer les valeurs propres de matrices carrées d’ordre n à coefficients réels ;cependant, les méthodes proposées peuvent s’appliquer aux matrices à éléments complexes.Nous allons examiner diverses méthodes qui donnent des résultats plus ou moins intéressantsselon la taille de la matrice A ou son conditionnement. Le problème est donc la résolution del’équation caractéristique ou séculaire :

AX=XX

où X s’appelle vecteur propre et X valeur propre.

4.1. La méthode de Le Verrier (1811-1877)

L’équation caractéristique d’une matrice d’ordre n est un polynôme de degré n, et les racines dece polynôme sont les valeurs propres de la matrice. Si nous pouvons obtenir les coefficients dupolynôme caractéristique, la méthode de Bairstow nous permettra d’en calculer les racines. Lasolution repose sur les relations de Newton qui établissent une expression entre les coefficientsd’un polynôme et les SQ (somme des racines du polynôme élevées à la puissance 4).

*http://www.edpsciences.com/guilpin/

79

Page 77: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Relations de Newton - Soit P,(x) un polynôme de degré n que nous écrivons :

P,(x) = aox” + Ula: n-l + u2xnh2 + . . + a,, avec a # 0.

Désignons par pi les racines réelles ou complexes de ce polynôme qui se met alors sous la forme :

P,(x) = ao fi(x - pi).i=l

À présent, nous allons dériver (par rapport à CC) de deux façons différentes F’,(X) et identifierles résultats obtenus. Nous obtenons :

expression dans laquelle nous développons & soit :

L =; (1, (!?) + (g2+ (ei)3+...+ (!3)~+...)x - pi

d’où nous déduisons :

g&=:(zn+fy)+fy)2+C(~)3+...+gyy+...

i=l i=l i=l i=l )comme :

c pi = somme des racines,i=l

2 p: = somme des carrés des racines,i=l

on peut donc poser :

n

Sq=Cpr a v e c q=0,1,2,...(enremarquantque So=n).i=l

Nous obtenons alors :

g$=i(2so+g+;+?+...+?J+...

>Par ailleurs la dérivation directe nous donne :

PA-1(X) = ugnxnel + Ul(n - l)xne2 + u2xnp2 + . . + a,-,

ce qui permet d’écrire l’identité :

uonx n-l + ul(n - 1)~“~~ + CZ~X+~ +. . + a,-1

= (ugxn + UlX n-1 + u2xn-2 + . . .+un);(so+$+;+;+...+g+...,.

80

Page 78: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

Il reste à identifier les coefficients des termes de même degré en ~ç, ce qui nous fournit lesrelations de Newton :

aosl + a1 = 0

aoS + ulS1+ 2a2 = 0

QS3 + UlS2 + apsl + 3a3 = 0

. . . . . . . . . . . . . . . .

QS4 + ulS4-l + . . + a,-lS1 + qu3 = 0

. . . . . . . . . . . . . . . .

u()sn + Ul!Y1 +.~~+u,-lS1+nu,=O

pour p > n, nous obtenons :

uosp + Ulfrl f.. ’ + un-lSP+l-n + &sp-n = 0.

Le problème qu’il reste à résoudre consiste à calculer effectivement les valeurs S4 qui, ici, serontles sommes des valeurs propres à la puissance q, pour q = 1,2,. . , n. Revenons à l’équation auxvaleurs propres :

AX=XX

et multiplions successivement (n - 1) fois à gauche les deux membres de cette équation par A :

A2X = AXX = XAX = X2X

et ainsi de suite, on obtient d’une façon générale :

A4X = X4X avec q = 1,2,3,. . . , n..

Nous savons que la trace de la matrice A est égale à la somme de ses valeurs propres; demême, la trace de la matrice A’J est égale à la somme des valeurs propres de A élevées à lapuissance q. Par conséquent, la trace de la matrice A4 est égale à Sq. (On rappelle que la traced’une matrice est la somme de ses éléments sur la diagonale principale.) Il suffit de calculer latrace de A puis de multiplier A par A soit B = AA et de calculer la trace de B. Ensuite, onmultipliera B par A puis on calculera la trace de B, et ainsi de suite jusqu’à obtenir la valeurde S”.

On trouvera sur le Web (*) 1 e programme leverier . c qui calcule les valeurs propres (réellesou complexes) de matrices réelles par la méthode de Le Verrier.

4.2. Méthode de Rutishauser (1918-1970)Nous décomposons la matrice A dont on cherche les valeurs propres en un produit de deuxmatrices triangulaires l’une, Dr, triangulaire inférieure et l’autre, Gi, triangulaire supérieuretelles que A = DlG1.

On calcule la matrice Bi qui est le produit de Gi et Dr dans l’ordre, soit :

*http://www.edpsciences.com/guilpin/

81

Page 79: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On décompose B1 en un produit de deux matrices triangulaires Dz et Ga telles que :

B2 = DzG2,

puis on calcule le produit de G2 et Dz que l’on appelle B2, on poursuit ce type de décompositionet l’on obtient en définitive les résultats suivants :

BO = A = DIG1B1 = GID1 = DzG2B2 = G2D2 = DzGz. . . . . . . . . . . . . . . . .

B, = GnD, = Dn+lGn+~

Lorsque la décomposition triangulaire est possible, on montre que la matrice B, a les mêmesvaleurs propres que la matrice A.

En général, B, tend vers une matrice triangulaire et les valeurs propres se situent alors surla diagonale. De plus si celles-ci sont réelles et distinctes, elles apparaissent dans l’ordre desmodules décroissants en descendant le long de la diagonale principale.

On trouvera sur le Web (*) le programme rutishau. c qui calcule les valeurs propres selon laméthode de Rutishauser.

Sans entrer dans les détails liés aux valeurs propres multiples, aux valeurs propres complexes,etc., il est utile de mentionner que cette méthode, dans sa version accélérée, sert de fondementà l’établissement de la méthode de Givens.

On trouvera sur le Web (*) 1 e programme rut ishac . c qui calcule les valeurs propres selon laméthode accélérée de Rutishauser

4.3. Méthode de Givens (1912- )

La méthode de Givens consiste à réduire la matrice A en une forme quasi triangulaire au moyend’une suite de transformations unitaires, puis d’appliquer une des méthodes de Rutishauser àconvergence quadratique. Nous allons exposer la suite de ces opérations.

Désignons par A la matrice dont on cherche les valeurs propres et par aij ses éléments. Pourréaliser la transformation unitaire notée U, (V)*U = 1, on pose :

P’aP-l,q

aP-l,P r=&p s=&F’

l’astérisque désignant la valeur conjuguée et UT la transposée de U.Les colonnes p et 4 sont transformées selon les expressions :

bp-l,p = a,-r,,dG b,-r,, = 0bkp = r akp + s* akq

bkq = -Sakp + rakq avec lc = p, . . ,72.

*http://www.edpsciences.com/guilpin/

82

Page 80: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

Ensuite, les quatre valeurs bq4, pp, qpb b et bpq sont remplacées par les quantités :

Cpp = r bpp + s b,, cqq = -s* bpq + r b,,

CPq = r bPq + s bqq cqp = cpq.

Les lignes p et q se transforment par des expressions analogues :

cpi = r bpi + s b,l cql = -s* bpl + r b,l avec 1 = 1,2,. . , n.

Toutes ces expressions viennent se substituer aux éléments correspondants dans la matrice A.Dans le cas où ~~-1,~ = 0, alors on prend bp-l,p = ap-l,q p uis r = 0 et s = 1, ce qui correspond

à une rotation de 7r/2.Cette méthode nous conduit donc à obtenir une matrice quasi triangulaire inférieure. Une telle

matrice se décompose aisément selon la méthode de Rutishauser en une matrice triangulaireinférieure D et une matrice triangulaire supérieure G.

Pour des raisons de commodité d’écriture, on note la matrice A au moyen des aij pour la partietriangulaire et o1 pour la diagonale située immédiatement au-dessus de la diagonale principale.On écrit donc :

a11 a2 0 . . . 0

a21 a 2 2 a3 . . . 0

a31 a 3 2 a33 . . 0A = a41 a42 a43 . . 0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .an-l,1 an-l,2 an-l,3 . . . anGtl an2 un3 . . . GLn

bu 0 0 . . . 0bzl b22 0 . . . 0kil b32 b33 . . . 0

D = bql ba bd3 . . . 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .b-l,1 b-l,2 bn-1,s . . . 0

b 7X1 bn 2 bn3 . .' bnn

1 @2 0 . . . 00 1 p3 . . . 00 0 1 . . . 0

G= 0 0 0 . . . 0. . . . . . . . . . . . . . . . . . . .0 0 0 . . . pn0 0 0 . . . 1

Les bij et les /3j sont donnés par les expressions :

pq = Qqb,-i,q-1

pour q=2,...,n,

bP, = aPq - B4 bP,,-1 pour p = 1,. . ,n,

lesquelles viennent remplacer les valeurs correspondantes dans le tableau des aij.

83

Page 81: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Le calcul du produit C = G. D conduit aux nouvelles expressions :

$1 = b,l +&+lbp+l,l pour p= l,...,n- 1,

Cnl = bd

puis en notant par yk les éléments de C au-dessus de la diagonale principale :

cm = bq + P~+I bp+l,q pour p = q, . . . , n - 1,c -bnq - nq.

À la fin de ce premier tour de calcul, on note $2de la matrice C. On retranche cc;

la dernière valeur figurant sur la diagonalede tous les éléments diagonaux et l’on réitère la procédure

jusqu’à ce que la valeur

ne soit plus modifiée par un tour d’itération supplémentaire, c’est-à-dire lorsque l’on a obtenula meilleure précision avec la machine utilisée. & est alors une des valeurs propres recherchées.

Une fois obtenu une valeur propre, on réduit l’ordre de la matrice de 1 unité en supprimantla dernière ligne et la dernière colonne. Ces opérations s’appellent déflation. Ensuite, par lemême procédé, on passe au calcul de la valeur propre suivante. Cette méthode de Rutishauserconcernant les matrices quasi triangulaires converge quadratiquement. (Pratiquement celasignifie que le nombre de chiffres significatifs exacts est multiplié par un coefficient proche dedeux à chaque tour d’itération.)

Rappelons que les calculs s’effectuent en arithmétique complexe dans le cas général.On trouvera sur le Web (*) 1 e programme givens . c qui calcule les valeurs propres réelles des

matrices réelles.

4.4. Méthode de Danilevski (1937)

Cette méthode consiste à transformer la matrice A ou plutôt le déterminant caractéristique en saforme canonique de Frobenius au moyen de transformations linéaires qui laissent le déterminantinchangé. Une fois la forme canonique obtenue, on écrit directement l’équation caractéristiquedont on cherche ensuite les racines au moyen d’une méthode appropriée, la méthode de Bairstowpar exemple.

Écrivons l’équation caractéristique A(X) associée à la matrice A :

a11 -A -12 a13 . . ain-1 a1,a21 a22 - X a23 . . . a2+1 a2n

A(A)= ~31 a32 a33 -A . . . a3n-1 a3n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

%l an2 an3 . . GV-1 ann -A

*http://www.edpsciences.com/guilpin/

84

Page 82: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

On désire obtenir la forme suivante :

bl - X -bz -by . . -b,-l -b,,1 -A 0 0 0

B(X) = 0 1 -A ::: 0 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 0 0 . ..l -A

On passe du déterminant A(X) au déterminant B(X) au moyen de combinaisons lincaircs soitde lignes, soit de colonnes (cf. la méthode des pivots concernant la résolution des systèmeslinéaires). La transformation s’effectue de bas en haut, à savoir :

1. On divise l’avant-dernière colonne par ~,~,~~,-r p our amener 1 a la place de u,,,,,~1 (les pivotsde la transformation se situent sur la première sous-diagonale). Pour conserver le coefficient1 devant A, on est amené à multiplier l’avant-dernière ligne par u~,~-I. On désigne par u:~~les valeurs obtenues sur la dernière ligne.

2. Ensuite, on combine linéairement les colonnes pour que le déterminant ait sa dernière ligneselon la forme canonique :

0 0 . . . 0 1

Pour cela on rnultiple l’avant dernière colonne par uiIq et l’on retranche le résultat de lacolonne 4, avec 4 = 0, 1,2, . . , n - 2: n. Cette opération a amené des tcrrncs en X sur l’avantdernicrc ligne avec les coefficients a&, 4 = 1,2, . , n - 2,n, qu’il faut à préscnt éliminer saufsur la diagonale principale.

3. En retranchant terme à terme la première ligne multipliée par uLq, on fait disparaître X dupremier élérnent un-l,1 de l’avant-dernière ligne. On opère de la même façon avec la dcuxihmcligne multipliée par un2 pour éliminer le terme en X de un-r,2 et ainsi de suite pour obtenirl’avant dernière ligne privée de termes en X excepté l’élément diagonal.

On passe ensuite au pivot suivant qui est l’élérncnt ~~&-1,~,-2, on divise alors la ligne (n - 1)par cet Clement et on rnultiplie la colonne (n ~ 1) par ce même élément, puis on poursuit lescalculs de la même manière que pour la ligne n.

Cas où un pivot est nul - Si un pivot est nul la rnéthode tombe en défaut. Supposons qu’ils’agisse du pivot ak,k-r alors on regarde dans la ligne k si un des termes compris entre lescolonnes 1 et k - 2 est différent de zéro. Supposons qu’il en soit ainsi et que le tcrmc c&rl soitdiffercnt dc zcro. On ajoute alors les éléments de la colonne 4 à ceux de la colonne ic - 1. Cetteopération fait apparaître un terme en X sur la ligne q et la colonne Ic - 1. On le fait disparaîtreen retranchant à la ligne 4 la ligne 4 + 1.

Le cas où il n’y a que des zéros sur la ligne Ic dont le pivot est nul rnontre que les calculs nepeuvent pas se poursuivre de cette manière, mais le déterminant est alors le produit de deuxdéterminants dont l’un a la forme voulue de Frobenius et l’autre la forme ordinaire. À ce dernierdéterminant, on peut alors faire subir à nouveau le traiternent de Danilevski. Dans le cas le plusdéfavorable, on aura un produit de déterminants chacun écrit sous la forme ordinaire.

On trouvera sur le Web (*) 1 e programme danilev . c qui calcule les valeurs propres réelles desmatrices réelles.

*http://www.edpsciences.com/guilpin/

85

Page 83: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

4.5. La méthode de Krylov (1879-1955)

Elle repose sur le théorème de Cayley-Hamilton (toute matrice A d’ordre n est solution de sonéquation caractcristique), soit :

les ak étant les coefficients du polynôme caractéristique. On multiplie les deux membres de cetteexpression par un vecteur arbitraire d’ordre n que l’on appelle X, on obtient :

~a,ArL-q X = -A”X.q=l

On commence par calculer & = X, Br = ABo, . . , Bk+l = ABk, . . , et enfin B,, = ABnpl.Les vecteurs Bk sont les colonnes de la matrice du système linéaire à résoudre pour obtenir lescoefficients ak du polynôme caractéristique. Les dispositions du calcul sont les suivantes :

L-1 bln-2 br-:3 .'. bll bl0 a1 bh- 1 h-2 b-3 . . . bzl bo . ~2 = ~ 0::b,,,-l. . .bnni,' . b,,-, . . ,. . . ,. .b,l. 'b,O a,

bnn

Le vecteur X est arbitraire, et on le choisit très souvent avec toutes ses composantes égales àl’unité. Reste à déterminer aa = (-1)“.

Cette méthode n’exigeant que peu de calculs est fort attrayante, malheureusement elle conduità un système mal conditionné lorsque n atteint et dépasse quelques unités de l’ordre de 8 a 10.

On donne sur le Web (*) 1 e programme krylov. c qui réalise cet algorithme.

4.6. Cas des matrices symétriques

Les matrices symétriques sont hermitiennes et par conséquent ne possèdent que des valeurspropres réelles. Quand on calcule les zéros d’un polynôme caractéristique dont les coefficientssont mal conditionnés on court le risque de voir apparaître presque sûrement des racinescomplexes dont on se passerait bien. La méthode de Givens-Rutishauser permet de contournercette difficulté. On trouvera dans les exercices un problème mettant en œuvre la méthode deJacobi adaptee au cas des matrices symétriques et qui donne de trcs bons résultats, on fournitégalement le programme (cf. annexe H, problème 5.8).

4.7. Retour sur les matrices de Hilbert

Les valeurs propres des matrices de Hilbert sont réelles puisque la matrice est symétrique,cependant, leur calcul est une source de difficultés puisque le déterminant de la matrice d’ordren tend vers zéro quand n tend vers l’infini. En effet, le produit des valeurs propres est égal audéterminant de la matrice. Par ailleurs, la somme des valeurs propres est égale à la trace de lamatrice. Toutes les conditions sont réunies pour avoir des valeurs propres très grandes et à coupsûr d’autres très petites.

*http://www.edpsciences.com/guilpin/

86

Page 84: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. ÉLÉMENTS DE CALCUL MATRICIEL

5. Éléments de bibliographie

A. ANGOT (1972) Compléments de mathématiques, Éditions Masson.P.G. CIARLET (1982) Introduction à l’analyse numérique matricielle et à l’optimisation, Éditions

Masson.E. DURAND (1961) Solutions numériques des équations algébriques, Tome II, Éditions Masson.C.T. KELLEY (1995) Iterative methods for heur and non linear equ.ations, Society for Industrial

and Applied Mathematics, Philadelphie.R. KRESS (1998) Numerical analysis, Springer.0. NEVANLINNA (1993) C onvergence of iterations for hear equations, Birkhauser.R.S. VARGA (1962) Matriz iteratiwe analysis, Éditions Prcntice Hall.

8 7

Page 85: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6 1 L’interpolation

Avant dc dkvelopper le thème dc l’interpolation, il est sans doute utile de prkiscr la nature duproblème propos& car, très souvent, les opkrations d’interpolation et les opérations de lissagesont confondues dans l’esprit de bien des utilisateurs. Que ce soient des résultats expérimentauxou que ce soient des tables, la plupart des fonctions, au sens large, ne nous sont données que pourun cnscmblc discret de points qui constitue un échantillon. Toutes les fonctions transcendantesdites spéciales ont fait l’objet de tabulation pour des valeurs dc la variable en progressionarithmi:tique. Bien entendu il est rare que la valeur de la fonction figure dans la table pour lavaleur dont on a réellement besoin et l’on est obligé de se livrer à une opération d’interpolation

voire d’extrapolation ~~ pour obtenir le résultat désiré.Un problème idcntiquc apparaît lorsque l’on veut traiter mm~ériquement III~ ensemble dc

résultats expérimcntIaux quand bien mCmc lc procédé utilisé pour les recueillir eut i:ti: réalisf:par voie analogique.

Bref, c’est l’éternel problème : on ne peut avoir accès qu’à 1111 nombre fini de valeurs. Leproblèrne posé par l’interpolation ne doit pas être dissocié à proprement parler du problèmedc l’extrapolation (dans la mesure où il s’agit d’effectuer une extrapolation qui a effectivementun sens). Quel que soit le problème auquel on s’attache, on dispose toujours au départ d’unensemble fini d’ordomkes correspondant à un ensemble fini d’abscisses, ces deux cnscmblesappartenant nécessairement k des intervalles finis. Appelons I l’intervalle de définition desabscisses. Ces ensembles de valeurs constituent un échantillon de la fonction f(z) à laquellenous nous intéressons.

Quand nous cherchons à connaître f(z) 1loin- une quelconque valeur appartenant à 1, hormispour les points dc l’échantillon, nous dirons que nous effectuons une interpolation. En revanche,quand nous cherchons à obtenir f(z) pour une valeur de z située à l’extérieur de 1, nous dironsque nous rkalisons une extrapolation. Ces deux problèmes s’abordent de la même façon, maisc’est le calcul d’erreur qui va introduire une diff&ence entre les deux. Au passage, nous noteronsque l’extrapolation dans les voisinages immédiats des bornes de 1 fournit d’excellents résultats.

Pour ce qui concerne les opbrations dc lissage, il faut dire qu’elles ont un autre but : il s’agitavant tout d’eflectuer un filtrage sur un ensemble de données entachkes d’erreur. On cherche alorsà rendre compte d’une allure globale des donmks expérimentales au moyen de fonctions plusou moins arbitraires dont on ajustera les paramètres le plus souvent en utilisant la méthodedes rnoindres carrés ~~ mais, cc qui importera en priorité, sera l’élimination de ces erreurs quiconstituent un bruit de fond. Nous aurons amplement l’occasion d’approfondir ce problème,et nous examinerons un certain nornbre de méthodes qui rkalisent ces opérations dc filtrage

89

Page 86: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

éventuellement après qu’auront été abordés quelques éléments de statistique, la méthode desmoindres carrés et la transformée de Fourier.

1. De la légitimité de l’interpolation

En règle générale, la fonction f(z) connue au moyen d’un échantillon de points est continue surl’intervalle 1 que nous venons de définir. Il s’ensuit que sur cet intervalle elle peut être approchéeuniformément par un polynôme et cela en vertu du théorème de Weierstrass (181551897). Dureste il n’y a pas de difficulté à généraliser cette proposition au cas où l’approximation est réaliséepar un système quelconque de fonctions pourvu qu’il soit complet.

Les systèmes complets usuels sont : le système des puissances (les polynômes orthogonauxusuels), le système des sinus et des cosinus, les fonctions de Bessel, les fonctions du cylindreparabolique etc.

L’idée d’interpoler par un polynôme est bien antérieure à la publication du théorème deWeierstrass (1815-1897) et elle a été exploitée par de nombreux savants mais c’est le nom deLagrange qui est resté attaché à cette technique. Comme elle présente un grand intérêt théorique,nous allons nous y attarder quelque peu.

2. Le polynôme de Lagrange (1736-1813)

Le problème consiste à obtenir le polynôme de degré n qui passe par les (n + 1) points del’échantillon. Les abscisses au, ai, . . . ulL appartiennent à l’intervalle I qui est le plus petit possible,et la fonction réelle f(z) prend les valeurs bc, bi, . b, correspondant aux abscisses respectives.

Aucune hypothèse n’est faite sur les échantillons à cette réserve près toutefois que, pour unevaleur donnée de arc, il ne peut correspondre qu’une seule valeur bk. Cela implique que tous lesah: sont différents. Si tel n’était pas le cas, il conviendrait d’effectuer une partition (ou plusieurs)pour réaliser cette condition, et l’on associerait à chacune des partitions obtenues un polynômede Lagrange unique. Supposons que pour la valeur ak il y ait deux valeurs 1~1 et ~2, cela veutdire que l’on découpe l’intervalle 1 en deux sous-intervalles 11 et I2 ayant uk comme intersectioncommune. y1 et y2 sont attribués chacun à l’intervalle correspondant 11 ou I2 donné par l’allurede la courbe représentative.

Tout cela précisé, nous allons établir l’existence de ce polynôme unique de degré n que nousdésignons par &(z) et qui s’explicite de la façon suivante :

PT>,(Z) = Qo + QI2 + ‘. + Qn-lx7L-1 + Cy,ci? = c a!&&

k=O

En utilisant le fait que ce polynôme P,(z) doit prendre la valeur bk lorsque la variable z prendla valeur ak, nous obtenons le système linéaire Suivant

1 au ao ui . . at

1 a1 CL: a: . . G1 a2 CI~ a$ . . . ay. . . . . . . . . . . . . . . . . . . . . . . . .

1 a, CL; CL: . . un

90

a0 bo

a1 bl

(~2 = b

% bn

Page 87: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. D’INTERPOLATION

que nous écrirons d’une manière plus concise sous la forme :

Aa = B.

Le déterminant de la matrice A est un déterminant de Vandermonde pour lequel tous les uksont différents :

j=,n kzndet[A] = n n(aj - uk).

J=O k>j

Comme conséquence immédiate il s’ensuit que la solution existe et qu’elle est unique.Si l’on se situe dans un contexte historique, à l’époque de Lagrange (173661813), le calcul des

coefficients ne pouvait pas s’effectuer par la résolution d’un système linéaire dès que l’ordre dela matrice dépassait quelques unités, et Lagrange proposa une technique qui a permis de réaliserdirectement l’interpolation sans calculer explicitement les coefficients du polynôme. C’est cetteméthode que nous exposons maintenant.

Considerons un polynôme de degri: (ß + 1) appelé QTL+r(z) et défini par la relation :

.7=0

À présent, décomposons le rapport Pn(z)/Qn+r( z en éléments simples, opération possible)puisque, par hypothèse, tous les uk: sont différents; nous pouvons écrire :

pn (xl AiQn+~(x)

=k2To (x - ~1

d’où l’expression prise par le polynôme PTL(x) :

Comme il est possible d’écrire que :

nous obtenons alors :

P,(x) = c Ai . fi,, - a,?).i=o j=o

j#a

Maintenant il nous faut chercher à expliciter les A, en tenant compte du fait que le polynômedoit passer par les points d’échantillonnage. Cela donne les relations suivantes :

pn(ak) = bk = 2 A, . fi& - q),i=o J=O

3#i

91

Page 88: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Comme l’indice j prend toutes les valeurs de 0 à n, excepté la valeur i: les produits seronttoujours tous nuls sauf celui pour lequel nous aurons i = k. On en déduit l’expression suivante :

n

brc = Ak: l-&k: - aj).j=o.7#i

Nous tirons alors la valeur de Ak: que nous reportons dans l’expression de P,,(z) :

(6.1)

P,(z) est donc le polynôme passant, par tous les points de l’echantillonnagc, et nous en avonsobtenu deux expressions. Il convient d’ajouter que ce polynôme peut être utilisé aussi bien pourréaliser une interpolation qu’ime extrapolation.

Comme par expérience on sait que l’extrapolation est une opération peu précise loin dudomaine 1, il est nécessaire dès à présent de se faire une opinion skieuse sur l’erreur commiseen remplaçant une fonction f(z) échantillonnée par le polynôme de P,,(X), et c’est l’expressiondue à Lagrange qui va nous pcrrnettre de résoudre le problème.

3. Évaluation de l’erreur

Supposons que f(z), remplacée par PT2 (ix), soit (7~ + 1) fois derivablc sur l’intervalle 1, etconsidérons la fonction auxiliaire Q(U) définie comme suit :

I-p - Ui)Q(u) = f(u) - P,(u) - [f(x) - P&)] y .

ncx - CG)i=O

Cette fonction @(u) qui apparaîtra sans doute un peu artificielle va nous permettre d’exprimeraisément la valeur absolue de l’erreur E(x) commise en effectuant le remplacement de f(z) par

ce qui, par parenthèses, explique la structure de Q(U). Pour parvenir à notre fin, dérivons (n + 1)fois la fonction Q(u) par rapport à U, ce qui donne :

Remarquons que la fonction Q(U) s’annule pour toutes les valeurs u = ai mais aussi pourla valeur u = IC. L’application successive du théorème de Rolle (165221719) à (a(u) pcrrnetde voir que la dérivée @(“+l) (u) s’annule pour une valeur u = < appartenant au plus petit

92

Page 89: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

intervalle contenant z et les ai (dans le cas de l’extrapolation z n’appartient pas à l’intervalle 1précédemment défini). Nous obtenons alors l’expression suivante :

de là nous tirons l’expression de l’erreur E(z) :

Comme chaque fois en pareil cas, on procède à la majoration de f cn+r) (Or) dans l’intervalleadéquat. R,appelons que cet intervalle sera plus grand que I s’il s’agit d’une extrapolation,c’est-à-dire que II: n’appartient pas à l’intervalle 1. Désignons par M,!,+r la limite supérieure def’“+‘)(x) dans l’intervalle concerné, l’expression de l’erreur devient :

E(x) < (ri+;)! i=.~ ~fi(x - a,)

On voit immédiatement que l’erreur est nulle sur les points d’échantillonnage et qu’cllr esttres petite dans le voisinage de ces points. De plus il est important de noter que l’expression deE(z) varie en fonction de x et que, de plus, elle dépend des points CL~. On peut alors se poser laquestion de savoir comment choisir les ak pour que l’erreur E(z) soit minimum.

4. Comment minimiser E(x)

La seule façon possible de réaliser l’opération est de rendre minimum l’expression n~=,(~ - a,)qui n’est rien d’autre qu’un polynôme de de@ (n + 1). Nous montrerons au chapitre 9 lethéorème suivant : parmi tous les polynômes à coefficient principal réduit de degré (7~ + 1).

c’est le polynôme de Tchebycheff (1821-1894) qui s’écarte le rnoins de l’axe des x sur l’intervalle(-1, +l). Ce polynôme a pour expression :

T,,,+r(z) = & COS[(~ + l)Arcos(z)]

Les zéros de ce polynôme sont donnés par :

(n + l)Arcos(zk) = 5(2k + l),

soit :

zk = Cos7r(2k + 1)

=2(n + 1) avec k 0 , 1,2:. . . , n.

En réalité, on ne travaille pas sur l’intervalle (-1, +l), mais sur l’intervalle 1 dont la borneinférieure est a et la borne supérieure b. Le changement de variable :

2x-u-bZ=

b - u

93

Page 90: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

permet de passer de l’intervalle (-1, +l) à l’intervalle (a, b). 0 n en déduit que lc polynôme deTchebycheff de degré (n + 1) à coefficient principal réduit defini sur (a, b) a pour forme :

ce changement de variable donne également les zéros de ce polynôme :

a+b b - axk = ~2 + 2 COS

74% + 1)2(n + 1)

avec k=O,1,2 ,..., n.

Pour minimiser l’erreur: il faut choisir les ak identiques aux xk qui sont donnés par l’expres-sion (6.2).

Remarque : Il est à noter que l’erreur est donc minimum pour un partage de l’intervalle 1 selonles xk, et cela est indépendant de la fonction à interpoler. Cette règle demeure dans lc cas où lafonction f(x) est connue empiriquement, ct la meilleure facon d’obtenir des valeurs exploitablesavec la plus petite erreur repose sur le choix des xk donnés par l’expression (6.2). On insiste doncsur la généralité de ce théorème qui ne préjuge en rien de la nature de la fonction à interpolersi ce n’est l’hypothèse traditionnelle de continuité.

5. Autre disposition pratique du calcul du polynôme de Lagrange

Il faut bien reconnaître que le calcul effectif du polynôme de Lagrange pour un ensemblede valeurs de z demande un travail assez laborieux, aussi préfère-t-on employer une autreexpression qui conduit à des calculs plus économiques et surtout qui permettra d’établir uncertain nombre d’autres formes réputées canoniques. Pour ce faire, on se propose d’adopter ladisposition suivante :

Pn(x) = BO + Bl(X ~ uo) + Ba(x - uo)(x - Ul)

+ . . + B,(x - uo)(x - ul) . (x - u,-~); (6.3)

dont il faut déterminer les Bk. D’abord on a F’,(Q) = bo = BO, ensuite on peut poser :

Qn-l(x) =Pr?,(x) - bo

x - a()= &+ Ba(x - Ul)-t L%(x ~ Ul)(X - u2)

+. . . + B,(x ~ Ul)(X ~ u2). . (x - Un-l),

ce qui permet d’écrire

Qnpi(al) = !!LI!f! = ~~ai - a0

Considérons à présent :

Q7,-2(x) = Q+l(x) ~ B12 - a1

= B2 + &(x ~ ~2) + Bd(2 - uz)(x ~ a:s)

+ . . + B,(x ~ u~)(x - as) . (x - anpl),

9 4

Page 91: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

expression dans laquelle on fait x = ~2, ce qui donne :

Qn-2(a2) = Qrr-l(d - B1 = B2,

a2 - a1

soit encore :

B2

= ba ~ bo - &(a2 - uo)

(aa -ao)(az - a)

On poursuit de la même façon le calcul pour obtenir tous les Bk.

Récapitulation de la conduite du calcul

Sur le tableau ci-dessous on a représenté la suite des opérations qui permet de calculer tous lesBj.

aoh~ = BO

h - boa1h ~

a1 ~ ao= q:L-l = Bl

bz - b.d z - = d-1

4:-l - 421~ q;lp2 = B2

a2 - ao a2 - a1

b:3 - bou3b3- = Llqn-1 ~ d-1

us - a0 a3 - a1

= q”p2q;-2 ~ La7? a:< - CL2

= q;p3 = B3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6. Cas où les abscisses sont en progression arithmétique

Désignons par h la raison de la progression ; nous avons donc la suite des abscisses donnée par :uo, a1 = uo + h, u2 = au + 2h,. , un = uo + nh.

C’est un cas particulier, certes, mais il est très répandu, et & ce titre il mérite d’être examinécar il conduit à des expressions très connues et très simples d’emploi. Pour aborder cette étudeil nous faut au préalable définir les opérateurs de différence.

On appelle différence première d’ordre k la valeur A bk donnée par l’expression :

A1bk = bktl ~ bk = f[uo + (k + l)h] - f(uo + kh).

Ensuite, on définit les différences deuxièmes d’ordre k :

A2bk = A1bk+l ~ A’bk

et ainsi de suite pour les différences troisièmes, quatri?mes, etc. D’une façon générale on définirales différences pe d’ordre k au moyen de la relation :

Remarque : Si les valeurs (ui, b,) sont données par un polynôme de degri: m (f(z) = PTrL(x)) jil va de soi que les différences d’ordre k supérieures à m sont nulles et que toutes les différencesme sont égales.

95

Page 92: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

La signification des différences est simple, ce sont les expressions numériques approchees desvaleurs dc la dérivée première, de la. dérivce deuxième; etc. au point (Q., bk).

Ici la valeur au est la valeur initiale de la suite, mais on peut très bien ecrire les formulesd’approximation en choisissant pour valeur initiale ao urr point d’int,érêt particulier dans letableau des données ; dans ce cas, les abscisses précédant ~0 sont notecs par des indices negatifs :

Cette dernièrr rernarque conduit à l’écriture dc différentes formes du polynôme de Lagrangequi offrent de grands avantages lorsque l’on ne désire employer qu’une partie restreinte du tableauinitial des données. Ces différentes forrncs portent le nom du savant qui s’est attaché à une deces études: on étudiera donc les polynômes ascendant et descendant de Newton les polynômesde Stirling et dc Bessel.

Dans lc cas où l’on utilise toutes les données du tableau, soit (n + 1) points, t,ous lespolynômes que nous venons d’évoquer donnent alors les mêmes résultats puisque ce ne sontque des expressions différentes du même polynôme de Lagrange. Toutefois nous verrons unepetite nuance concernant les polynômes de Stirling et dc Bessel qui sont respectivement l’unpair l’autre impair, mais cela nc restreint pas la généralité de notre propos.

7. Les polynômes d’interpolation de Newton (1643-1727)

Reprenons l’équation (6.3) dans laquelle nous tenons compte du fait, que les abscisses sont enprogression arithmctique :

P,l(z) = No + Nl(n: - ao) + N2(z ~ uo)(z - un ~ h )

+ . . + N,(z ~ uo) . [x - un ~ (n - l)h]. (6.4)

Pour obtenir les valeurs des (n - 1) coefhcients Nk: il suffit de donner à z la suite des valeursao + kh avec k = 0, 1,2,. . : n. À l’aide des diffcrences premiercs. deuxièmes etc., le tableauprécédent st transforme ainsi :

2 b A16 A2b A”b A4b .

QO bnuo + h bl A’bo

a,, + 2h b2 Albi A”bo

no + 3h bx A’b2 A2bl A”boa0 + 4h bd A1b3 A2bz A”bl A4bl

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

On obtient alors :

P,z,(ao) = b. =No

Pr, (ajo + h ) = bl =No + NI11

PT,(uo + 2h) = b2 =No + 2N1h + 2!N2h2. . . . . . . . . . .

P,, (uo + qh) = b, =No + qNlh + q(q - l)N2h2 + q(q - l)(q ~ 2)N:jh” + . + q!N,hq. . . . . . . . . . .

Pn(uo + nh) = b, =No + nNlh + n(n ~ l)N2h2 + n(n ~ l)(n - 2)N:# + . + n!N,h’“.

96

Page 93: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L ‘INTERPOLATION

À présent, nous allons exprimer de proche en proche les coefficients NI, au moyen desopérateurs de difference définis au paragraphe préccdent. On obtient donc :

. . . . . . . . . . . . . . . . . . .A”b,,

N,, = ~n! h”

Pour des raisons de concision d’écriture il est commode de poser :

Ainsi l’expression devient :

PrL(z) = b,, + zA1bo + ~~2b0 + . + 42 - 1) ‘ . b ~ (TL - 111 *nbo,l (6.5)1%.

Cette formule s’appelle polynôme de Newton descendant. Elle est utilisk pour effectuer desinterpolations en tête dc tableau (ce qui signifie que l’on réalise l’interpolation avec le dcbut dutableau et non pas avec tout le tableau).

Pour obtenir les interpolations en queue de tableau ~ disons avec le dcrnicr quart desdonnées ~~ il suffît d’écrire le polynôme de Newton en considérant 1111 pas négatif; c’est-à-direen changeant de signe la raison de la progression arithmétique. L’expression (6.4) devient :

P,L(x) = Mo + Ml(z ~ uo) + Mz(x - u,,)(z ~ ao + h)

+...+Mn(rx - uo) . . . [x - a0 + (n- l)h]. (6.6)

Comme précédemment, on donnera à z les valeurs ae ~ kh avec k = 0, 1,2, . n, rnais, pouréviter toute confusion, on affcctcra un indice aux valeurs correspondantes des ordonnées avecun signe ncgatif, soit b-k. On obtient alors :

P,, (ao) = b. = MoP,(a,, - h) = bki =A&, - MlhP,,(ao - 2h) = bka = Mo - 2Mlh + 2!Mshj2

Pn(ao - qh) = bk,, = Mo - qMlh + q(q - 1)M2h2 - q(q - l)(q ~ 2)M#+. . . + (-l)“q!M<,h’J

Page 94: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

À partir de ces expressions, on tire la suite des Mk données en fonction des opérateurs dedifférence :

. . . . . .

A”bLkMk; = ~

k!h’”

Toujours en posant z = (z-ao)/h, nous obtenons la forme canonique du polynôme de Newtonascendant :

4z+l) 2P,(z) = b. + zA1bkl + ~2!

A bp2 + . + dz + l) ” ’ (’ + n ~ l) A’“&, .n ! (6.7)

En résumé, les deux polynômes de Newton permettent d’obtenir des expressions adaptées àl’interpolation des panneaux de tCtc et de queue des tableaux lorsque l’on n’utilise qu’une partiedes données. Il reste donc la partie centrale que l’on interpole par les polynômes de Stirling etde Bessel.

8. Le polynôme d’interpolation de Stirling (1692-1770)

On obtient ce polynôme en faisant jouer un rôle symétrique à l’ensemble des données par rapportà ao, pour cela on écrit le polynôme (6.4) sous la forme suivante :

F’,(x) = SO +SI(X - uo) +&(CC ~ uo + h)(z - uo) + S:j(x - a0 + h)(z - uo)(x - a0 - h)+... + S2,(z - uo + qh) . . [z - ao - (q - l)h] + S~,+I(X - ao + qh) . . (ix - ao - qh). (6.8)

Pour obtenir les valeurs de Sh, il suffit de donner à z la suite des valeurs ao, a0 = h, ao + h,ao ~ 2h, etc., ce qui permet d’écrire :

Pn(uo) = bo = SOP,(uo - h) = b-1 = SO ~ SlhK(~O + h) = bl = SO + Slh - 2S2h2Pn(uo - 2h) = b-2 = Su - 2Slh + 2!SLh2 ~ 3!S”h”

i~(a,j~y &j’- il, = SO - qSlh + q(q - l)Szh2 - q(q - l)(q + l)&h”+. ‘. + (-1)“1(2q - l)!S2<~-&24~1

. . . .&‘(io’+ &j = b, = SO + qSih - q(q - l)Szh2 + q(q + l)(q - 2)S3h” + . . + (2q)!,&h’?

98

Page 95: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

Tout comme précédemment, on tire les valeurs des coefficients Sk exprimés en fonction des

opérateurs de différence :

S” = bu

Alb-1SI = 7

s = A2b-22-

2!h2. . . . . . . . . . . .

SA2q+lb-,pi

2q+1 = (‘& + l)!h%+l

En ut,ilisant le même changement de variable que celui déjà utilisé à propos des polynômesde Newton, nous obtenons une forme plus concise :

z(z + 1)I=~L(Z) = bo + zA1b-1 + 7 A2b-i +

Z(Z” ~ 1)3!

A3be2

+2(z2 - l)(z + 2, abbb2 + dz2 - l)b2 - 4, a”bps + . . (6.9)

4! 5!

À présent, écrivons le même polynôme (6.8) cn fonction d’abscisses données pour une saisonnégative :

P,,(X) = R. + Ri(z - QI) + R2(11: - ao)(x - ao ~ h)

+ R:<(x - ao + h)(z ~ uo)(x - ao - h)

+ . . . + R2q[x - a,, + (q - l)h] . (z ~ ao - qh)

-t Rzq+l(x ~ ao + qh) (x - ao - qh) ( 6 . 1 0 )

Sans entrer dans le détail puisque les opérations ont éte explicitees à plusieurs reprises, onobtient les coefficients Rk: au moyen des expressions :

R. = boA1bo

RI = h

R = A2b-i2-

2!hZ. . . . . . . . . . . .

A2qb-,R2q = o!h2y

A2q+lb-R2q+l = (Zq + q!h”u+l

En procédant au changement de variable en z on peut écrire :

P,l(z) = bo + zA1bo +z(z” ~ 1) 3

+f$A2bk1 + y, A bkl

+z(z” - ‘)(’ ~ 2)‘&p2 + ‘b2 ~ ‘)b2 - 4, a”bp2 + . . (6.11)

4! 5!

052143968799

Page 96: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Par définition le polynôme de Stirling est la dem-somme des expressions donnees par (6.9)et (6.10), lequel s’écrit simplement :

PT{(Z) =bo+zA’bo + Alb-i z2

+ %A2b-l +Z(Z”

2~ 1) (A”bbi + A”bbz) + z”(z” - 1) A4bb

3! 2 4! 2

+Z(Z” - 1)(22 ~ 4) (A’bb2 + A”bb:j)

5! 2... ( 6 . 1 2 )

Il convient de remarquer que l’on arrête l’expression du polynôme de Stirling au terme A’qbb,et non au terme précédent :

(A2q-1b-,+l + A2”-lb&)2 1

tout simplement parce que si l’on connaît A2”-‘bb,+r et A2qp1bbq, on connaît A2”bb . On en,déduit que le polynôme de Stirling est toiqours un polynôme de degré pair et qu’il faut cinnaître(2k + 1) points pour un polynôme de degre 2k.

Le polynôme de Stirling est utilisé pour effectuer les interpolations situées dans le deuxièmequart du tableau lorsque, évidernment, on utilise mie fraction seulernent du tableau.

Dans les mêmes conditions, il nous reste à s’intéresser au troisième quart du tableau, ce serachose faite après l’étude du polynôme de Bessel.

9. Le polynôme d’interpolation de Bessel (1784-1846)

Pour obtenir le polynôme de Bessel il suffit d’effectuer la demi-somme du polynôme (6.9) et dupolynôme (6.11). Au préalable on réalise dans la relation (6.9) le changement de variable z en(2 ~ 1) qui correspond à un décalage des indices d’une unité, nous pouvons écrire :

Pr!,(z) = bl + (z ~ l)A1bo + ~‘(’ - l) A2b

+‘l’~ ‘ii- 2)A”be1 + ‘dz2 ~ ‘)b - 2)~4b-l +, .3! 4!

(6,13)

le polynôme d’interpolation prend alors la forme :

+ (2 - 1/2)Aibe + ~dz - 1) (A260 + A2b-l) + z(z - l)(z - 1/2) A”bb2! 2 3! 1

+Z(Z" - l)(z - 2) (A4b-1 + A”bb2) +. .

4! 2

Ajoutons que nous devons arrêter le polynôme de Bessel à l’ordre (2k + l), c’est en effet unpolynôme impair qui dernande (2k + 2) points pour sa définition.

10. Erreurs commises en utilisant les polynômes d’interpolation

Il suffit de réaménager la formule établie lors de l’étude du polynôme de Lagrange pour chacundes cas envisagés ici, c’est-à-dire l’expression de E(z). Nous obtenons alors les expressionssuivantes :

100

Page 97: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

10.1. Le polynôme de Newton ascendant

10.2. Le polynôme de Newton descendant

10.3. Le polynôme de Stirling (polynôme pair)

10.4. Le polynôme de Bessel (polynôme impair)

p&+2(Z)l < Iz(z” - 1). . . (22 - n)(z2 ~ n - l)/ (2T’y;)+d2,L+2.

(6.14)

(6.15)

(6.16)

(6.17)

Dans ces quatre expressions MTb conserve la même dcfinition que celle qui a 6ti: explicitee aucours du paragraphe 3 de ce chapitre.

11. Programmes déterminant les polynômes d’interpolation

Nous avons donné sur le Web(*) 1 es programmes lagpoly . c, ascend. c et descend. c quipermettent d’obtenir les formes de quelques polynômes rencontrés dans ce chapitre, soient lepolynôme de Lagrange et les deux polynômes de Newton qui sont les formes les plus usitées(cf. la méthode d’Adams concernant l’intégration des équations différentielles).

12. Interpolation par les fonctions-spline

Replaçons-nous dans les conditions générales du début du chapitre du moins pour ce qui concerneles données. L’interpolation dans un tableau de (n + 1) points réalisée au moyen du polynômede Lagrange de degré n ou d’une des variantes due à Newton, Stirling ou Bessel, peut souventconduire à des calculs assez longs et dont l’intérêt n’est pas toujours vraiment immédiat. Alors,on pourra préférer de réaliser les interpolations, par exemple, au moyen des fonctions-spline quine sont rien d’autre que n polynômes de degré 4 représentant les données expérimentales danschacun des n intervalles. Un polynôme et un seul représente la fonction dans un intervalle formépar deux abscisses consécutives (uk, a,k+r).

Chaque polynôme ayant (4 + 1) coefficients, on doit au total calculer n(q + 1) termes. Pourréaliser cette opération on impose les conditions suivantes :

*http://www.edpsciences.com/guilpin/

101

Page 98: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

a. Chaque polynôme Q”(z) réalisant l’interpolation entre les points ak et ak+r passe par cesdeux points.

b. Les dérivées premières, deuxièmes et ainsi de suite jusqu’à l’ordre (4 - 1) des polynômes

Q;-%) et Q”C x se raccordent au point uk, c’est-à-dire qu’elles sont égales chacune à)chacune.

c. Comme nous avons imposé [2n+ (n - l)] (4 ~ 1) conditions, il manque encore (q- 1) conditionspour fermer le système. Alors, on impose arbitrairement que les dérivées d’ordre le plus élevéconcernant les deux polynômes extrêmes Q:(z) et &y( II: s’annulent respectivement au point)an et au point a,. Si Q est impair, les (q-2) dernières dérivées de Q;(X) et Q:(x) s’annulerontrespectivement au point ao et au point a,. Si Q est pair le problème devient dyssymétriqueet l’on choisira les (Q ~ 2)/2 dernières dérivées pour un polynôme et q/2 pour l’autre.

Ces généralités étant énoncées, nous allons fixer notre attention sur les fonctions-spline dutroisième degré qui constituent de loin celles qui sont le plus fréquemment employées.

13. Les fonctions-spline du troisième degré

Il n’y a dans ce cas que deux conditions à ajouter pour que le système des équations linéairessoit fermé. Nous avons :

Qk(x) = (Yko + ‘%IX + ak2x2 + Qk3x3

Qk(uk-l)= bk-1

Q/c(~h) = bkQkbk) = Q;+dadQXac, = Q~+,(~k>

plus les deux conditions arbitraires :

Qi’bo> = 0 Q;(an) = 0.

En toute rigueur, il nous faut résoudre un système linéaire de 4n équations à 4n inconnues.Comme la matrice des coefficients est une matrice-bande, nous allons développer une méthodespécifique pour obtenir les paramètres inconnus. Il s’agit en fait de réduire le plus possible lenombre d’inconnues en exploitant convenablement les conditions que nous venons d’expliciter.Pour cela posons :

hk = ak - ak-1

Mq = Qi(uq) pour 4 = 1,2,. . (n ~ 1).

Nous allons exprimer les polynômes en fonction des Mq qui sont pour l’instant des inconnues.Ces quantités vont être déterminées par un système linéaire que nous allons définir. Commenous avons :

102

Page 99: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

on en déduit que :

6a k 3 =ak ~ ak-1

e t

puis

Q;(x) = Mk - Mk ;ll/ih-lak + Mk ;;-lx;

cette dernière expression se transforme en :

Q;(x) = [M/&k - M!&+l - M!A + MLlak + M!&X - Mk-1X] /hk

d’où nous tirons

Q:(X) = [n/r,(x - ak&1) - Mkpl(X - ak)] /hk.

Maintenant, nous allons intégrer successivement deux fois cette expression puis déterminer lesdeux constantes d’intégration au moyen des deux conditions :

Qk(akp1) = bk-1 e t &k(ak) = bk.

Nous pouvons alors écrire :

hkQk(x) = Mk (x - T-l)” - ibfk-, [(x -;k’3] + EiX + L,

d’où

e t

K = bk - b,+1 - (Mk - Mk&

L = hkbk - Mk$ - (bk - bk-l)ak + (Mk - Mk-,>!$C&.

Nous obtenons alors :

h2, hi h3Kx +L = bkx - bk-1X - MkT” + MkplTX + hkbk - MkT

h2 hz- ad% + b!.-lak + Mk&ak - M&,-ak.

6 6

En regroupant les termes et en tenant compte du fait que hk est donné par l’expression hk =ak - a&1, on obtient :

Kx+L= (bk-Mk$) (x-ak-l)+ (bk~l-Mk~l~) (ak-X);

103

Page 100: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

d’où nous pouvons écrire :

hkQk(x) = Mk(" - ;'-')" - Mk_, (x c:,j3 + (bx ~ Ma:) (x - akpl)h2”

+ bk-1 - Mk&,T (Uk - x ) ;>

Par cette succession de transformations nous avons réduit le nombre d’inconnues du systèmelinéaire, et ce sont les Mk qui deviennent les nouvelles inconnues au lieu des coefficients akc, okl,CY~Z et czk3. Pour calculer effectivement les Mk, nous devons utiliser le fait que les polynômesQI*(X) et Qk-+l (x) d .orven avoir leurs dérivées premières qui se raccordent au point arc. Noustobtenons ainsi :

Mk!?-~+~k!!!&+!!-hk!!i2 6 6

kil bk=&f-- bk+l+hk+l++--

Mk+l2 hlr+1 hk-+l

hk+lT

Regroupons les termes en Mk ordonnés selon les indices croissants :

Puisque les polynômes &O(X) et Q ( )1 x sont déterminés par Mo = Mn = 0, on obtient doncun système de (n - 1) inconnues en faisant varier k de 1 à (n - 1).

À présent, il reste à résoudre un système linéaire dont le premier membre dépend d’une matricetridiagonale.

14. Résolution d’un système linéaire dépendant d’une matrice tridiagonale

Comme la plupart des éléments de la matrice sont nuls, il est préférable d’utiliser une méthodeadéquate pour traiter ce système linéaire. En effet l’utilisation d’un programme général serait malvenue car la plus grande partie du temps de calcul serait consacrée à l’obtention de résultatsnuls. Donc nous allons présenter une méthode adaptée au problème, méthode d’autant plusintéressante qu’elle est généralisable au cas d’une matrice pentadiagonale par exemple.

D’une façon tout à fait formelle, écrivons un système linéaire qui dépend d’une matricetridiagonale :

ml1 ml2 0 0 0 . 0m21 m22 m23 0 0 . 00 m32 m33 m34 0 . . . 0. . . . . . . . . . . . .0 0 0 mn-l,n-2 mn-l,+1 m-h0 0 00 mn,+1 mn+

système que l’on peut écrire sous la forme condensée :

MX=C.

Xlx2x3

xn-1271

Clc2c3

G-1CT,

On traitera plus avantageusement le tableau T à n lignes et (n + 1) colonnes obtenu enjuxtaposant à la matrice M le vecteur C.

1 0 4

Page 101: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

Une transformation linéaire tout à fait analogue à celle utilisée dans la méthode des pivotspermet de passer du tableau T au tableau T* par suppression d’une diagonale de la matrice M,tous les éléments de la diagonale principale prenant la valeur 1 (cf. chapitre 5). Pour parvenir ànotre fin, nous allons diviser la première ligne du tableau T par l’élément diagonal mil. Ensuite,il suffit de multiplier la première ligne par mzi et de retrancher le résultat de la deuxième ligne.On divise alors cette deuxième ligne par 1’ClCment situé sur la diagonale. On pourrait penser qu’ilvaut mieux commencer par effectuer la division par le pivot avant d’effectuer la combinaisonlinéaire qui élimine m21, mais dans ce dernier cas, on réalise une opération en trop qui estm2i/m22. En effet, il est inutile de diviser m& par m& après la réalisation de la combinaisonlinéaire car rn& est nul. Cette remarque fait gagner (n- 1) opérations ce qui n’est pas négligeablelors de procédures répétitives où le temps d’exécution peut devenir important.

En poursuivant de ligne en ligne la même façon d’opérer, on aboutira nécessairement autableau T* qui aura la forme suivante :

1 PlZ 0 0 4

0 1 PZY 0 dz

0 0 1 P34 dz. . . . . . . . . . .0 0 0 0 1 P+I,~ 610 0 0 0 0 1 4,

La dernière ligne donne directement la valeur de la dernière inconnue. La ligne (n ~ 1) permetd’obtenir alors l’inconnue (n - 1) par substitution et ainsi de suite en remontant jusqu’à lapremière ligne du tableau. En considérant le problème de résolution d’un système linéaire souscet angle particulier, on aboutit à une économie considérable de mémoire et de temps de calcul.

Sur le Web (*), on trouvera le programme lispline. c qui réalise l’interpolation par desfonctions-spline du troisième degré.

15. Une application simple des polynômes d’interpolation

L’intégration formelle d’un polynôme est une des rares opérations que l’on sache réaliserrigoureusement. Il n’y a pas de difficulté particulière donc à utiliser les polynômes d’interpolationpour réaliser les opérations de quadrature.

En particulier, si l’on utilise les fonctions-spline du troisième degré,on aboutira à une valeurnumérique dont la précision est analogue à celle donnée par la méthode de Simpson (1710-1761)puisque, dans les deux cas, il s’agit d’interpoler une fonction par une parabole cubique.

Nous fournissons sur le Web (*) 1 e sous-programme aire. h qui assure cette intégration. Nousdonnons les étapes du calcul de l’expression qui est programmée. Partons de l’expression généraledu polynôme d’ordre k :

*http://www.edpsciences.com/guilpin/

105

Page 102: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Désignons par Sk la surface comprise entre ak-1 et arc, il vient :

Sk =J’

Pk(x) dz = Mk-1(x - ak-1)4

24hk_ Mkpl (Q - 4”

24hkalc-1

h2k (uk - cc)”- bkpl - AI/+- + (hi - j&!!i) (x-2;-1)2 ak .

62hk

ak-1

Le développement de cette dernière expression conduit à la formule simple :

là on tire :

expression dans laquelle S est l’intégrale totale. Dans le cas fréquent où les abscisses sont enprogression arithmétique, nous pouvons poser h = hk quel que soit l’indice k, on arrive alors àune expression encore plus simple de S :

S=h -&- bo;bn~k=O

16. L’algorithme d’interpolation d’Aitken (1932)

Il s’agit d’une procédure ~ encore appelée algorithme de Neville-Aitken ~ destinée au calculd’un polynôme pour une valeur particulière alors que le dit polynôme est connu par (n + 1)points (zk, yk) avec k = 0, 1,2,. . . , n. C’est une méthode directe qui permet d’obtenir donc unevaleur unique du polynôme, en ce sens elle est analogue au polynôme de Lagrange.

Dans ce paragraphe, on désigne par Pp...q le polynôme de degré (Q - p - 1) qui passe par lespoilits (q, yp) . . . (xq, Y~) et par Pp ,... ,fn) ,.._ 4 le polynôme de degré (p ~ q - 2) qui passe par lesPoints (Q, Y~) . . . (xkq, Y~) ’ 1a ‘exception du point (IC,, yT).

Avant même de rentrer dans le cœur du sujet, il est possible d’ores et déjà de remarquer quel’ordre des points ne joue aucun rôle quant à la nature des polynômes.

16.1. Relation de récurrence entre les polynômes P

Entre les polynômes Pp ,... ,4, Pp ,.._ ,tx) ,.__ 4 et Pp ,__. ,tc) ,.._ q il existe la relation de récurrencesuivante :

(x77 - %)Pp,...q =(xc7 - x) pp ,_.. ,(m) )_.. q(x77 -xl p.7J ,..., (0) ,.<< q ;

(6.18)

où, pour plus de clarté, nous précisons que le second membre est un déterminant.La démonstration de cette relation repose sur le fait que, pour une valeur 2, différente de 5,

et x,, on a :

Pp...q(x,) = p (x = Pp ,... ,(cr) ,... q u) p ,___ ;(7T) ,_.. & = yv.

106

Page 103: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L ‘INTER.POLATION

La relation (6.18) peut donc s’écrire :

(Gr - %)YL/ = (2, - G)Yr, - (xc - G)YY, = (Gr - %)Y,.

Pour le cas où 2, = 2,, nous pouvons écrire :

(xx - %)Y, = -(xc ~ %)Y,.

et dans le cas où 2, = CC,, nous obtenons encore l’identité des deux membres de (6.18) :

(2, - %)YY, = 4% ~ %)Y,.

On en conclut que l’égalité (6.18) es une relation qui permet de calculer le polynôme Pp,...;qtde degré (4 ~ p ~ 1) à partir des deux polynômes de degré (4 - p ~ 1) qui sont Pp,.,, J~),.,,~ etPP,... ,(C)>...4.

16.2. Calcul numérique de yp

En faisant usage de la relation (6.18), nous allons calculer le polynôme P”,l,...n pour la valeurx~, cn formant une suite convenable de polynômes intermédiaires Pp,...,CI et Pr,,,..,(,),,,.,. A cepropos nous étudierons deux méthodes, l’une due à Aitken l’autre due à Neville laquelle n’estqu’une modification de la méthode d’ilitken.

a - Méthode d’Aitken - Pour résoudre le problème des polynômes intermédiaires, Aitken aproposé la disposition suivante :

x0 - X/l Y0x0 - Xl 21 ~ 211, y1 Pol

*Xl - 22 x0 - x2 52 ~ xfi Y2 po2 Pol2

5 2 - x3 Xl - X:?l x0 - x3 23 ~ X/l Y3 po3 Pol3 Pol23

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

X,-l - X” . . Xl - xv x0 - xv xv - X/L YV pO n POln P012n P0L.n

À partir de la disposition des yk et des (x, - x0) on va calculer les polynômes Pol, Po2, . , PolLà l’aide de la relation :

poj = (xo 1 xj) [(X0 - xp)yj ~ (xj - xp)yO] avec j = 1,2,3,. . . n

Ensuite on calculera la colonne suivante dans le tableau, c’est-à-dire P012, POIS,. . . , PolrL aumoyen de l’expression :

polj = (xo 1 xj) [(xl - xp)Poj - (xj - x,)Pol] avec j = 1,2,3,. . n.

On procédera ainsi de suite jusqu’a l’obtention de l’élément Po~...,~ qui constitue, en définitive,la valeur recherchée Y~.

Remarque 1 : Pour obtenir une précision optimum, on peut se poser la question de savoirquelle doit être la distribution initiale des points car nous sommes libre de numéroter les pointscomme bon nous semble.

Dans le cas d’une extrapolation, on adoptera l’ordre des points allant du plus près de x, auplus éloigné.

1 0 7

Page 104: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

S’il s’agit d’une interpolation, on choisira une distribution initiale qui correspond à unencadrement du point z, de telle sorte que l’on réalisera la disposition suivante :

. . < 22k < . . . < x2 < x‘, < x, < x1 < 23 < . . . < x‘&+l .

Autrement dit, comme le montre le calcul concernant l’interpolation, ce sont les points lesplus proches voisins de xm qui jouent un rôle prépondérant, donc il convient tout simplementde faire jouer un rôle prioritaire à ces points dans les calculs.

Remarque 2 : Il n’est donc pas nécessaire d’utiliser les points très éloignés de 2, clans le calculde yr,> car ils n’auront que très peu d’influente sur le résultat.

Du reste, si au cours du calcul, on rencontre deux termes Pol...lc et %..NI qui sont chacunle dernier élément de deux lignes consécutives du tableau proposé par Aitken et qui sont égaux« à la précision de la machine », il n’est pas utile de poursuivre les calculs jusqu’à l’obtention

b - Méthode de Neville - Neville a proposé une autre disposition du tableau d’ilitken quiest reportée ci-dessous :

x0 - xp Y0X0 ~ .x1 Xl -xp Y 1 Pol

x0 -x2 x1 - x2 x2-x1, Y 2 fi2 Pola

x0 - x3 X1-Q x2 -x3 x3 ~ xc, Y3 p23 p123 h23

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

x0 - 2, . . . xn-2 -x71 X,-l-X, 2, -211 yn P+I, P012n PO1...1L

16.3. Exemple numérique d’interpolation par la méthode d’Aitken

On se propose d’effectuer une interpolation dans la table suivante :

070 1,000 Y 0

0,5 0,938 514 0,765 21,5 0,5118230 0,223 92,5 -0,048 43,O -0,260 1375 -0,380 1

On reconnaîtra là un extrait de la table de la fonction de Bessel de première espèce Jo(z). Ondésire effectuer l’interpolation pour la valeur x = 1,70. La table donne y = 0,398 0. On trouverasur le Web (*) le programme p-aitken. c réalisant la procédure d’Aitken, lequel fournit pour lavaleur d’interpolation 0,397 97.

*http://www.edpsciences.com/guilpin/

108

Page 105: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L’INTERPOLATION

17. Approximation par une combinaison linéaire de fonctions

Les polynômes de degri: n constituent une première méthode pour approcher une fonction f(z)lorsque nous en connaissons (n + 1) points. Cependant, dans bien des situations concrètes,l’échantillonnage à traiter est obtenu à partir de données expérimentales entachées d’erreur. Ildevient illusoire de vouloir trouver un polynôme passant par chacun des points obtenus, car iln’y a en général aucun intérêt à vouloir rendre compte de l’aspect aléatoire des phénomènesétudiés... Dans ce cas précis, on dispose de considérations à caractère théorique qui permettentde pressentir une fonction ou une combinaison linéaire de fonctions qui passe au voisinage de tousles points d’échantillonnage. Bien entendu, il convient de définir ce qu’on entend par voisinage,mais au préalable, il faut distinguer les types d’approximation que nous venons d’évoquer :soit nous désirons connaître les coefficients figurant dans une certaine fonction, plus ou moinscompliquée, censée rendre compte d’une expérience, soit nous cherchons à déterminer les valeursdes coefficients d’une forme linéaire destinée à «lisser » les points expérimentaux.

Le premier problème est généralement non linéaire et pose un certain nombre des difficultéstechniques sur le plan du calcul numérique. Le second se résout tout naturellement au moyen ducalcul matriciel que nous avons évoqué au début de ce chapitre. C’est cet aspect qui va retenirnotre attention, et nous nous proposons de «passer le plus près possible de tous les points » aumoyen d’une combinaison linéaire de fonctions @j(z) dont le nombre (m + 1) est inférieur (ouégal) au nombre (n + 1) de points.

A priori, il y a bien des moyens de « passer le plus près possible de tous les points », et ilest aisé de subodorer qu’il existe une infinité de solutions au sens mathématique du terme. Àce stade, il est nécessaire de préciser ses désirs, et c’est la méthode des moindres carrés qui seprésente en excellente position pour résoudre le problème. Désignons par :

j=o

notre combinaison linéaire. La méthode des moindres carrés consiste à rendre minimum la formequadratique :

2

CL$&~) - bk .

On dit aussi que l’on rend la somme des carrés des résidus la plus petite possible, car ladifférence &k = ~~=, o3 @j(uk) - bk s’appelle résidu d’observation. La dérivation par rapportaux coefficients (Y, qui rend minimum la forme quadratique donne immédiatement une formelinéaire qui détermine précisément les coefficients oj.

Nous cherchons donc à rendre minimum la quantité :

pour cela on écrit que les m équations s’annulent, soit :

109

Page 106: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

cette dernière expression peut encore se transformer avantageusement de la façon suivante :

C~jCm,(uk)~i(uk)=Cpll(ak)lrk a v e c Z=0,1,2,...,m.j=o k=O k=O

Nous obtenons alors un système linéaire de (m + 1) équations à (m + 1) inconnues dont larésolution nous fournira les coefficients aj.

Remarque : Dans le cas où la fonction f(x) que l’on approche par la fonction O(x) est connueanalytiquement, alors les sommes discrètes sont remplacées par des intégrales sur l’intervalled’interpolation 1. Il s’ensuit que

b

E2 = e2(x) dzs

avec E(X) = f(x) ~ ffJ cyjQj(x).

a j=l

Les coefficients oj sont alors déterminés par les (m + 1) équations suivantes :

b

fI~(x)@~(x) dz -s

$(X)~(Z) dz = 0,

a

avec 1 = 0, 1,2, . . , m. Le calcul de ces intégrales peut être éventuellement conduit numérique-ment dans le cas où les quadratures n’existent pas, ou pour le moins ne sont pas évidentes.

Applications immédiates

a - Il est aisé de rechercher un polynôme de degré strictement inférieur à n qui passe le plusprès possible de tous les points au sens des moindres carrés. Généralement on parle de régressionparabolique au moyen d’un polynôme de degré m ; le cas le plus connu étant le polynôme de degréun qui est encore appelé droite de régression en hommage au travaux de Galton (182221911)qui introduisit cette dénomination à l’occasion d’études statistiques concernant la biologie etl’eugénique.

b - Système linéaire surdéterminé de (m + 1) équations à (n+ 1) inconnues m étant plus grandou égal à n. On écrit le système :

2 UZkxk + (Yk = 0, pour 1 = 0, 1,2,. . . , R.j=o

Sans trop de difficulté on obtient le système des équations normales associé au systèmesurdéterminé de (n + 1) équations à (m + 1) inconnues. Il sulht de remplacer @l(x) par XLdans la relation précédemment établie ; on obtient alors :

xaj xu&ujk = xurr:hk avec 1 = 0, 1,2,. . ,m.j=o k=O j=o

110

Page 107: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

6. L'INTERPOLATION

Il est facile de montrer que si le système linéaire surdéterminé s’écrit au moyen de la notationmatricielle :

AX=b.

A étant une matrice de n lignes et de m colonnes (avec m < n), on obtient le système deséquations normales en effectuant l’opération suivante :

[A~A]X = [A'] b,

expression dans laquelle AT est la matrice transposée de la matrice A. Au passage, on noteraque la matrice obtenue [A'A] est une forme quadratique qui est définie positive ~ la matriceest alors symétrique, ce qui est intéressant lors de la mise au point du programme correspondant.

Sur le Web (*), on trouvera le programme surdeter . c qui réalise cet algorithme lequel fournitun calcul d’erreur au sens statistique du terme : il s’agit de l’écart type de chacune des inconnues.Ce dernier calcul est explicité au chapitre de la régression linéaire.

18. Éléments de bibliographie

A. ANGOT (1972) Compléments de Mathématiques, Éditions Masson.N. BAKHVALOV (1976) Méthodes Numériques, Éditions MIR.J.Ch. FIOROT et P. JEANNIN (1992) C ourbes splines rationnelles, Masson.P. HENRICI (1964) Elements of Numerical Analysis, Wiley.F. HILDEBRAND (1956) Introduction to the numerical analysis, Mc Graw-Hill.R.A. LORENTZ (1992) Multivariate Birkhof interpolation, Springer-Verlag.D. MC CRACKEN et W. DORN (1964) Numerical Methods and Fortran Programming, Wiley.H. MINEUR (1966) Techniques de Calcul Numérique, Éditions Dunod.H. MINEUR (1938) Technique de la méthode des moindres carrés, Éditions Gauthier-Villars.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Dunod.L.A. SAKHNOVICH (1997) Interpolation theory and its applications, Kluwer Academic Publishers.

*http://www.edpsciences.com/guilpin/

1 1 1

Page 108: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7 Les polynômes de Legendre., s Méthode d’intégration

1 de Gauss-Legendre

Ces polynômes sont nés d’une étude que Legendre (1752 1833) entreprit à propos de l’étude del’attraction newtonienne en l/r2. MacLaurin et Clairault (171331765) ont démontré que la figured’équilibre d’une masse fluide en rotation dont les particules s’attirent mutuellement selon la loide Newton est un ellipsoïde de révolution. MacLaurin détermina aussi la valeur de l’attractionexercée par un ellipsoïde homogène sur un point situé en son intérieur et sur sa surface. En 1783,Legendre étendit le calcul de l’attraction exercée sur un point situé à l’extérieur de l’ellipsoïde.La solution repose sur l’introduction d’un ellipsoïde homofocal et d’une fonction génératricedes fameux polynômes de Legendre. Clairaut introduisit le premier la notion de potentiel pource genre de problèmes et en 1785 Laplace montra que le potentiel obéissait à l’équation auxdérivées partielles qui porte aujourd’hui son nom. Les polynômes de Legendre rentrent, commecas particulier, dans la classe des fonctions sphériques introduites par Laplace en 1785.

Aujourd’hui, c’est en électrostatique que l’on se familiarise avec les polynômes de Legendre,mais il faut rappeler que la loi de Coulomb (1736.1806) est postérieure de deux ans à leuravènement.

Nous connaissons l’intérêt qu’il y a de définir une base (complète) de fonctions orthogonalesdans le problème d’approximation de fonctions par des combinaisons linéaires. Les polynômes deLegendre ont la propriété d’être orthogonaux et de constituer un système complet sur (-1, +l)pour les fonctions généralement continues, ainsi s’ils sont utilisés comme base de décomposition,les coefficients de la combinaison linéaire ne sont pas corrélés, c’est-à-dire qu’ils sont calculés unefois pour toutes, comme le sont les coefficients des séries de Fourier avec lesquels nous sommesdavantage familiarisés.

Les polynômes de Legendre ont connu rapidement une autre fortune entre les mains de Gauss(1777-1855) qui a utilisé leur propriété d’orthogonalité en proposant une méthode d’intégrationnumérique particulièrement précise. La technique opératoire est d’une très grande simplicité, enrevanche, l’établissement des relations exige quelques calculs, et c’est le but de ce chapitre quede proposer les enchaînements mathématiques propres à éclairer la méthode.

1. Les polynômes de Legendre

1.1. Définition

Les polynômes de Legendre sont des polynômes orthogonaux sur l’intervalle fondamental(-1, +l) qui prennent la valeur +l pour la valeur +l de la variable.

1 1 3

Page 109: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Designons par P,(x) le polynôme de Legendre de degré n, la définition impose que :

+1

J P,(s)P,(x) dz = 0

-1

(7.1)

si P,(s) est le polynôme de Legendre de degré m tel que m # n.Si l’on remarque qu’un polynôme quelconque Q,(x) de degré p peut s’exprimer selon une com-

binaison linéaire de polynômes de Legendre de degré égal et inférieur à p (cf. paragraphe 1.14))alors, pour p < n on aura également :

+1

J P,(x)Qp(x) dz = 0.

-1

(7.2)

Cette dernière relation va nous permettre d’exprimer les polynômes de Legendre d’une autrefaçon en procédant à une intégration par parties. Pour cela, on posera :

où Rs%(z) est un polynôme de degré 2n que nous allons déterminer. On obtient alors :

+1

Jpnm Q,(x) dz = [Q,(x)~R~,,(x)-1

Il convient de remarquer que le polynôme Rzn(x) est défini à un polynôme de degré (n - 1)près ; autrement dit, il nous est possible de choisir arbitrairement n constantes définissant &(z),et l’on peut par conséquent convenir que les (n- 1) premières dérivées de F&(x) ainsi que &(z)s’annulent pour z = -1. Cela nous conduit à écrire que :

cependant pour que l’intégrale (7.2) soit nulle, il faut encore que :

Cette condition ne peut être satisfaite, quel que soit le polynôme arbitraire Qp(x), que lorsqueRzn(x) et ses (n ~ 1) premières dérivées s’annulent pour z = 1.

À présent nous avons imposé n conditions au polynôme Rzn(x) ; il reste cependant défini à uneconstante multiplicative près que l’on désigne par K. On peut donc l’exprimer sous la forme :

Rz,(x) = K(z - 1)7L(z + 1)” = K(x2 - 1)“.

Il y a plusieurs façons « canoniques B de choisir K. On peut adopter les polynômes orthonor-més, on peut préférer la condition P,(l) = 1, mais l’on peut tout aussi bien s’intéresser auxpolynômes à coefficient principal réduit, c’est-à-dire ceux dont le coefficient du terme de degré

1 1 4

Page 110: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES POLYNÔMESDE LEGENDRE

le plus élevé est égal à un. Cela est une affaire de circonstances et nous aurons l’occasion derevenir sur ce point. Quoi qu’il en soit, puisque

on peut calculer K au moyen de la formule de Leibnitz (1646.-1716) qui fournit l’expression dela dérivée ne d’un produit (u. w) :

dn(uv) d”u d+‘Ju dqvdz”

~w~+...c~~~ d”vdz” dxn-q ,jxq + ’ ’ ’ + Ud2n’

il suffit de poser u = (x - l)n et w = (x + l)n pour obtenir la valeur de K. En effet, pour x = 1,tous les termes sont nuls sauf le premier et l’on obtient alors :

P,(l) = 1 = KW& = Kn!2’”

ce qui donne :

1K=---

2%! 2 .4 .6?. . (an) ’

et l’on obtient alors l’expression générale des polynômes de Legendre connue sous le nom deformule de Rodriguès (1815) :

P,(x) = L- xd” (2”n! dz”

2 - 1)“.

On déduit sans peine les premiers polynômes :

P()(x) = 1

PI(X) = x

P2(x) = (322 - 1)/2. .

1.2. Relation de récurrence entre trois polynômes consécutifs

Nous allons montrer qu’il existe une relation de récurrence entre trois polynômes consécutifsP,+I(x), p,(x) et P+I(~). P o u r cela partons de la formule de Rodriguès (1794-1851) écritepour le degré (n + 1) :

1 1---xpn+l(x) = 2"+l(n+ l)! &n+l

C+l ( 2_qn+l.

On dérive une fois l’expression (x2 - l)n+1, et l’on obtient :

P,+1(x) = &&$ {x(x2 - l)"}

On peut encore écrire :

PTL+1(x) = &$S {(x2 - l)n + 2nx2(x2 ~ 1),-l}

115

Page 111: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

puis on ajoute et l’on retranche 2n(x2 - I)+l dans la dérivée du second terme :

[(x2 - 1)” + 2nz2(22 - qn-l - 2n(22 - q-1 + 2+? - 1,-l]

_ 1 1 dl’-’2” n! dZnpl

[(2n + 1)(x2 - 1)” + 2n(22 ~ l)+r] ,

soit encore :

Pn+l(S) = ;;s [(2n + 1)(X2 - V] +Pn-l(x).

Calculons le premier terme du second membre en utilisant la relation découlant de la règle deLeibnitz, cette quantité est égale à :

En définitive, il vient :

On aboutit finalement à la relation de récurrence désirée :

(n + l)P,+i(z) - (2n + ~)CEP~~,(X) + nP,-l(2) = 0. (7.4)Cette expression jointe à Pc(x) = 1 et Pr(x) = z permet donc de calculer aisément tous les

coefficients dc chaque polynôme de Legendre F’,(X) quel que soit n.

1.3. Relations de récurrence faisant intervenir des dérivées

Dérivons la formule de Rodriguès par rapport à 2, cela donne :

soit encore, en utilisant la relation de Leibnitz :

PA(,) = 112+l (n - l)! {

x&+nS} (x2 - l)+l,

d’où une première relation de récurrence entre polynômes et dérivées :

PA(x) = xP;L-l(x) + nP,-l(Z).

La relation (7.5) peut encore s’écrire

(n + l)Pn+l(~) = (n + 1) {taper + (n + l)P,(z)}

D’autre part, la dérivation de la relation de récurrence (7.4) donne :

(n + l)Pn+l(z) = (2n + l)PTL(x) + (2n + l)zPA(z) - nPAel(z).

(7.5)

La soustraction de ces deux dernières expressions conduit à la seconde relation de récurrenceentre les polynômes et les dérivées :

nP,(z) = xPn(c7~) - PApl(x) avec n # 0. (7.6)Ces deux dernières formules sont utiles dans le cadre de l’étude de la méthode d’intégration

de Gauss-Legendre.

116

Page 112: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES poLmvônnm DE LEGENDRE

1.4. Équation différentielle dont les P,(x) sont solutions

Derivons une fois par rapport à z la première relation de récurrence (7.5) faisant intervenir lesdérivées :

ai = %(x, + .P;L(x) + nqpl(x) = (7-L + l)P;),-,(x) + xP;p,(x).De même, la dérivation de la relation (7.6) donne :

,P&) = xP:L(x) + PA(x) ~ P:I-l(X),

d’où l’on tire :

Éliminons Pl’l(x) entre ces deux relations :

P;;(x) = (n ~ l)P;-,(x) + 2 {xly(x) - (n ~ l)P;(x)}

R.este à éliminer PAPI (x) l’aide de la relation (7.6) :\

Cette expression ne dépend plus que de F’,(x) et de ses deux premières dérivées :

, (1 - .“)P;>;(z) - 2zI374 + n(n + l)P,,(z) = 0. (7.7)

Cette dernière relation est vraie quel que soit TZ, c’est une équation diffkrentiellc linéaire duI deuxième ordre appelée équation différentielle de Legendre.1I

1.5. Propriétés des racines des polynômes de Legendre

tUn théorème permet d’affirmer que les zéros de chaque polynôme de Legendre sont simples.

Revenons à la fonction I&(Z) = K(z2 ~ 1)“. Elle possède 2n racines égales à -1 et +l. Le

l théorème de Rolle montre que Ri,,(z) a une racine réelle entre -1 et +l, et l’on peut ajouterque cette fonction a (n - 1) racines égales à -1 et (n - 1) racines égales à +l. En poursuivant

/ le calcul jusqu’à la dérivée n ième, on voit que R&)(z) est un polynôme de degré n. qui possède

/n racines réelles comprises entre -1 et +l. Ce sont, en vertu de la formule de Rodriguès, les

,racines de P,(z).

1/ 1.6. Norme des polynômes de LegendreI, Calculons à présent l’expression :

+1 +1

J =J

P;(x) dz = K” J $(x2 ~ 1)+$x’ - l),’ dx1

avec K = ~2%!

-1 -1

Posons

du = $x2 - 1)” dz e t w=

/ 117

Page 113: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUE

puis intégrons par parties ce qui donne :

Le premier terme à l’intérieur du crochet est nul puisque -1 et fl sont racines, et dc proche enproche on obtient :

J = K2(-1)” +;J:’ - 1)“s jr” - 1)” dz..i’-1

Comme (x2 - 1)” est un polynôme de degré 2n (à coefficient principal réduit) que l’on dérive2n fois, le résultat est une constante qui vaut (2n)!. Alors, J prend l’expression suivante :

+1J = (-l)nK2(2n)!

s(x2 ~ 1)” dz.

-1

Il n’est pas très difficile de calculer cette dernière intégrale, pour cela on pose :

+1

L =J’

(x2 - 1)” dz,

-1

expression que l’on intègre par parties. Il suffit d’écrire :

u = (2 - l),, et donc du = 2x dxn(x2 ~ l)n-l:

ainsi que du = dx et v = x ; on obtient alors :

+1

L = [~(CC’ ~ l)‘“]:: - 2nJ’

z”(z” - l)nP1 dz.

-1

La première quantité (toute intégrée) a une valeur nulle. Une autre intégration par partiespermet d’écrire :

+1

L = tn(n - 1)2s

X”(X” - 1)+2 dz.

-1

On poursuit ainsi de suite les calculs et, en notant par E le signe que l’on déterminera plus tard,on arrive à l’expression :

+1

L = c2ni2(n - 1);2(n - 2). . &2(1) 1 x2np2(z2 - l)l dz,

-1

qui conduit à l’expression suivante :

L=E2.4.6...2n 2.

1 . 3 . 5.. . (2n + 1)

1 1 8

Page 114: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES POLYNÔMES DE LEGENDRE

Le problème du signe E que nous avons délibérément abandonné se trouve résolu en remarquantque (CC” ~ l)n est une fonction qui a le signe de (-1)” sur l’intervalle (-1, +l) ainsi L s’écrit :

L = (-1)"2.4.6...2n

1 .3. 5.. . (2n + 1)2 .

Ensuite, nous pouvons écrire :

J = (2n)! 1yÏ2’“-11.3.5 . .t (2n + 1) = (2n+ 1) .

En définitive, on obtient le résultat suivant :+1s c%-4 dz = (2n+ 1)-1

(7.8)

1.7. Les premiers polynômes de Legendre

P”(X) = 1

PI(X) = 5

P2(x) = (322 - 1)/2

PS(z) = (52” - 3x)/2

P4(2) = (35x4 - 30x2 + 3)/8

PS(z) = (63~” - 702” + 15x)/8

P6(z) = (231x6 - 315x4 + 105x2 - 5)/16

&(Cc) = (42927 - 693x” + 3152” ~ 35x)/16.

1.8. Calcul des coefficients des polynômes de Legendre

À l’aide de la relation de récurrence (7.4), de Pc(x) et de Pi(x), on peut calculer les coefficientsselon les puissances croissantes ou décroissantes de la variable 2 des k premiers polynômes deLegendre. Dans le cas où l’on utilise un calculateur arithmétique, pour des raisons d’économiede place mémoire, on entasse tous les coefficients des polynômes les uns à la suite des autresdans un tableau unique à une seule dimension.

On trouvera sur le Web(*) 1 e programme legendre. c permettant de calculer ces coefficients.

1.9. Variantes concernant les polynômes de Legendre

Il n’est pas bien difficile de reprendre cette étude en changeant l’intervalle fondamental (-1, +l)qui est remplacé par l’intervalle fini (a, b). Rien d’essentiel n’est changé pourvu que a et b restentfinis. Il est courant de définir d’autres polynômes de Legendre sur l’intervalle (0, l), et ils sontappelés parfois polynômes de Legendre modifiés. On les rencontre lors de problèmes de lissagesur l’intervalle de définition (0,l). On en trouve une application intéressante lors du calcul dediagrammes de phase.

*http://www.edpsciences.com/guilpin/

119

Page 115: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.10. Une propriété importante des polynômes de Legendre

Par definition, on dit qu’un polynôme de degré n est à coefficient principal réduit lorsque lecoefficient du terme de degri: n est égal à l’unité. Cette notion sert essentiellement à comparerles polynômes de degré 71 entre eux, sinon ils seraient dcfinis à une constante multiplicative prèsqui ne permettrait plus de comparaison.

Théorème - Parmi tous les polynômes de degré rl à coefficient principal réduit, celui dont lanorme, évaluée sur l’intervalle (-1, fl), est la plus petite est le polynôme de Legendre, la normeenvisagée étant ccllc du produit scalaire (la fonction poids ctant égale à l’unité).

Désignons par G,,(s) un polynôme répondant à la question et décomposons-le selon unecombinaison linéaire de polynômes de Legendre, opération torijours possible. On note par unastérisque les polynômes de Legcndre à coefficient principal réduit et l’on écrit par conséquent :

Gn(x) = P;(x) + &P;ek(x).k=l

où les c~k sont des coefficients constants. La norme de G,(z) s’écrit :

N[G,(x)] = Il[,,: + $wcP;~k(x)]2 dn:-1 !+=l

Soit encore :

Ce second membre est minimum lorsque tous les o5k sont égaux à zéro. Il s’ensuit que N[G,, (z)]est minimum quand G,,(X) = PG (x) , ce qui démontre le théorème.

1.11. Fonction génératrice des polynômes de Legendre

Nous admettrons le résultat suivant sans démonstration :

1

2/1- 2hx + h2= ~O(Z) + hPl(x) + h2P2(z) + . . + hTLP,<,(x) + .

ainsi que cette autre expression :

1.12. Décomposition d’une fonction f(x) en série de polynômes de Legendre

On considère une fonction f(x) continue sur l’intervalle (-1, +l) ou éventuellement ayant despoints dc discontinuiti: dc première espèce CII quantité dénombrable. D’une façon tout à faitanalogue a l’analyse de Fourier, on se propose dc rechercher un dcvcloppernent de f(x) sousforme d’une combinaison linéaire de polynômes de Legendre :

Page 116: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES POLYNÔMES DE LEGENDRE

En multipliant chacun des membres par &(x) puis en integrant sur l’intervalle (-1, fl), onobtient :

+1

s

+l ccf(x)Pk(x) dz =

sc aTLPIL(x)Pk(x) dz.

-1 p1 7z=o

Soit encore :

+1

/ ~(X&.(X) dx = c a, ri:, (x)%(x) dz,

-1 n=O p1

et compte tenu des relations d’orthogonalité :

+1f(x)&(x) dz = ak

sPk(x)Pk(x) dz = CL~&,

-1

ce qui donne :

+12k + 1

Uk =2 J’

f(x)&(x) dz.

En toute rigueur, il faudrait justifier l’égalité entre f(x) et son développement selon une étudeanalogue à celle effectuée à propos des séries de Fourier : il faudrait associer la série à la fonctionf(x) et déterminer à quelles conditions l’égalité peut être obtenue.

1.13. Décomposition d’un polynôme quelconque en polynômes de Legendre

Considérons un polynôme quelconque dc dcgri: n :

QyL(x) = ~u,:xnmk avec ao # 0.k=O

que l’on se propose de décomposer sur la base des polynômes orthogonaux de Legendre l’,(x)que l’on écrit :

Le principe de la décomposition est tres simple, il suffit de remarquer que lc polynôme

est un polynôme de degré n ~ 1, dkignons-le par II+~(X). Ses coefficients sont donnés par :

Page 117: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Il n’y a pas de difficulté à calculer les coefficients /?, donc à partir de ce moment nous sommesramené au problème précédent à cette différence près que les polynômes mis en jeu ont perduun degré : nous sommes passé du degré n au degré (n ~ 1). Par ce procédé, nous arriveronsau degré zéro, et il est très aisé d’effectuer cette décomposition en calcul automatique, et l’ontrouvera sur le Web (*) le programme dcomleg. c réalisant cet algorithme.

1.14. Calcul de ~lx”P,ddx-1

On peut toujours décomposer xn en polynômes de Legendre selon la manière qui vient d’êtredécrite, on obtient :

et comme :

on peut écrire sous la forme :

Il est aisé de déduire :

en tenant compte des relations d’orthogonalité. Cette relation est utile lors de l’étude de laméthode d’intégration de Gauss.

2. Méthode d’intégration de Gauss-Legendre

2.1. Position du problème

On se propose de calculer numériquement l’intégrale :

b

1 = F(t) dts

(7.9)

lorsque cellc-ci, bien entendu, a un sens et que les bornes d’intégration a, et b demeurent finies,en outre F(t) ne comporte pas de singularités notamment aux bornes du domaine d’intégrationc’est-à-dire en a et b. Avant d’entamer ce calcul, remarquons que le changement de variable :

a+b b - atz-2 +yz

*http://www.edpsciences.com/guilpin/

122

Page 118: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES PoLmôMEs DE LEGENDRE

ramène le domaine d’intégration à l’intervalle fondamental (-1, +l), ce qui donne :

I=],.(,,d~=~~(z)dz.

a -1

La méthode de Gauss pour évaluer numériquement l’intégrale 1 consiste à :

a. adopter pour valeur approchée de 1 l’expression suivante :

(7.10)

(7.11)

b. choisir un critère pour déterminer les zk et les Hk.

L’examen de la formule (7.11) montre qu’il y a (n + 1) valeurs zk: à déterminer ainsi queles (n + 1) valeurs Hk qui leur correspondent. Pour obtenir ces valeurs, on retient commecritère l’égalité rigoureuse des expressions (7.10) et (7.11) dans le cas particulier où f(z) est unpolynôme, et on fera en sorte que le degré du polynôme soit le plus élevé possible pour n fixéarbitrairement (n figure dans la relation (7.11)). C o m m e il y a 2(72 + 1) coefficients arbitraires,le polynôme sera au plus de degré (2n + 1).

Dans le cas général où f(z) n’est pas un polynôme, on peut espérer une bonne approximationen vertu du théorème de Weierstrass selon lequel toute fonction continue sur un compact (a, b)peut être approchée uniformément par un polynôme. Bien sûr, le théorème de Weierstrassest très postérieur à la méthode de Gauss un petit siècle les sépare ~ néanmoins on peutremarquer que, dans le cas où f(z) est continue et possède des dérivées successives continuessur le compact (a, b), le développement en série de Taylor montre que f(z) peut se développerselon un polynôrne de degré n, à une approximation près qui est donnée par le reste de la formulede Lagrange. Quoi qu’il en soit, un calcul d’erreur fondé sur cette remarque viendra apportertous les éclaircissements utiles.

On trouvera à la page 46 de l’ouvrage de Crouzeix et Mignot cité en bibliographie ladémonstration de l’unicité d’une telle formule d’approximation qui vaut pour toutes les méthodesde Gauss que l’on va rencontrer par la suite.

2.2. Calcul des abscisses xk

Supposons que f(z) soit un polynôme Qn (z) de degré n. Ce polynôme peut torrjours s’exprimerau moyen d’une combinaison linéaire unique de polynômes de Legendre de degré égal et inférieurà n. Soit :

n

expression dans laquelle PJ (x) est le polynôme de Legendre de degré j et Aj le coefficientnumérique de la décomposition. En vertu des relations d’orthogonalité, nous pouvons écrire :

+1

M = s Qn,(x)Pn+l(x) dx = J!Pn+l(x) 2 AjPj(x) dz = 2 A, /:i:,+r (X)I”(x) dz = 0.

-1 -1 j=o j=o -1

1 2 3

Page 119: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

En introduisant la relation (7. Il), nous obtenons l’expression suivante :

Comme cette relation doit être vérifiée quel que soit le polynôme Qn(z), de degré éga,l ouinfcrieur à n, et comme par ailleurs les Hk. ne peuvent être nuls sinon lc nombre des abscisseszk s’abaisserait, on en conclut neccssairement que Pn+i(zj) est nul. Il s’ensuit que les xk sontles (n + 1) racines du polynôme de Legendre de degré (n + 1). À ce propos, nous savons quetoutes les racines dc P,+l (zr) sont réelles, distinctes et comprises dans l’intervalle (-1, +l).

Remarque 1 : Avant dc poursuivre plus avant les calculs, d’ores et déjà, il est possible de voirque la précision de la méthode de Gauss sera d’autant plus grande que le polynôme Qn(z) quiapproche la fonction f(x) sera de degré plus élevé.Remarque 2 : Puisque t,outes les racines de tous les polynômes de Legendrc appartiennent àl’intervalle (-1, +l), la rnéthode de Bairstow va se réveler particulièrement pratique et efficacepour obtenir les valeurs numériques des racines.Remarque 9 : Il est important de constater que les valeurs x1, ne dépendent pas de la fonctionà intégrer et sont donc des constantes universelles, elles pourront être rentrées une fois pourtoute dans un calculateur.

2.3. Calcul numérique des racines xk des premiers polynômes

À l’aide de la méthode de Bairstow, nous allons calculer les racines des k premiers polynômes deLegendre. Comme ces valeurs sont universelles, il est bon de les obtenir avec une bonne précision,ne serait-ce que pour les employer lors de calculs réalisés sur les petites machines portatives.Bien entendu: si l’on dispose d’une possibilité d’effectuer les calculs en double précision, il estrecommandé de l’utiliser. On a reporté sur le tableau 7.3, page 131, les valeurs numériques desracines du polynôme de degré 13. Cette limitation est due au fait que seulement 16 chiffressignificatifs ont éte utilisés et qu’il en faut davantage pour calculer les racines des polynômes dedegré supericur à 13.

2.4. Calcul des coefficients Hk

Puisque le polynôme dc Legendre P,+l (z) ne possède que des racines réelles et simples, nouspouvons l’exprimer en fonction directe d’un produit de monômes :

P,+1(2) = UO,n+l fi(X - Xj)j==O

UO,~~+~ étant le coeflicient du terme de degré le plus élevé dans le développement de P,+r(z). Àprésent considerons le polynôme QTL~(z) de degré n, ainsi défini :

Puisque l’expression (7.11) doit donner une valeur exacte de l’intégrale de QTLk (z), nous pouvonsécrire :

(7.13)

124

Page 120: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES PoLmôMEs DE LEGENDRE

Le second membre a toutes ses sommes nulles sauf une seule lorsque j = k. Nous obtenons :

+1

L =s

Qnk(x) dx = ao,n+lHlc fi@, ~ xi) = HkQnk(a),-1 ifk

i=o

expression à partir de laquelle on tire :

+1

Hk = Qnk;xk)el Q,uk(x) dz.s

Une expression de Qnk(xk) plus commode à exploiter est souhaitable, et pour cela calculons ladérivée de P,+i(s) ; nous avons :

et pour x = xk nous obtenons :

p;+dxk) = aO,n+l fibc - xi) = &nk(xrc).i=oijk

L’expression (7.13) se transforme alors en une expression ne faisant intervenir que le polynômede Legendre de degré (n + 1) ainsi que son polynôme dérivé :

L = HkP;+l(xk) = ~

- 1

Cette dernière expression permet en principe de calculer les coefficients Hh qui ne dépendentque des polynômes de Legendre et de leurs zéros. Insistons sur le fait qu’ils ne dépendent pas dela fonction dont on cherche à calculer l’intégrale de façon approchée. On obtient en définitive :

Hk =1

~A+1(4 ~ .-1

(7.14)

Nous allons procéder à la transformation de l’expression (7.14) qui n’est pas encore d’unemploi très commode. Pour ce faire, considérons l’expression suivante :

+1

s

P,+~(~) pn(x) - pn(xk) dz

x - xk-1

On voit immédiatement que (x - xk) est une racine de p,(x) - P, (xk) et que par conséquent[p,(x)-P7L(xk)]/(x-xIc) est un polynôme de degré (n-l). E n vertu de la relation d’orthogonalitéet du théorème de décomposition, l’intégrale (7.15) es nulle. Développons cette expression :t

dz - P,(xk)J’+lP,+l(x) dz.~

x - xk- 1

(7.16)

125

Page 121: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Évaluons le premier terme :

Comme P,+i(s) admet un développement du genre :

P,+1(x) = u”,n+lxn+l + qn+llCn + . . + arr+1.n+1

et comme d’autre part xk: est une racine du polynôme, on peut écrire :

Pn+l(X) = (x - xk)(h~,ll+lxn + h.n+lxn-1

+ . . . + h7,,+1),

par identification, on note que :

ao.,<,+ = h.n+l.

En tenant compte des relations d’orthogonalité, T s’exprime alors de la façon suivante :

+1

T =J’

ao n+l 2uO,n+lxnl?&) d z = A -

n~.~ 2n + 1- 1

En revenant à l’expression (7.16), on peut alors écrire :

+1.I’- 1

en remplaqant dans l’expression (7.14), on obtient :

1 1 ao,,+ 2

~20,~ 2n + 1

La relation de récurrence entre trois polynômes consécutifs permet d’obtenir directement~,~+~/a~,~~ en identifiant les termes de degré (n + 1) ; on obtient la valeur (2n + l)/(n + 1). Endéfinitive, Hk prend mie forme très simple :

Hk =1 1 2

P;+l(xk) P,,(Q) n + 1(7.17)

Il existe une autre forme de HI, très utile à connaître parce que très facile d’emploi. ÉliminonsCl( 1 t , 1x en re es relations de récurrence (7.13) et (7.14) ; on obtient :

(1 -~“)I?n(x) ~ nP+,(x) -~XE&(X) = 0.

R,emplaçons n par (n + 1) et x par xk: dans cette expression, nous obtenons :

(1 ~ x,~)pL,+~(xk) = (n + lR(xk).

Il suffit de reporter la valeur de (n + l)P,(zk) d ans la relation (7.17) pour écrire :

(7.18)

126

Page 122: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES Pow.vôms DE LEGENDRE

Cette formule est d’un emploi plus intéressant que la relation (7.17) non seulement sur le plande la programmation mais aussi sur le plan du temps de calcul.

Il n’y a pas de difficulté particulière pour obtenir ces valeurs numériques dans la mesure oùles coefficients des polynômes ainsi que les racines ont été convenablement placés dans un oudes fichiers.

On trouvera sur le Web (*) 1 e programme r-legend. c calculant les Hk.

2.5. Retour sur le calcul de l’intégrale définie sur (a, b)

Nous avons montré que le changement de variable :

b+a b - uy=T+-x2

nous ramène à l’intervalle (- 1, +l) Par conséquent ~ il suffit alors dc calculer :

b+a+b-nYk = ~2

-Xk.2

Les HI, n’étant pas modifiés, on peut écrire les deux relations :

1 = q 2 H#(yk) = c Hd(a)k=O k=O

Le cas des intégrales continues par morceaux ~ c’est-à-dire présentant des discontinuités depremière espèce ~ est justiciable de la méthode de Gauss : on calcule autant d’intégrales qu’ily a d’intervalles sur lesquels la fonction est continue, et chacune des intégrales se ramène au casqui vient d’être présenté.

2.6. Calcul de l’erreur commise lors de l’approximation

Supposons que f(x) soit une fonction continûment différentiablc sur l’intervalle fini (canonique)(- 1, + 1). Le développement de Taylor-MacLaurin à l’ordre (2n + 1) nous donne :

f ( x ) = f ( 0 ) + $(O) + $(O> + . . + (2;2;;)j f’““+“(o) +

,p+2

(2n + 2)!p+2)(<)

expression dans laquelle J: et < appartiennent à l’intervalle (-1, +l).Intégrons terme à terme cette expression, on obtient :

+1I =

sf(x) dz = 2 f ( 0 ) + ;f”(O) + . + (2m; ,),f”“(O) +‘.‘+ (2&!

-1

On remarque que toutes les dérivecs d’ordre impair disparaissent lors de l’intégration.L’exploitation directe dc la relation (7.11) donne :

J-f(0)~H~+T~H~x*+f’(O) n f ” ( 0 ) 7’2! c H~Z:.

k=O k=O k=O

+...+

f(24 (0) n.c Hkxp + . . . + ;;;+)j;/ $ Hkxp+l + f’2”+“‘(E) 2 I&X~+~.m!

k:=O k - 0 (212 + 2)! k=”

*http://www.edpsciences.com/guilpin/

127

Page 123: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Si f(x) est un polynôme de degré (2n + 1); la dérivée de S(x) d’ordre (2n + 2) est nulle, et l’ona l’egalité :

I = .J.

Dans ce cas il n’y a pas d’erreur mathématique due à une approximation; on obtient enconséquence le système suivant : 71

c Hk = 2k=O

5 Hkxk = 0k=O

k=O

. . . . . . . . . . . .

n

c h-1Hkxk =0k=Or,,c

2Hkx;m = ~

k=O2mtl

z?L+l _HkXk - 0, (7.19)

k=O

expressions dans lesquelles les sommations s’effectuent pour k variant de 0 à n.Il est intéressant de constater que le système de (2n + 2) équations ainsi défini est constitué

de (2n + 2) équations non linéaires dans la mesure où l’on considère que les Hk et les X~C sont lesinconnues. En revanche, si l’on connaît les xk, alors, (n + 1) équations quelconques prises dansle système précédent constituent un système linéaire permettant de calculer les Hk.

Toujours est-il que l’erreur prend la forme suivante :

I - J = , (7.20)

en prenant soin de remarquer que :

2n+2 2&XA. # ~

k=O2n + 3

Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnablepossible de la fonction f (an+2)(<) dans l’intervalle (-1, +l), en définitive, l’erreur s’exprime dela manière suivante :

JJzn+2

i

‘TL

Ez (2n+2)!)-----c 12n:3 k=nHkxk’L+2J

(7.21)

où M27,,+2 = sup 1 f(2n+2) (x) /p our x appartenant à (-1, +l).

128

Page 124: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LESPOLYNÔMESDE LEGENDRE

Dans la mesure où l’on peut obtenir une majoration Mzn+2, E donne l’erreur mathématiqueliée à la troncature de la série des polynômes de Legendre. Viendront s’ajouter lors des calculseffectifs les inévitables erreurs d’arrondi propagées par l’exécution des opérations.

Bien qu’elle soit très intéressante, cette expression n’est pas d’un emploi très commode dansla mesure où figure une dérivée d’ordre (2n. + 2). Le calcul devient très souvent arborescent etrapidement inextricable, quand à la majoration, elle risque de devenir catastrophique dans lamesure où elle est très surestimée.

Table des valeurs numériques de 77 ={& - z’& H~x:~‘~

>- Les valeurs du tableau 7.1,

sont directement tirées du du fichier Legendre.txt sur le Web (*) où figurent les racines et lespoids associés des premiers polynômes de Legendre.

Tableau 7.1.

Degré Erreurdu polynôme mathématique

2 0,177 7783 0,457 143 10-l4 0,116 100 10-r5 0,293 181 10F26 0,738 079 1OV”7 0,185 466 lO-”8 0,465 483 10-49 0,116 731 lO-”

1 0 0,292 559 10-”11 0,732 912 10-”1 2 0,183 0547 10-”1 3 0,459 546 10C7

2.7. Un exemple numérique, comparaison avec d’autres méthodes

Nous avons choisi un exemple dont on connaît directement le résultat par quadratures :

+1rlog(l+2)ds+

0

Voici les résultats obtenus par la méthode de Gauss, la méthode des trapèzes et la méthodede Simpson.

a - Méthode de Gaoss

5 points : I = 0,249 999 996

6 points : I = 0,249 999 999 9 0 9

*http://www.edpsciences.com/guilpin/

1 2 9

Page 125: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Méthode des trapèzes et méthode de Simpson - En 6 points la méthode de Gauss estun peu plus précise que la méthode de Simpson en 100 points... tandis qu’il faut 40 points àla méthode de Simpson pour obtenir une précision analogue à celle de la methode de Gauss en5 points.

Méthode des trapèzes

0,250 2480,250 0620,250 0270,250 009 9

Tableau 7.2.

Méthode de Simpson

0,250 000 0860,250 000 005 40,250 000 001070,250 000 000 138

Nbre de points

20406 0100

c - Calcul de l’erreur concernant l’exemple - Par chance, le calcul de la dérivée ne de.r log( 1 + z) est relativement aisé, et l’on peut montrer que :

[zlog(l + ~)]‘“’ = (-l)TL(n ;12;r,! n,

Effectuons le calcul d’erreur pour 6 points :

E= $ ;-&&z; = 7,38110-‘$. Ici; Mi2 =10!(2 + 12)

h=O 2i2( 1 + ,y

car nous avons dû effectuer un changement de variable 2 =1 12 + Zt pour nous ramener à

1 2

l’intervalle canonique (-1, +l). Alors nous pouvons écrire : dz/ dt = 1/2 eti >g = A.

b-u 1Rappelons que, avec l’écriture choisie, 2 appartient toujours à (0, l), et que 2 = 2.

Mi2 est une fonction monotone décroissante dans l’intervalle (0, l), elle est maximum pour

z = 0. Doncb - u 12!TMi, est plus petit ou égal à 11 x 2 x 2ia.

On tire une valeur de E :

E = 7,381 10p4- 0,8 1oP.

11 x 8192 -

On s’aperçoit que l’erreur E est environ 100 fois plus grande que l’erreur observée directement ;cela est dû à la majoration de la fonction Mi2. En II: = 0; la dérivée est 3780 fois plus petitequ’au point x = 1. On en conclut que l’erreur est comprise entre 2 10-12 et 0,8 10-s. L’évaluationdirecte de l’erreur se situe bien dans ce créneau puisqu’elle est de l’ordre de 10-r’ et cet exemplemontre bien combien la majoration d’une dérivée d’ordre n peut être pénalisante pour un calculd’erreur.

Remarque : Pour utiliser aisément la méthode de Gauss, il suffit de fabriquer un sous-prograrnme dans lequel on rentre une fois pour toutes les racines et les poids du polynôme

130

Page 126: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

7. LES POLYNÔMES DE LEGENDRE

Degré

Tableau 7.3. Racines et poids associés des polynômes de Legendre.

Racines x Poids Hk

1

1 3

(40 0 232551553230874ho,23045831595513 0~226283180262897*0,44849275103645 0,2078160475368810,64234933944033 0,17814598076194f0,801578 090 733 3 0,138873510 2198f0,917598399223 0,0921214998377ho,9841830547185 0,040484004765

de degré 12 ou 13 (ensuite, des problèmes de précision apparaissent avec des représentations sur16 chiffres significatifs et des racines complexes apparaissent...) ; il suffit d’ailleurs de rentrer 6racines et 6 poids associés à cause des symétries, les racines sont deux à deux opposees.

On donne sur le Web (*) un fichier texte appelé legendre. txt où l’on trouvera les racines etles poids des treize premiers polynômes de Legendre.

2.8. Éléments de bibliographie

A. ANGOT (1965) Compléments de Muthémutiques, Éditions dc la Revue d’optique.M. CROUZEIX et A.L. MIGNOT (1984) Anulyse numérique des equations diffkentielles, Éditions

Masson.F. HILDEBRAND (1956) Introduction, to the numericul analysis, Mc Graw-Hill.H.N. MHASKAR (1996) Introduction to the theory of weighted polynomial approximation,, World

Scientific.H. MINEUR (1966) Techniques de Calcul Numérique, Éditions Dunod.A. RALSTON et H.S. W ILF (1965) M’ th de o es mathémat iques pour ca lcu la teurs arith,métiques,

Dunod.

*http://www.edpsciences.com/guilpin/

1 3 1

Page 127: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

8 Les polynômes de Tchebycheff.Application à la méthodede Gauss-Tchebycheff

1. Les polynômes de Tchebycheff (1821-1894)

1.1. Première définition

La relation de definition des polynômes de Tchebycheff est donnée par l’expression suivante :

T;(x) = cos(n arccosx) (8.1)

ce qui implique que :

TO(x) = 1 e t TF(z) = 2.

Ils obéissent à une relation dc rccurrence que nous allons établir. Pour cela, il suffit de posery = arccos z, on obtient :

Tr; (x) = COS ny.

Écrivons T~~+,(x) et T:-,( x P P ec uons-en la somme :) t ff t

T;+,(x) = cos(n + 1)y = COS ny cas y - sin rby sin y;

T,L-i(2) = cos(n - 1)y = cosnycosy + sinnysiny,

T,L+,(x) + T,T-,(x) = 2cosnycosy = 2xT;(x)

D’où la relation de récurrence cherchée entre trois polynômes consécutifs :

TT;+,(x) - 22Tr;(z) + T7;p,(x) = 0. (8.2)

À present nous allons montrer que ces polynômes sont orthogonaux. En partant de la relation :

sCOS nt COS mt dt = 7r/26,,

0

s71171 étant le symbole de Kronecker (182331891), sauf pour n = m = 0 l’intégrale vaut 7r.Effectuons le changement de variable t = arccos x, soit J: = COS t, ce‘ qui nous perrnet d’écrire :

dt = -sinx dz

1 3 3

Page 128: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

e t

puis 7Ts COS nt COS mt dt =s+lT~(x?Cz(x) dx = o

Jn

si m + n

0 -1

et

+1T~C4Tn(x) dx.I s2/1-2 -0

K coss nt dt = -2

si n est différent de zéro

7 r sin=O.

On voit que les polynômes de Tchebycheff sont orthogonaux sur l’intervalle fondamental(-1, +l) relativement à la fonction poids h qui est une fonction définie positive sur cet

intervalle.

1.2. Seconde définition

Cette suite de polynômes orthogonaux peut être avantageusement modifiée pour le propos quinous préoccupe. On peut définir la suite de telle sorte que le coefficient de degré le plus élevépour chaque polynôme soit égal à 1. Nous allons donc définir une suite polynômes à coefficientprincipal réduit. Si nous examinons la relation (8.2)) nous nous apercevons que le coefficient dedegré le plus élevé est multiplié par 2 lorsque l’on passe du polynôme de degré k à celui de degré(k + 1). Il nous suffit de poser comme relation de définition une nouvelle expression :

Tri(x) = & cos(n arccos z).

La relation de récurrence est alors légèrement modifiée et devient :

T,+l(x) - 4xT,(x) + 4T,-I(Z) = 0.

11 va de même de la norme qui s’exprime :

(8.3)

(8.4)

si n est différent de zéro

7l s i n = O . (8.5)

2. Une propriété essentielle des polynômes de Tchebycheff à coefficientprincipal réduit

2.1. Théorème

De tous les polynômes de degré n à coefficient principal réduit, c’est le polynôme de TchebycheffT, (x) qui approche le mieux l’axe des x sur l’intervalle (- 1, +1) au sens du sup du module.

1 3 4

Page 129: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

8. LES POLYNÔMES DE TCHEBYCHEFF

2.2. Démonstration

Désignons par pn(z) un polynôme répondant à la question et considérons alors la fonction :

Puisque p,(z) et T, ( )2 sont à coefficient principal réduit, f(z) est un polynôme au plusde degré (n - 1). Par ailleurs, T, possède n extremums alternativement positifs et négatifs surl’intervalle (-1, +l), tous égaux en module à 1 et dont les abscisses sont données par la relation :

lwrxk: =cos -

( >avec k = 0, 1,2, . . , (n ~ 1).

n

Quand T,(xk) est positif, f(zk) est négatif et quand T,(sk) est négatif, f(zk) est positif, ils’ensuit que f(z) est alors un polynôme n fois positif et négatif alternativement sur l’intervalle(-1, +l). Il change donc (n - 1) fois de signe et par conséquent possède n racines. Donc, f(z)doit être un polynôme de degré n, ce qui est en contradiction avec le fait que f(z) est au plusun polynôme de degré (n - 1). On en conclut que le polynôme f(z) est identiquement nul etque p,,(z) = T,(z) ce qui démontre le théorème.

3. Les racines des polynômes de Tchebycheff Tn+i(x)

On sait que le polynôme de degré (n+l) possède (n+l) racines distinctes et réelles sur l’intervalle(-1, +l). On les obtient en écrivant T,+i = 0, soit :

cos[(n + 1) arccosz] = 0,

ce qui donne :

Xk = COS7r(2k + 1)

2(n + 1) ’(8.6)

4. Calcul des poids Hk correspondant aux racines xk du polynôme T,+i(x)

Pour cela, il suffit d’exploiter directement la relation (B.5) de l’annexe B. D’abord, on calcule lecoefficient K qui est égal à In puisque nous traitons de polynômes à coefficient principal réduit.Donc :

À présent il nous faut calculer Ti&+, (zk) et Tn+i(xk). On trouve les expressions suivantes :

T;+l(xk) = F ~ sin[(n + 1) arccos X~C]>

d’où

TA+,c4 = g Z(i,:’ 1) )

sin 2(n + 1)

135

Page 130: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

puis il vient

T,(xk) = & cos(narccoszk) = &7r(2k + 1)

cosn 2(n+ 1 )

Cette dernière expression, après quelques

.G(Xk) =

De là on déduit la valeur des Hk :

transformations trigonométriques, se réduit à :

(-1)” sirl 42k + 1) .271-l 2(n + 1)

Cette expression montre que tous les Hh sont Cgaux pour ml polynôme donné, ce qui, notons-leau passage: conduira à des calculs particulièrement simples.

5. Méthode d’intégration de Gauss-Tchebycheff

Il est usuel d’associer au nom de Gauss le nom du savant qui a laisse son nom à une suiteparticulière de polynômes orthogonaux. C’est pour respecter cett,e tradition que nous désignonspar les deux noms accolés la méthode qui nous pcrmct dc calculer rmrnéri<~l~ernent les intkgralesdu type :

(8.8)

que l’on approche donc par l’expression classique :

nJ = c Hkf(xk)

k=O

laquelle se simplifie notablement :

avec k = 0, 1,2,. , n. Il est bien entendu que la fonction f(z) est rkguli&c~ sur l’intjervalle(-1, il). Par ailleurs, nous ne croyons pas utile de devoir donner la liste des racines despolynômes de Tchebycheff et des poids Hk qui leur sont, associts. puisque les expressionsmathématiques qui permettent leur calcul sont trk simples.

6. Calcul de l’intégrale I = 7 f(x)-a $GmdX

Le changement de variable :

1 3 6

Page 131: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

8. LES POLYNÔMES DE TCHEBYCHEFF

rmus permet dc nous ramener au problème prtcédent car l’intégrale s’écrit :

+‘fb+n b - u

I=.I

y+p

2/1L/2d7/.

-1

Par conskqucnt, on calcule 1 au moyen dc l’approximation :

où, rappelons-le, les zk sont, dans cette expression, les racines du polynôme de Tchebycheff dedcgrk (n. + 1). Le lecteur pourra légitimcmcnt s’ktonner du fait que l’on utilise les polynômes dede@ (n + 1) et non des polynômes de degré n, la raison en est simple, c’est pour rester cohérentWCC les expressions établies au chapitre prkcédtnt.

7. Calcul de l’erreur commise lors de l’approximation

Nous dlons reprendre le calcul rkalisé lors de l’étude de la méthode de Gauss-Legendre, seulsquelques points de détails vont différer.

Soit, 5 calculer :

supposons <p? f ( )z soit continûment difkentiable sur l’intervalle canonique (~ 1, +l). Ledéveloppement de Taylor-MacLaurin à l’ordre (2n + 2) nous donne :

cxprcssion dans laquelle J: et < appartiennent à l’intervalle (-1, +l).Calculons 1 en remplaçant f(z) par son développement, il faudra calculer des expressions du

type :

Pour cela. posons .î: = COS z, soit dz = - sin zdz ; on obtient alors :

7r

Qn = J’COS~ x dz.

0

On intègre par parties ccttc expression en posant :

‘U = Cos-1 x e t du = COS x dz

cc qui donne : du = ~ (n ~ 1) COS”-~ z sin z dz et ru = siriz.

137

Page 132: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On peut écrire :

7r 7T

Qn = (n - 1)s

COS’~-~ x(1 - cos2 x) dx = -(n - l)Q,+(,+s

cosnP2 x dx

0 0

d’où la relation de récurrence :7r x

n&, = (n - l)Q+z avec &a =s

dz = ?r et Qr = cosx dz = 0.s

0 0

De là, on tire que :

Q 2n+1 = 0,

Q271 = (2n - ')!lT = (2n - 1)!!5i

(2n)!! 2”n!

Revenons au calcul de 1 :

I=l&[ .f(0) + Ef'(O) + g"(o) +. . . + (2~~i,li(2TL+1)(o) +x2n+2

(2n+ 2)!

x S'2"+2'(E)] =* [f(o) + ,., / y2y ";,,:'!! +...+ f'""+"'(~)(2n+ l)!! ] .

(2n + 2)! 2n+l(n + l)!

L’exploitation directe de la formule d’intégration de Gauss-Tchebycheff donne :

J= .

L’erreur E s’écrit :

Si f(x) est un polynôme de degré (2n + l), la dérivée de f(x) d’ordre (2n + 2) est nulle, et l’ona l’égalité :

I = J.

Dans ce cas il n’y a pas d’erreur mathématique due à une approximation ; on obtient enconséquence le système suivant :

1 3 8

i

Page 133: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

8. LES POLYNÔMES DE TCHEBYCHEFF

Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnablepossible de la fonction f(“‘“+“)(<) dans l’intervalle (-1, +l) ; en définitive, l’erreur s’exprime dela manière suivante :

E(x) = (27y+;>! i(2n + l)!!

2n,+l(, + l)! 1 n x”n+”

c 1n+ 1 J”“O k ’ (8.10)

où M2nt2 = SUP If (2n+2)(x)1 pour 3: appartenant à (-1, +l).Dans la mesure où l’on peut obtenir une majoration raisonnable M2n+l, E(z) donne l’erreur

mathématique liée à la troncature de la série des polynômes de Tchebycheff. Viendront s’ajouterlors des calculs effectifs les inévitables erreurs d’arrondi propagées par l’exécution des opérations.Toujours est-il que pour n = 12, on trouve :

E24 = 1,47 10-4”M24.

8. Fonctions génératrices des polynômes de Tchebycheff

Nous admettrons les résultats suivants sans démonstration :

1 - tx1 - 2tx + t2

= TO(X) + Krl(X) + t2T2(x) + ‘. + fT,(x) + ‘.

et

exp(xt) cos(t&ZS) = Te(X) + +r,(X) + z??z(X) + . . . + iTn(X) + . .

9. Un exemple d’intégration

À titre d’exemple, calculons l’intégrale :

+1

Cet exemple n’est pas tout à fait gratuit ; en effet, la méthode d’intégration de Gauss-Tchebycheffconstitue la meilleure façon de calculer les fonctions de Bessel de première espèce. Nousreviendrons sur ce point au cours de l’annexe F.

Pour l’instant, Je(l) est la valeur de la fonction de Bessel de première espèce d’ordre zéropour la valeur 1 de l’argument. Nous avons trouvé dans la littérature la valeur suivante :

JO( 1) = 0,765 197 686 557 966 4

avec une précision absolue de l’ordre de 10-15.Le tableau 8.1, page suivante, donne les résultats obtenus.Si l’on poursuit le calcul pour des valeurs plus élevées de n, seul le dernier chiffre significatif

change, soit le 16” chiffre... ce qui constitue un résultat remarquable.

139

Page 134: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau 8.1.

Nombre de points J(l)

3 0>765 239 5634 0,765 197 498 1115 0,765 197 687 084 0896 0,765 197 686 556 9667 0 765 197 686 557 967 78 01765 197 686 557 966 29 0,765 197 686 557 966 4

Note importante

Il faut faire attention à ne pas confondre la méthode d’intégration de Gauss-Tchebycheff avecla rnéthode d’intégration de Tchebychcff; cette dernière consiste à évaluer l’intégrale :

+1

I=.I

f(x) dz

au rnoyen de l’approximation

où les Hk ont été choisis u priori.Comme précédemment, on cherchera à fixer les zk dc tcllc sorte que 1 = J pour ur1 polynôme

de degré le plus élevé possible. Cette modification des conditions, apparemment anodine. changecomplètement le fond du problème tant et si bien que non seulement la solution dépend alorsdes Hk: rnais encore que les zk: peuvent ne plus être réels. Même lorsque tous les Hk sont égaux,les zk: cessent d’être tous r-tels à partir de n = 8, excepté toutefois pour rz = 9. Quoi qu’il ensoit. la méthode est moins précise que celle de Gauss.

1 4 0

Page 135: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9 Les polynômes de Laguerre.Méthode d’intégration

( de Gauss-Laguerre

Les polynômes de Lagucrre (1834-1886) sont orthogonaux relativement à la fonction poidsexp( -22) sur l’intervalle (0, w). Ou peut aborder l’étude de ces polynômes d’une façon tout, àfait analogue à celle que nous avons adoptke pour les polynômes de Lcgcndre; ccpcndaut. nousavons préféré utiliser une formule semblable à celle de Rodriguès pour établir plus rapidementleurs principales propriétés.

Par définition, les polynômes de Lagucrre sont donnés par les expressions :

LTL(z) = exp(x)$ {eq-X)X”}. (9.1)

1. Relation de récurrence entre trois polynômes consécutifs

À partir de la relation de défiuit,ion. nous allous établir urle relation dc rkurrencc rutre troispolynômes consécutifs, ce qui nous permct,tra par la suite de calculer facilemeut les coefficientsde l’un quelconque des polynômes de Laguerrc. Il suffît d’krire la relation dc d&litiou pourl’indice (r> + 1). ce qui dorme :

Soit :

L,+l(z) = exp(x)s { - exp(-x)x”+l+ (n + 1) exp(-z)X”} .

Ou transforme cette dernike expression à l’aide de la formule de Leibnitz :

g {exp(-:X)?+l} = & {exp(-z)z”z}

= 2~5 {exp(-X)x”} + ,,s {exp(-X)2?}.

L’expression donnant L,,+I (CC) devient :

Lfl(Lx) = (n + l)L,,(z) - nL(z) - ,cx,(+jg {exp( -X)C}

1 4 1

Page 136: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On calcule directement le dernier terme du second membre à partir de la relation (9.1) :

L+~(X) = =P(:I:)= {nexp(-Ic)27L-1 ~ exp(-X)3?}.

soit encore,

-L(x> = -p(z) s {n exp( -2)znP1 - exp( -z)zc”} .

II vient donc :

L+1(z) = (n + l)Lx(z) - G(s) + G,(~) - n%-l(~)

De là nous tirons la relation utile pour déterminer les différents polynômes connaissant les deuxpremiers :

L+~(Z) + (x ~ 2n - l)&(s) + 7?L-1(2) = 0. (9.2)

2. Relation de récurrence faisant intervenir la dérivée

À présent, nous allons établir une autre relation très intéressante pour le calcul des coefficientsHk. Il s’agit de pouvoir exprimer simplement la dérivée L~(Z). Cela nous sera bien utilepour calculer les Hk de la formule de Gauss généralisée. Dans ce but, dérivons la relation dedéfinition (9.1), ce qui permet d’écrire :

L;(z) = n exp(z)$ { exp( -2)271P1} .

soit :

L;(z) = zzexp(z)s {exp(-z)z+l} .

Toujours A. l’aide de la relation de Leibnitz, transformons cette dernière expression :

x5 {exp(-z)z”-l} = G {exp(-z)?} ~ ns {exp(-z)znP1}

On en déduit directement que :

L?&(x) = nL,(cLz) - nL,r,-1(2). (9.3)

3. Les premiers polynômes de Laguerre

La relation de définition permet de calculer les deux premiers polynômes, soit :

La(x) = 1,Ll(Z) = -z+ 1

La relation de récurrence (9.2) montre que le polynôme ,5,+1(z) a un degré supérieur de 1unité à celui du polynôme de degré n. Cela démontre au passage (en utilisant un raisonnement

142

Page 137: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9. LES PoLmôMEs DE LAGUERRE

par récurrence) que nous avons bien affaire à des polynômes, car L~(Z) et Li (x) sont bien despolynômes donc L,(s) est aussi un polynôme et ainsi de suite. Voici les premiers polynômes deLaguerre :

L”(X) = 1

Ll(X) = -2 + 1

L2(x) =x2-4x+2

l&(x) = -si’ + 9x2 - 18x + 6

L4(2) = x4 - 16x” + 72x2 - 96x + 24

&(x) = -x5 + 25x4 - 2002” + 600x’ - 6002 + 120.

4. Calcul des coefficients des n premiers polynômes de Laguerre

Il n’est pas très difficile de réaliser un programme destiné à calculer tous les coefficientsdes premiers polynômes de Laguerre. Ils seront entassés dans un tableau unique, par soucid’économie, selon les puissances décroissantes.

On trouvera sur le Web(*) 1 e programme laguerre. c réalisant cette tâche.

5. Orthogonalité des polynômes de Laguerre

Les polynômes de Laguerre sont orthogonaux relativement à la fonction poids W(X) = exp(-x)sur l’intervalle fondamental (0, w). Pour le montrer il suffit de calculer :

30 00

Ink = J exp(-z)L,(z)Lk(z) dz = J ev-2) & {exp(-x)xnl $ {exp(-x)zk} dz.

0 0

Pour fixer les idées et sans nuire à la généralité, supposons que nous ayons n < k. Effectuonsune intégration par parties en posant :

u = exp(x)-& {exp(-x)xnl,

du = 1% exp(x)g { exp( -.r).r”-‘} ,

et

d u = 2 {exp(-x)x”} ,

2, = s {exp(-x)x”} .

*http://www.edpsciences.com/guilpin/

1 4 3

Page 138: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

bfANUEL DE CALCTJL NUMÉRIQUE APPLIQUÉ

Nous obtenons :

Ink =[exdx)dJ”’d” {exp(-z)zn} g {exp(-z)z”} =

1 0

Le premier terme est nul car il contient n: exp( -ZC) en facteur ; cn poursuivant l’intégration parparties. on arrive à l’expression suivante :

I,,k = &i>! {exp(-z)z”} dn:

où E représente lc signe dc IT,k. Le calcul de cette intégrale donne :

I,, A” = ET-L!

car ici encore on fait apparaître le terme 2; exp( -z) en facteur en fin de calcul, et ce terme estnul pour z = 0 et :r infini. Donc les polynômes de Lagucrre sont orthogonaux par rapport à lafonction poids exp(-z) sur l’intervalle fondamrntjal (0. CO).

À prescrit, il nous reste à calculer la norme de l’intégrale, c’est-a-dire I,,,,: car nous auronsbesoin de cette valeur pour le calcul des Hk.

Rkglons tout dc suite lc problème du signe : il est necessaircment posit,if puisque la forme estdefinie positive (carré scalaire). Donc reste à calculer :

w

1,,, = n!J’

{exp(-z)z”} dz.

Il

En proccdant par partics, on voit que :

oc.

I’

{exp(-2)2?} dz = n!:

il

il s’ensuit que :

I,, = (n!)! (9.4)

En conclusion. les polynômes de Laguerre sont orthogonaux relativement à la fonction poidsW(z) = exp(-z) et a l’intervalle (O,oo), nous en deduisons donc que les racines de chacun despolynômes sont reellcs7 simples et comprises dans l’intervalle (0: CQ).

6. Calcul des racines des premiers polynômes de Laguerre

On calcule au moyen de la rnéthode de Bairstow les racines des polynômes dc Laguerre. Lesvaleurs mrmériyues du polynôme de degré 12 sont, donnees dans le tableau 9.3, page 149.

1 4 4

Page 139: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9. LES POLYNÔMES DE LAGUERRE

7. Calcul des poids Hk correspondant aux racines xk

R.eprenons la relation (B.5) de l’annexe B dans laquelle 110~1s explicitons le coefficient K. Nousa v o n s :

K = -(n!)”

car le rapport des coeficients de dcgre le plus élevé dc deux polynômes conskutifs est égal à-1. Donc,

expression dans laquelle, rappelons-le, zzk est une racine du polynôme de degrk (n, + 1). Si nousutilisons la relation de récurrence (9.3). on obtient, :

cc qui nous permet d’obtenir deux expressions plus simples :

(9.5)

8. Calcul numérique des poids Hk associés aux racines

Les deux expressions que nous venons d’établir, très faciles à programmer, nous fourniswnt lesvaleurs numériques des Hk dont on donne 1111 tableau 9.3, page 149.

Sur lc Wch (*), on trouvera le programme r-laguer . c qui perrnet de calculer les racines etles poids des polynômes de Lagucrrc.

9. Calcul des intégrales du type I = Sexp(-x)f (x)dx0

Comme d’habitude on suppose que f(z) est une fonction régulière sur (0, 00) ctj l’on approchel’intbgrale au moyen de l’expression :

9.1. Exemple 1On se propose dc calculer la const,ante d’Euler y = 0,577 215 664 90 au moyen dc l’expressionsuivante :

x

.i(

1 1Y= ~

1 ~ exp(-z) n: >exp-2) dz

0

Les rksultats trouvés sont indiqués dans le tableau 9.1, page suivante.

*http://www.edpsciences.com/guilpin/

1 4 5

Page 140: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau 9.1.

Nombre de points Constante d’Euler

5 0,577 215 4096 0,577 215 3167 0,577 215 6388 0,577 215 6839 0,577 215 6711 0 0,577 215 664 92711 0,577 215 664 244

9.2. Exemple 2

Il s’agit de calculer la fonction factorielle, et nous avons choisi :

10! = 3 628 800.

Compte tenu de l’expression intégrale de la fonction factorielle, nous savons :cc

.I=s

exp(-x)x’” dz = 10!

0

Puisque la fonction à intégrer est de degré 10, nous devons obtenir un résultat exact en 6 points(CI~ négligeant les erreurs d’arrondi propagées par la machine. C’est ce que l’on se propose devérifier. Les résultats obtenus sont donnés dans le tableau 9.2.

Tableau 9.2.

Nombre de points lO!

4 3 033 2165 3 614 4006 3 628 799,999 999 97

9.3. Remarque importante

On note une fois de plus que la méthode donne d’excellents résultats. Toutefois il convient dese méfier des intégrales du type :

I =s

1exp( -x) COS mx dz = ~

m2 + 10

qu’il faut examiner soigneusement. En effet, si m est « assez grand » , COS mx peut être assezmal représenté par un polynôme de Laguerre de degré peu élevé. D’autres cas bien sûr peuventprésenter des dangers analogues liés au nombre de points où la fonction s’annule.

1 4 6

Page 141: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9. LE~ PoLwiôïms DE LAGUERRE

10. Calcul de l’erreur commise lors de l’approximation

Nous allons reprendre le calcul réalise lors de l’étude dc la méthode de Gauss-Legendre, seulsquelques points de détail différent.

Soit à calculer :

CO

I = exp(-z)f(x) dz.J’0

Supposons que f(x) soit continûment différentiable sur l’intervalle fondamental (0, oo). Ledéveloppement de Taylor-MacLaurin à l’ordre (2n + 1) nous donne :

f(x) = f(0) + ;f'(o) + fg"(O) + . . + ,2ny;,, f'""+"(o) +x27L+2

(2n + 2)! f(2n+2) (El >

expression dans laquelle x et < appartiennent à l’intervalle (0, oo).

Calculons 1 en remplaçant f(x) p ar son développement, il faudra utiliser des expressions dutype :

M

Q2n+2 =s

exp( -x)x2n+2 dz = (2n + 2)!

0

L’exploitation directe de la formule d’intégration de Gauss-Laguerre donne :

J=S<~)CHI+~‘(O)CH~X~-~CH~X~+...+~~H~~~k=O k=O k=O k-0

+...+

p+l) (0) TL

c

2nt1

(2n + l)! k=OHkxkl tf,;;T);;/ c Hkxp+2.

L’erreur E s’écrit :

Si f(x) est un polynôme de degré (2n + l), la dérivée de f(x) d’ordre (2n + 2) est nulle, et l’ona l’égalité :

I = J.

1 4 7

Page 142: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Dans ce cas il n’y a pas d’erreur mathématique due à, une approximation; on obtient enconséquence le système suivant :

Tl.CHk =1k=O

2 H&I& = l!k=O

2 H@Z; = 2!k=O. . . . . . . . . . . . .

2 2rrL-1HkXfi = (arr-l)!k=O

c 27nHk5k = (2rn)!k=O

2nt1Hk;.Xk = (2n. + l)!

k=O

Il est intéressant de constater que le système de (2n. + 2) équations ainsi défini est constituéde (27~ + 2) équations non linéaires dans la mesure où l’on considère que les Hh et les xk sont lesinconnues. En revanche, si l’on connaît les xk, alors, (n + 1) équations quelconques prises dansle système précédent constituent un système linéaire permettant de calculer les Hk.

Toujours est-il que l’erreur prend la forme Suivant>e :

(9.6)

en prenant soin de noter que :

H&‘+’ # (2n + 2)!k=O

Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plus raisonnablepossible de la fonction f (2rr+2) (<) dans l’intervalle (-1, +l), en dkfinitive, l’erreur s’exprime dela manière suivante :

’ (9.7)

o ù hf21L+2 = sup ) f@f2) (X) ) pour z appartenant, à (0, 00).Dans la mesure où l’on peut obtenir UIIC majoration raisonnable Mz~~~,+~, E(x) domle l’erreur

mathématique liée à la troncature de la série des polynômes de Laguerre. Viendront s’ajouterlors des calculs effectifs les inévitables erreurs d’arrondi propagées par l’exécution des opérations.Pour n. = 12, on trouve :

Ez4 = 3,698 10-7M24.

148

Page 143: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9. LES PoLYNôms DE LAGUERRE

Le tableau 9.3 donne les racines et les poids du polynôme de degré 12. Sur sur le Web(*) ontrouve le fichier texte appelé laguerre. txt qui donne les poids et les racines des 12 premierspolynômes.

Tableau 9.3. Racines et poids associés des polynômes de Laguerre.

Degré Racines CE Poids Hk

1 2

0,611757484 515 13 0,377 759 275 873 1270,115 722 11735802 0,264 731371055 4432,833 751337 743 36 0,090 449 222 2116821,512 610 269 776 45 0,244 082 011319 8956,844 525 453 118 77 0,002 663 973 5418424,599 227 639 418 09 0,020 102 381154 65013,006 054 993 319 3 0,000 008 365 055 8579,621316 842 445 915 0,000 203 231592 66822,151090 379 373 0,000 000 001342 39117,116 855 187466 0,000 000 166 849 38837,099 121044 461 0,000 000 000 000 0018,487 967 251005 0,000 000 000 003 062

11. Fonction génératrice des polynômes de Laguerre

Nous admettrons le résultat suivant sans démonstration :

1-t=Lo(x)+tL~(x)+t2L~(x)+-+tnL,(x)+-

12. Calcul numérique de la transformée de LaplaceF(p) la transformée de Laplace de la fonction h(t) est une équation fonctionnelle qui s’écrit :

cc

F ( P ) =s

h(t) exd-pt) dt,

0

expression dans laquelle t est une variable réelle (généralement le temps) et p une variablecomplexe. Sans entrer dans les détails de la théorie, les calculs sont réalisables si l’intégrale estconvergente. Sous réserve de cette convergence, on peut être amené à calculer numériquementF(p). En effectuant le changement de variable y = pt, on obtient l’expression :

03F(P) = i s ~(Y/P) m-y) dy0

*http://www.edpsciences.com/guilpin/

1 4 9

Page 144: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

qui se calcule évidemment par la méthode de Gauss-Laguerre. D’un point de vue pratique, lescalculs ne sont pas toujours aussi simples, notamment si la fonction h(y/p) a à peu près l’allured’un pic entre zéro et Z,in (x,in est la plus petite racine de L,(z) polynôme de Laguerre dedegré n servant à l’intégration numérique). Bien entendu, plus le degré n est élevé, plus X,intend vers zéro et meilleure est la précision du calcul. Malheureusement, en calcul usuel, il estdifficile de dépasser le degré 12 ou 13. Nous n’allons pas renoncer pour autant à utiliser cettetechnique. Il suffit de couper judicieusement l’intervalle (0, co) en deux de la façon suivante :

a w

F(P) = i J ~(Y/P) exp(-y) dy + y J ~(Y/P) exp(-y) dv0 a

a étant déterminé par des considérations sur la fonction h(y/p). La première intégrale se calculepar la méthode de Gauss-Legendre, la méthode de Simpson etc., tandis que la seconde intégralese calcule par la méthode de Gauss-Laguerre en posant z = y - a, soit :

1 mh(y/p) exp(-y) dy = i T~[(z + a)/@ exp(-z)dz.P Ja 0

L’intérêt est évident dans la mesure où l’on a une très bonne estimation de la queue de lafonction.

13. Appendice : Les polynômes de Laguerre généralisés

Les polynômes de Laguerre sont susceptibles d’être étendus en écrivant une formule de définitionplus générale :

L:(z) = exp(a)$$[exp(-z)zn+rr]

avec toutefois une restriction concernant le paramètre <y, il faut que sa partie réelle soit plusgrande que -1.

13.1. Relation de récurrence entre trois polynômes consécutifs

Partant de la relation de définition (9.8), écrite pour le polynôme L:+~(X), on obtient :

LE+,(z) = exp(x)&$ [exp(-X)?+“+l]

expression qui peut s’écrire sous la forme :

(n + ~)L:+,(Z) = exp(z)$$$ [exp(-z)zn+“(n + Q: + 1 -z)]

ce qui nous donne :

(n + l)L:+,(z) = (n + o! + l)L;(z)

150

Page 145: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

9. LES POLYNÔMES DE LAGUERRE

En utilisant la relation de Leibnitz, on peut transformer la dernière expression :

+ exp(x)--i!a s [exp( -x)xnfu]

Comme par ailleurs on peut écrire :

~L:(X) = n,exp(x)ss [(n + 0) exp(-x)xn+aP1 - exp(-x)3?+“]

puis,

-nexp(z)L,T(’ ~bp(-~)xn+a] = ~L:(X) - (n + a) exp(-z)L;_,(z) ;

on trouve esdéfinitive la relation de récurrence cherchée :

(n + l)Lq+&) - (2n + 1 + QI - z)nL;(z) + (n + a)L;-l(x) = 0. (9.9)

13.2. Relation de récurrence faisant intervenir les dérivées

, Dérivons la relation de définition (9.8) :

[L;(x)]’ = ~[exp(x)x-” - cm-U-1 exp(x)]&[exp(-z)z’“Pa] + exp(s)s$[(n + o)

x exp( -2)xn+“-l - exp( -2)2n+CY]

On obtient alors :

[L;(X)]’ = -~L:(X) + (n + cy)exp(x)$& [exp(-x)2?+“-‘] .

Grâce à la formule de Leibnitz, nous allons transformer la dernière expression du membre dedroite, ce qui donne :

(n + a) exp(x) 5 z $ [exp( -2)5n+a-1] = (n + o) exp(z) g $$ [exp(-z)zn+“]

- ns [exp(-z)lçn+u-l] = “+“LE(x) - n+Lg1(~).X X

De là nous tirons une relation de récurrence faisant apparaître la dérivée d’un polynôme dontnous aurons besoin pour calculer les Hk :

X[L,“(X)]’ = @n(x)] - (n + n)[L:-l(x)]. (9.10)

13.3. Orthogonalité des polynômes de Laguerre généralisés

Il s’agit de calculer l’expression :

J = wexp(-x)P[LE(x)][Lg(x)] dz./’0

= Jexp(-x)x7 & [exp(-x)@“] s [exp(-x)zm+a] dz.

0

151

Page 146: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

En intégrant par parties d’une façon analogue à celle que nous avons envisagée lors de l’étudedes polynômes de Laguerre, on obtient J = 0 pour n # m.

Reste à calculer la norme :

1 = aexp(-z)zP” [LE (z)]” dz = n! /exp(-z)zP+” dz,s0 0

ce qui donne :

1 = n!rya + n + 1)

expression dans laquelle l?(u) est la fonction factorielle :

w

ryu) =s

exp(-t)t”-’ dt.

13.4. Calcul des racines de Ln et des poids associés Hk

On ne peut pas dresser une table des racines et des poids associés puisque ces valeurs dépendentdu paramètre cr. Dans chaque cas particulier que l’on sera amené à considérer, il faudra construirela chaîne de calculs déjà réalisée pour les cas prccédemment étudiés.

13.5. Technique de calcul des intégrales du type I = Sexp(--x)x-“f(x)dx0

Bien entendu, f(z) est une fonction régulière sur (0, co), et l’approximation s’effectue commetoujours au moyen de la relation :

expression dans laquelle les xk sont les zéros du polynôme de Laguerre généralisé LE+,(z) dedegré (n + 1).

13.6. Une autre relation de récurrence

On peut avantageusement utiliser une relation de récurrence portant sur les LE+,(x) pourcalculer les poids Hk. En effet, on établit que :

[LE(x)]’ = -EL;(x) + FL;-‘(x).

Si X~C est une racine de L:(x), on simplifie l’expression précédente :

[L,“(x)]’ = ~L;-l(x,).

Nous obtenons ainsi une forme aisée à calculer pour les HI, où nous n’avons plus à exprimerformellement la dérivée.

Page 147: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10 Les polynômes d’Hermite.‘/ ‘,“,,;‘,,;> ’ , Y >< /, /< 8,s ‘:/ “r ,,_* >,.,..,,~~-~,],I’~~ La méthode d’intégration1 _r .de Gauss-Hermite

Ce sont des polynômes orthogonaux relativement à la fonction poids gaussienne et sur l’intervalle(-oo, +oo). Nous allons en effectuer une étude en tout point semblable à celle des polynômes deLaguerre. Pour des raisons qui apparaîtront un peu plus loin, le polynôme d’Hermite (182221901)de degré n est défini par la relation :

&(Cc) = (-1)‘“exI@/2)~ exp (-332) . (10.1)

1. Relation de récurrence entre trois polynômes consécutifs

Pour obtenir la relation désirée, il nous suffit de développer l’expression de l(n+r(z), soit :

K,+l(z) = (-l)%+l exp(3?/2)& [zexp (-X”/L)]

à laquelle on applique la formule de Leibnitz :

ce qui nous permet d’écrire :

(-l)“+‘Kn+r(~) = exp(Z2/2)(-x$ exp (-x2/2) - ns exp (-x2/2) .

1

On en déduit immédiatement :

(-l)“+‘Kn+&r) = -(-l)RZ&(Z) - (-1)12-1nKTL-1(X)

soit encore :

(10.2)

Page 148: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2. Relation de récurrence entre polynômes et dérivées

Dans le même esprit que précédemment, nous allons établir une relation de récurrence simpleentre les polynômes et les dérivées à seule fin d’obtenir une expression de Hk aisément calculable.Pour ce faire nous dérivons la relation de définition et nous obtenons :

K;(x) = (-l)nexp(z2/2)$$exp (-x2/2) + (-l)‘“exp(x”/2)& [-zexp (-x2/2)] ,

ce qui donne grâce à la formule de Leibnitz :

K;(x) = TX,-l(X). (10.3)

3. Les premiers polynômes d’Hermite

Puisque nous bénéficions de la relation de récurrence (10.2), il suffit en réalité de connaître lesdeux premiers polynômes d’Hermite pour déterminer tous les autres. Nous obtenons :

Ko(x) = 1

ICI(X) = x

K&4=x2-1

K3(x)=x3-3x

I&(x) = x4 - 6x2 + 3

et ainsi de suite.

4. Calcul des coefficients des premiers polynômes d’Hermite

On trouvera sur le Web (*) 1 e programme hermite. c destiné à calculer les coefficients despolynômes d’Hermite dans le but plus précis de calculer leurs racines.

5. Orthogonalité des polynômes d’Hermite

Les polynômes d’Hermite sont orthogonaux relativement à la fonction poids exp (-x2/2) e t àl’intervalle (-CO, +oo). C’est ce que nous allons montrer en calculant l’intégrale Ink. Sans nuireà la généralité, on peut supposer que k > n :

+CCInk =

sexp (-x2/2) K(x)&(x) dz,

-00

soit encore :

+CCInk = (-l)n+k .I exdx2/2)& exp (-x2/2) $ exp (-x2/2) dz.

*http://www.edpsciences.com/guilpin/

154

Page 149: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10. LES PoLmôms D’HERMITE

Effectuons une intégration par parties en posant :

du = & exp (-x2/2) dz

soit

dk-1

7~ = dz”l exp (-=73/2)

e t

u = exp(2’/2) & exp (-x2/2)

soit, après transformation donnée par la formule de Leibnitz :

du = -72 exp(2’/2) s exp (-CC~/~)

Dans le cas où n # k, le produit u . w est nul sur l’intervalle (-CO, foc) car il contientexp (-x2/2) en facteur. On peut alors écrire :

Ink = In-C-1

et de proche en proche on obtient :

+03

Ink = n!ss exp (-x2/2) dz

O r+CCJ

dk-n

s exp (-x2/2) dz = 0 quand k # n.

Donc les polynômes d’Hermite sont orthogonaux. On en déduit immédiatement que les zérosd’un polynôme d’Hermite de degré n sont distincts, réels et répartis sur l’intervalle (-03, +oo).

Il nous reste à présent à calculer la norme d’un polynôme, il suffit de faire n = k dansl’expression de Ink :

+CC

In, = In = n!J

exp (-x2/2) dz = n!&.

6. Calcul des racines des premiers polynômes d’Hermite

On trouvera un tableau 10.2, page 162, donnant les racines du polynôme d’Hermite de degré 12que nous avons calculées en double précision.

Sur le Web (*), on donne le programme r-hermit . c qui calcule les racines et les poids despolynômes d’Hermite.

*http://www.edpsciences.com/guilpin/

155

Page 150: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

7. Calcul des poids Hk correspondant aux racines xk

Rappelons tout d’abord que ce calcul est effectué dans l’hypothèse où les racines ~k sont les(n + 1) zéros du polynôme de degré (n + 1). La relation (B.5) de l’annexe B s’écrit alors :

expression dans laquelle on aura soin de ne pas confondre la constante K avec un quelconquepolynôme d’Hermite. On trouve que la constante K vaut n!fi.

Grâce à la relation (10.3), on obtient diverses expressions de Hk aisées à calculer, soit :

En exploitant une de ces relations, on calcule numériquement sans difficultés les poids Hkassociés aux racines zk. On trouvera dans le tableau 10.2, page 162 les valeurs numériques deces poids en face des racines correspondantes pour le polynôme de degré 12.

8. Technique de calcul des intégrales du type I = Sexp (-x*/2) f(x)dx

où f(Z) est une fonction régulière sur l’intervalle (-00, +co). L’approximation se réalise aumoyen de la somme :

expression dans laquelle les X~C sont les racines du polynôme de degré (n + 1).

Exemple

On se propose de calculer une intégrale dont on connaît la valeur numérique, soit :

exp (-x2/2) COS(X) dz = 1.

Les résultats que nous avons obtenus sont donnés dans le tableau 10.1, page ci-contre.

Remarque : On note qu’il n’y a pas de difficultés pour calculer les intégrales du type :

I= /‘:xp(-$)f(x)dx

en effet, le changement de variable :

nous permet de revenir au cas canonique que nous venons de traiter.

1 5 6

Page 151: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10. L ES PoLYh&rEs D'HERMITE

T a b l e a u 10.1.

Nombre de points Résultat

4 0,999 2225 1,000 0436 0,999 998 1437 1,000 000 1758 1,000 000 0979 1,000 000 099

1 2 1,000 000 099

9. Autres notations très utiles

Il arrive que des auteurs adoptent une définition légèrement différente pour les polynômesd’Hermite, soit :

K;(x,u) = (-l)n exp(az’)$ exp(-ax2),

expression dans laquelle a est un nombre positif (il s’agit d’une formule analogue à celle deRodriguès concernant les polynômes de Legendre).

Dans ce cas, la relation de récurrence entre trois polynômes consécutifs s’écrit :

K*Lfl(X) u) = 2azK;(lç, u) - 2aTX-,(z, a).

De même, la relation faisant intervenir les dérivées prend la forme :

K;‘(z, u) = 2unK;p,(z, a),

et le carré scalaire de l’intégrale vaut alors :

1 =I 4q2q7l.B n . 2 .

En remarquant que :

on obtient les modifications à apporter aux expressions des racines et des poids des polynômescorrespondants, à savoir :

xk = x&

Les fonctions 02(x, u) = exp(-uz2/2)Kz(x), encore appelées fonctions du cylindre parabo-lique ou fonctions de Weber-Hermite, constituent une base orthogonale de l’espace L2 qui est

l’espace des fonctions de carré sommable sur (-CO, +oo) ( 7 f(x)’ dz).-cc

1 5 7

Page 152: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

La décomposition d’une fonction f(x) appartenant à L2 sur (-CO, +co) s’effectue en calculantles coefficients du développement de Fourier correspondant, soit :

On multiplie les deux membres de cette dernière expression par D&(x) puis on procède àl’intégration sur l’intervalle (-oo, DC)), on obtient :

+m

J ~(X)I?;(X, a) dz = JF C,&(x)o;(x, a) dz = g ck /o;(x, u)o&(X, a) dz

-CO -w k=O k=O -oo

00 +C=

=c Jck K*(z)Kk(x) exp(-ax2) dzk=O -oo

et compte tenu de l’orthogonalité, on trouve :

+03

J f(x)D&(x,a) dz = c,l, = c,m!$(a,)”

-00

et

ainsi que

c. = ~‘5 imi(x) exp(-ax2) dz.JOn trouvera la démonstration de la convergence des intégrales c, ainsi que celle de la série

associée à la fonction f(x) dans les ouvrages de Arsac et de Bass cités en bibliographie.

Un cas particulier intéressant

C’est le cas où a = 27r qui permet d’obtenir des résultats simples lorsque l’on est amené àtravailler dans l’espace réciproque de Fourier (cf. chapitre 16).

Nous écrivons :

Jz( 1

112K;(x, 27r) = (-1)” rL!T(47r)” exp (27rx2) $ exp (-2~2~) ,

expression qui rend les polynômes orthonormés.En rappelant que la transformation de Fourier directe s’écrit :

+CC

F(u) = J f(x) exp(27rjxu) dz,

-00

158

Page 153: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10. LES POLYNÔMES D’HERMITE

avec une propriété importante :

xPf(x) TE) LF(qu).GWP

Nous allons montrer que :

K;(x, 2~) exp(-7rx2) TF> j”Ki(u, 2X) exp(+u2).

Si f(s) = xp exp(-7rx2) on obtient pour sa transformée de Fourier (cJ chapitre 16) :

x* exp( -Xx2) TF)1 dP

--exp(-7ru2).(27rj)p dup

Or, en faisant usage de la relation générale de définition des polynômes d’Hermite, on peutécrire :

1m $ ew-m2) = Pp(u) exp(-nu2)

où PP(u) est un polynôme de degré p. Comme tout polynôme d’Hermite peut se développer dela façon suivante :

Iq(x, 27r) = 2 ap2p,p=o

on en déduit que

KG(“, 27r) exp(-rz2) TF) Qn(u) exp(-7w2).

Il s’agit maintenant de déterminer le polynôme Qn(u). La démonstration repose sur lespropriétés des produits scalaires dans L2, et en particulier, de la relation suivante :

(f(x), f(-x)) = (F(u)7 F(u))dont on trouvera une démonstration dans le chapitre 16 concernant les transformées de Fourier.Comme la relation de définition permet d’écrire :

Ici(-x, 27r) = (-l)nK;(x, 27r),

on en déduit que :

(KA(-x,2~) exp(-7rz2), K;(x) 2~) exp(+z2))

= (-1)‘“6,, = (Qn(~, 2~) exp(-TX’), Qm(x, 27r) exp(-m2)).

À présent, changeons Qm(x, 27r) en (J’)~R,(x, 2n), il vient :

(~L(X, 2~) exp(+x2), I&(x, 2~) exp(9rx2)) = 6,,,

159

Page 154: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

on en déduit que :

et que, par conséquent, on a :

K&(x, 2~) exp(-rx2) ?-, *j”Kh(u, 2~) exp(+u2),

l’ambiguïté du signe se trouve levée en examinant le terme de plus haute puissance (coefficientuP), mais on a déjà établi la relation suivante :

1 dpupxp exp( -7rx2) 3 ap - ~

(27rj)p dupexp( +ru2),

ce qui permet de conclure que le signe à conserver est le signe plus.

10. Calcul de l’erreur commise lors de l’approximation

Nous allons reprendre le calcul réalisé lors de l’étude de la méthode de Gauss-Legendre, seulsquelques points de détails vont différer.

Soit à calculer :

+CX

1 = J exp (-x2/2) f(x) dz

-CO

Supposons que f(x) soit continûment différentiable sur l’intervalle fondamental (-03, fco). Ledéveloppement de Taylor-MacLaurinà l’ordre (2n + 2) nous donne :

f(x) = f(0) + $(O) + g”(o) + . . . + j2yy;), f’““+“(O) +22n+2

(2n + 2)!f(2n+2) (0 7

expression dans laquelle 2 et c appartiennent à l’intervalle (-00, +co). Calculons 1 en remplaçantf(x) par son développement, il faudra calculer des expressions du type :

Q2n+2 = J exp (-x2/2) x2n+2 dz = J exp (-x2/2) x2n+1x dz.

-03 -cc

On intègre par parties cette expression en posant :

21 = x2n+lx e t du = exp (-x2/2) 2 dJ:

ce qui donne :

du = (2n + 1)x2” dz et u = - exp (-x2/2) .

On peut écrire :

Q 2n+2 = [-ew-x2/2)x 2n+‘]+z + (2n + 1) Texp (-x2/2) x2n dx,

-cc

160

Page 155: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10. LES poLyNôMEs D'HERMITE

c o m m e +‘=-s exp (-x2/2) dz = 6,

-cc

on trouve que :

Q zn+2 = (2n + l)!!&%.

Par ailleurs QzTL+r étant une fonction impaire, Qzn+r = 0. Revenons au calcul de 1 :

I = v% [f(0) + ‘. . + 7$2q- l)!! +...+ f’““+“‘(E) (2 + y!)(2n+2)! n 1

L’exploitation directe de la formule d’intégration de Gauss-Hermite donne :

f’“‘(0) n fPn+2)(<) nJ=S(D)~Hi+...+~~H~x~+..-+ c2n+2j! zHkxk”‘“.

k=O k=O k-0

L’erreur E s’écrit :

jGq+l) (0)

+ ..‘+ (n + 1)(2q + l)! k=.5xkq+l + . . + Pc$

. i(2~7 - l)!!fi - 2 H~Z;

k=O

+...+ f(2n+2)(o(2n+2)!

&q2n+l)rl-. kHkxb’“f2 .k=O

Si f(x) est un polynôme de degré (2n + l), la dérivée de f(x) d’ordre (2n + 2) est nulle, et l’ona l’égalité :

I = J.

Dans ce cas il n’y a pas d’erreur mathématique due à une approximation; on obtient enconséquence le système suivant :

c a+1 _ï&xk - 0k=O

n

~Hk:xkp = (2p- l)!!&k=O

d o n c

je+21 (0

E= (2n+2)!d%(thz + l)!! - 2

k=O

161

Page 156: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Bien entendu, comme toutes les fois en pareil cas, on recherche une majoration la plusraisonnable possible de la fonction f(2n+2) (5) dans l’intervalle (-1, +l), en définitive, l’erreurs’exprime de la manière suivante :

E(x) = (2T;+;)! i( dzq2n + l)!! - 2 &7$+2k=O

(10.4)

où Ad&+2 = sup 1 f(2n+z) (x) 1 pour II: appartenant à (-00, +~CI).Dans la mesure où l’on peut obtenir une majoration raisonnable Mzn+2, E(z) donne l’erreur

mathématique liée à la troncature de la série des polynômes de Laguerre. Viendront s’ajouterlors des calculs effectifs les inévitables erreurs d’arrondi propagées par l’exécution des opérations.Pour 72 = 12, on trouve :

Ez4 = 1,935 10-15M24.

Les poids et les racines du polynôme de degré 12 figurent sur le tableau 10.2, tandis que le fichiertexte appelé hermite. txt que l’on trouvera sur le Web(*) donne les résultats concernant lesdouze premiers polynômes.

Tableau 10.2. Racines et poids associés des premiers polynômes d’Hermite.

Degré X H

*0,444 403 001944 139 0,806 292 983 509 187

51,340 375 197 15162 0,368 391758 069 477

f2,259 464 451000 80 0,072 984 713 184 739

1 2 *3,223 709 828 770 10 0,005 523 056 331147

f4,271825 847 932 28 0,000 121250 244 966

f5,500 901704 467 74 0,000 000 375 975 985

11. Fonction génératrice des polynômes d’Hermite

Nous admettrons les résultats suivants sans démonstration :

t2e x p x t - -

( )

t t2 tn

2= Ko(x) + -K1(x) + -K2(2) + . . . + -K,(x) + '.

1 2 n

ou encore si l’on fait usage des fonctions du cylindre parabolique :

( X2-T+xt-;

1

t t2 tnexp =Do(x) + -01(x) + -Dz(x) +...+ -l&(x) t...

1 2 n

Dans le cas où l’on utilise la définition :

Ki(x, u) = (-1)7’exp(a22)$ exp(-ax2):

*http://www.edpsciences.com/guilpin/

162

Page 157: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

10. LES POLYNÔMES D'HERMITE

on obtient :

exp (2nxt- $) = K;(x,a) + $T(x: a) + $(x,a) +. . . + ;K;(x,a) +. . .

et en particulier si a = 2~ :

27rt2exp 4rxt - ~

2 >= K;(x,2r) + $Y(x,25r) + ;K;(x:2r) +. . . + FK;(x,2n) f.. .

12. Éléments de bibliographie

A. ANGOT (1972) Compléments de Mathématiques, Éditions Masson.J. ARSAC (1962) Frans ormationf de Fourier et théorie des distributions, Éditions Dunod.J. BASS (1971) Cours de mathématiques, Tome 3, Éditions Masson.M. CROUZEIX et A.L. MIGNOT (1984) Analyse numérique des équations différentielles, Éditions

Masson.H. MINEUR (1966) Techniques de Calcul Numérique, Éditions Dunod.S. THANGAVELU (1993) Lectures on Hermite and Laguerre expansions, Princeton University

Press.

163

Page 158: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

I l CaIcuI de quelques intégralesrelevant des études

IP récédentes au moyen d’un1 changement de variable

Eu égard à la grande simplicité et à la grande précision de la méthode de Gauss généralisee7 onest fortement tenté de passer en revue le plus grand nombre de polynômes orthogonaux dans lebut évident de calculer le plus grand nombre d’intégrales présentant des singularitcs.

Tout d’abord il nous faudra définir les polynômes orthogonaux relativement à la fonctionpoids W(X) sur l’intervalle fondamental fini ou infini (n; b); puis calculer leurs zeros zk ainsi queles Hk associés. Gomme trois polynômes consécutifs de la suite ortjhogonale obcissent à unerelation de récurrence (cf. annexe B), on cherche à obtenir les coefficients de ladit,e relation derécurrence ; en règle générale, les deux premiers polynômes sont faciles à calculer.

En désignant par W7),(x) le polynôme de dcgre n de la suite orthogonale cnvisagec, on peutécrire une relation de la forme suivante :

wn+l(x) - [&(X)X + &(17:)]%(x) + G,(x)VL,(x) = 0

Ensuite, il faut être en mesure de calculer la norme d’un polynôme :

I= w(x)W,l(x) d xJ’u

car cette quantité intervient dans le calcul des Hk. Bien que le champ d’investigation soit enprincipe infini, il n’y a que peu d’issues conduisant à des expressions qui puissent être aisknent,traitées analytiquement et qui autorisent le calcul effectif des xk et des Hk. D’une manier-e toutà fait générale, les polynômes susceptibles de déboucher sur des rksultats pratiques relèventde l’étude des polynômes hypergéométriques encore appelés polynômes de .Jacobi. Nous allonspasser en revue un certain nombre de cas typiques dont l’etude se ramène aux cas précédemmentabordés.

1. Intégrale de la forme : I = j fodx()2/1”

Il s’agit donc d’étudier les polynômes Vn(x) orthogonaux relativement à la fonction poids W(X) =&) sur l’intervalle fondamental (0,l). Soit :

1 6 5

Page 159: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Le changement de variable y = G, soit x = 1 - y’, nous permet de transformer l’intégralede la façon suivante :

1

svn(l - y2)v& - Y') dy = 0.

0

Remarquons que l’on peut étendre l’intégrale à l’intervalle (-1, +1) puisque l’élément différentielest une fonction paire, d’où :

+1

J'I&(l - y2)Vk(1 - y”) dy = 0.

-1

La suite des polynômes Vn(x), lesquels sont des polynômes pairs, n’est rien d’autre que lasuite des polynômes de Legendre d’indice pair. En effet, il suffit de se reporter à la formulede Rodriguès pour vérifier que les polynômes de Legendre d’indice pair sont pairs et que lespolynômes de Legendre d’indice impairs sont impairs. Il s’ensuit que l’on peut écrire que :

KL+1(1 -X"I = P2n+2(x) = K(Y),

et que les racines yk Sont données par l’expression :

Il convient de rappeler ici que les X~C sont les zéros du polynôme de Legendre de degré (2n+ 2).Comme les racines des polynômes de Legendre sont opposées, on ne conserve que les xk positifspour calculer les yk.

Il nous reste à voir comment les Hk associés aux X~C doivent être calculés. Pour cela reprenonsl’expression générale :

H; = 1 l %+1(Y) 1

v;+dYk) o &=i Y - yk dyJ’

dans laquelle on effectue le changement de variable :

y=l-x2, soit dy = -2x dz.

En remarquant au préalable que :

$L:,(Y) = -&P2nt2(x)~ = -&G,+,(4 = Vi+l(Y)

l’expression de H* devient :

H; =

Cette dernière expression se transforme en utilisant l’identité :

1 1 1 122-G

~-~.k x - xk x + xk 1

Page 160: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. CALCUL DE QUELQUES INTÉGRALES AU MOYEN D’UN CHANGEMENT DE VARIABLE

On obtient alors

H; =1

J P2n+2 (x) dzx + xk

0 1Soit en définitive :

+1

H; =p;71+t(2d -1J P2n+2 (x) dz = 2Hk

II: - xk

où, n’hésitons pas à le répéter, les Hk sont les poids correspondant aux xk du polynôme deLegendre de degré (2n + 2). En résumé nous avons :

yk = 1 - x;H; = 2Hk.

1.1. Calcul numérique des yk et des Hk des polynômes V,(x)

Il n’est pas très difficile de calculer ces grandeurs, et le tableau 11.1 donne les résultats du calculpour le polynôme de degré 11. Sur le Web (*), on trouvera les résultats concernant les premierspolynômes dans le fichier texte vn-x . txt.

Tableau 11.1. Zéros et poids correspondants des polynômes l&(x).

Degré yk Hk

0,995 136 433 756 837 0,278 503 745 7112650,956 794 043 016 991 0,273 082 996 692 0250,883 079 894 390 853 0,262 347 009 574 1580,779 705 097 347 766 0,246 504 753 620 8710,654 678 756 166 416 0,225 864 592 161418

1 1 0,517 687441268 599 0,200 828 288 893 5940,379 344 680 233 946 0,171883 212 409 7730,250 368 580 202 265 0,139 592 936 925 3310,140 751142 618 251 0,104 586 670 228 4150,058 982 630 398 875 0,067 549 803 115 9030,011378 277 344 275 0,029 255 990 740 224

1.2. Technique d’intégration

On utilise toujours la même relation pour effectuer une approximation de la valeur de 1, soit :

J = ,&f;f(yk).k=O

*http://www.edpsciences.com/guilpin/

1 6 7

Page 161: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On peut également calculer les intégrales du type :

.Ih f(x) ,

I= « &Ti dxqui se ramène au cas précédent au moyen du changement de variable :

x - ay==

ce qui nous permet d’écrire :

0

Il suffit à présent de poser y$ = a + (b- a)yk pour obtenir la forme désirée, J est alors approchéepar l’expression :

1.3. Un exemple d’intégration

.J = dEi2 “,Tf(y$).k=O

On se propose de calculer :

dz = 413 = 1,333 333 333 333 333.

Les résultats que nous avons obtenus sont donnés dans le tableau 11.2.

Tableau 11.2 .

Nombre de points Résultat

2 1,333 333 333 333 3333 1,333 333 333 333 3334 1,333 333 333 333 3335 1,333 333 333 333 3316 1,333 333 333 032

On vérifie que, puisque f(x) est un polynôme du premier degré, les résultats doivent êtrerigoureux à partir de n = 2. Cependant, nous avons tenu à donner les autres résultats pourmontrer que la précision se dégrade avec le nombre croissant de points car apparaissent lesinévitables erreurs de troncature qui affectent la précision des racines et des poids associés ainsique la précision de la somme.

168

Page 162: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. CALCUL DE QUELQUES INTÉGR.ALES AU MOYEN D’UN CHANGEMENT DE VARIABLE

2. Intégrale de la forme I = J f(x)z/Gdx0

Il va de soi que nous allons nous intéresser aux polynômes orthogonaux U,(X) relativement à lafonction de base W(X) = G et l’intervalle (0, l), soit :

I

IUn(x)Uk(x)G dz = 0 avec m # k.

0

Le changement de variable y = fi, soit 2 = 1 ~ y2, nous permet d’tcrire :

1

s

y2Un(l ~ y2)Uk(l - y”) dz = 0 avec m # k.

0

Comme l’élément différentiel est une fonction paire, on en conclut que :

+1

sy2&(l - y2)Uk(1 -y”) dz = 0 avec m # k.

-1

Par conséquent les polynômes yU,, (1 - y”) sont des polynômes impairs orthogonaux surl’intervalle (0,l) relativement à la fonction de base W(Z) = fi. Il s’agit là des polynômesde Legendre de degré impair qui sont de surcroît impairs. Donc :

de là on déduit que :

On calculera les racines yk de Uzn+i (y) \ p t’ da ar ir es racines du polynôme de degré (2n + 1).Remarquons que les polynômes de Legendre de degré impair possèdent toujours une racine

nulle et 2n racines réelles opposées, donc pour obtenir les yh il suffit de poser :

yk = 1 - x;.

La racine nulle de Pzn+s(z) correspond à la racine nulle évidente du polynôme yUn+1 (1~ y2).À présent, calculons les H,$ correspondant aux yk :

1

H;c ’

u;+,(Yd J’

‘n+l (YY)- dy.

Y ~ Yk0

Le changement de variable 2 = fi transforme cette expression en :

1

s

Un+i(1 ~ 33)X?dy.J: - xk

0

1 6 9

Page 163: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

En notant que :

u;+,(Y) = p’-2xi2n+364et que

on aboutit finalement à une expression simple de H; :

H; = P2n+3(2)

x - xkdz = 2Hkx2,.

Rappelons que les xk et les Hk sont les zéros et les poids associés du polynôme de Legendrede degré (2n. + 3). En définitive, nous avons :

z/k = 1 - XE

H; = 2Hk. x;

2.1. Calcul numérique des yk et des Hi des polynômes U,(y)

On a reporté sur le tableau 11.3 les résultats obtenus pour le polynôme de degré Il, résultatsdirectement déduits de l’étude des polynômes de Legendre. Sur le Web(*), on trouvera lesrésultats concernant les premiers polynômes dans le fichier texte un-x. txt.

Tableau 11.3. Les zéros et les poids correspondants des polynômes Un(x).

Degré Yk Hk

1 1

0,982 242 618 777 886 0,004 704 357 862 3350,930 232 342 038 332 0,017 986 900 669 8400,847 665 099 712 485 0,037 489 339 976 6740,740 408 244 072 688 0,059 704 359 522 1250,616 083 601856 242 0,080 539 587 896 1910,483 525 845 139 551 0,095 977 183 512 4520,352 154 660 959 083 0,102 724 186 114 7030,231305 302 178 075 0,098 750 243 709 7960,010 433 970 271955 0,026 543 841354 4870,054 161141423 958 0,058 619 320 1413030,129 564 951355 262 0,083 627 346 047 326

*http://www.edpsciences.com/guilpin/

1 7 0

Page 164: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. CALCUL DE QUELQUES INTÉGRALES AU MOYEN D’UN CHANGEMENT DE VARIABLE

2.2. Technique d’intégration

On approche l’intégrale par la même formule, à savoir :

n

J = c Gf(~k).

tandis que l’intégrale :

s’approche par l’expression :

J = (b - CZ)~/~ 5 H;f(Llk).k=O

où les valeurs y; sont données par la relation :

y; = a + (b - U)Yk.

Ce dernier résultat est obtenu d’une manière tout à fait identique à celui établi dans le dernierparagraphe à cette différence près que l’on effectue le changement de variable y = a + (b - a)zdans l’intégrale donnant Hi.

2.3. Un exemple d’intégration

Nous nous proposons de calculer :

1

1 =sx3- dx = rY4PY3/2) =r(w) 0,101587 3 0 1 5 8 7 3015,

0

où l?(x) est la fonction factorielle.On donne dans le tableau 11.4 les valeurs trouvées.

Tableau 11.4.

Nombre de points Résultat

2 0,101587 3 0 1 5 8 7 3 0 1 53 0,101587 3 0 1 5 8 7 3 0 1 54 0,101587 3 0 1 5 8 7 3 0 1 35 0,101587 3 0 1 5 8 7 3 0 1 26 0,101587 30’ 587 3 0 1 0

Bien entendu, comme f(x) est un polynôme de degré 3, nous devons trouver un résultat exactà partir de deux points. Ici encore, nous avons voulu montrer l’influence des troncatures et desarrondis sur les calculs.

171

Page 165: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3. Intégrales de la forme I = j! dmdx- 1

Sans entrer dans les détails, disons que l’étude des polynômes R,(s) orthogonaux relativementà la fonction poids W(X) = dm et à l’intervalle (-1, +1) relève directement de l’étude despolynômes de Tchcbycheff. Les zéros de R,,,,+l(z) sont donnés par :

k+1Xk = COS -7l( 1n+2

tandis que les Hz correspondants sont donnés par :

3.1. Calcul numérique des xk et des Ht des polynômes R,(x)

Dans le tableau 11.5 on a reporté les valeurs numériques calculées pour le polynôme de degré11. Sur le Web(*), on trouvera les résultats concernant les premiers polynômes dans le fichiertexte rn-x . txt.

Tableau 11.5. Les h-os et les poids correspondants des polynômes R,(x).

Degré

1 1

Yk HI,

f0,965 925 826 289 068 0,017 537 233 634 936f0,866 025 403 784 439 0,065 449 846 949 787f0,707 106 781186 548 0,130 899 693 899 57550,500 000 000 000 000 0,196 349 540 849 362*0,258 819 045 102 521 0,244 262 154 1 6 4 21360 0,261799 387 799 1 4 9

3.2. Technique d’intégration

L’intégrale I est bien entendu approchée par l’expression devenue classique :

Il est intéressant dc noter que les intégrales de la forme :

b

I = J ~(X)&X - a)@ - x) dza*http://www.edpsciences.com/guilpin/

1 7 2

Page 166: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. CALCUL DE QUELQUES INTÉGRALES AU MOYEN D’UN CHANGEMENT DE VARIABLE

se ramènent au cas précédemment étudié à condition de faire usage du changement de variablesuivant :

b+axi = ~

b - a2 + TX”.

Cette dernière intégrale est alors approchée par :

J = 2 Hkf(xi).k=O

3.3. Un exemple numérique

Soit à calculer :

+1

I= zJ1-ldJ:=O.J- 1

Sur le tableau 11.6, nous avons porté les valeurs approchées. On vérifie que les erreurs sontde l’ordre de 10P16, et qu’elles ne sont dues qu’à l’exécution des calculs.

Tableau 11.6.

Nombre de points Résultats

3 0,166 10-154 0,97110-i”5 0,277 10-l”6 0,555 10-167 0,598 10-16

4. Intégrales de la forme I = J! f (x) @x0

Ici encore l’étude des polynômes S&(x) orthogonaux relativement à la fonction poids W(X) =et à l’intervalle (-1, +l) relève directement de l’étude des polynômes de Tchebycheff. Les

zéros de Sri(x) s’expriment au moyen de la relation :

xk = Cos2 avec k=O,1,2 ,..., n

et les H* par la relation :

27rH; = ~2n + 3xk.

173

Page 167: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

4.1. Calcul numérique des xk et des Ht des polynômes s,(x)

On trouvera sur le tableau 11.7 les valeurs numériques correspondant au polynôme de degré 11.Sur le Web (*), on trouvera les résultats concernant les premiers polynômes dans le fichier textesn-x . txt.

Tableau 11.7. Les zéros et les poids associés des polynômes S,(x).

Degré Yk

1 1

0,995 342 973 018 165 0,271909 754 072 7040,958 605 650 752 726 0,261873 780 008 2110,887 855 645 352 210 0,242 546 154 164 0630,788 340 161057 434 0,215 360 318 1311150,667 439 806 085 493 0,182 332 5210010070,534 121206 682 336 0,145 912 283 394 7600,398 271993 473 683 0,108 800 727 724 1290,269 967 481134 424 0,073 750 248 299 1350,158 723 428 390 673 0,043 360 378 833 4540,072 790 297 726 756 0,019 884 996 920 9560,018 541356 326 101 0,005 065 164 245 362

4.2. Technique d’intégration

L’intégrale 1 est toujours approchée par l’expression :

Il est intéressant de noter que les intégrales de la forme :

se ramènent au cas précédemment étudié en faisant usage du changement de variable : x =a + (b - a)y ce qui permet d’approcher l’intégrale au moyen de l’expression :

soit encore :

J = “f;.p,’ k zkf [a + (b - a)xk]

k=O

*http://www.edpsciences.com/guilpin/

1 7 4

Page 168: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. CALCUL DE QUELQUES INTÉGRALES AU MOYEN D’UN CHANGEMENT DE VARIABLE

4.3. Un exemple numérique

Soit à calculer :

1 =

- 1

Il s’agit d’intégrer un polynôme de degré zéro. Les résultats trouvés sont donnés dans letableau 11.8. Ici encore les erreurs ne sont dues qu’à l’exécution des calculs, et l’on note que lesdeux derniers chiffres significatifs sont faux.

Tableau 11.8.

Nombre de points Résultats

3 3,141592 653 589 7924 3,141592 653 589 7915 3,141592 653 589 7916 3,141592 653 589 791

5. Éléments de bibliographie

M. CROUZEIX et A.L. MIGNOT (1984) Analyse numérique des équations dijférentielles, ÉditionsMasson.

H. MINEUR (1966) Techniques de CuZcuZ hmérique, Éditions Dunod.

175

Page 169: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12 Les polynômes de Bernoulli,/,,<//, 2, ‘:-/: / formule d’Euler-MacLaurin.Méthode de Romberg et autres

1 techniques d’intégration

1. Formule d’Euler-MacLaurin

Les polynômes et les nombres de Bernoulli (Jacques Bernoulli 1654-1705) jouent un rôleimportant en analyse mathématique. Ces éléments sont à la base d’une technique d’intégrationnumérique obtenue à partir de la formule d’Euler-MacLaurin, laquelle sert ensuite de tremplinà la méthode de Romberg. Au passage nous verrons une application des nombres de Bernoulliau calcul de la constante d’Euler.

Ces polyômes de Bernoulli possèdent une autre propriété concernant les séries de Fourier :on peut considérer les fonctions périodiques de période 1 représentées sur une période par lespolynômes de Bernoulli de degré 4 et noté B4(z). Le coefficient de rang n de ce développement(a, ou b,, selon la parité) est en l/nq. Cette propriété relie aussi de près ces polynômes àla fonction dzeta de Riemann (182661866), et plus spécifiquement les nombres de Bernoulli.En outre, cela signifie que les fonctions périodiques qui sont définies sur une période par lespolynômes de Bernoulli, non seulement sont continues, mais ont toutes leurs dérivées continuespartout. Notamment, aux extrémités de l’intervalle (0, l), les fonctions sont continues à dérivéescontinues, bien entendu, nous ne nous intéressons qu’aux dérivées non nulles.

1.1. Fonction génératrice des polynômes de Bernoulli

Les polynômes de Bernoulli sont les coefficients du développement de l’expression suivante :

u exp(uz)exp(u) - 1 = z. $wd. (12.1)

Par dérivation de la formule (12.1), on montre que :

et par identification directe, on voit que :

E&(z) = 1. (12.3)

En utilisant l’identité :

(-2~) exp( -zu) = u exd(l - ~14exp(-u) - 1 exp(u) - 1

177

Page 170: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

puis la relation de définition (12.1), on déduit alors l’expression suivante :

Bk(l- x) = (-l)“B&)

ce qui permet d’écrire :

Bk(1) = (-l)“Bk(O).

En intégrant la relation (12.1) par rapport à Z, on établit que :

sBk(x)dx=O pour k>O.

0

On obtient alors :

BO(X) = 1,1

Bl(X) = x - ->2

1B2(x)=x2-xf-

6’3 x

BS(X) = x3 - -x2 + -.2 2

1.2. Les nombres de Bernoulli

Par définition, les nombres de Bernoulli sont donnés par l’expression :

(12.4)

En faisant x = 0 dans la formule (12.1) pour obtenir les nombres de Bernoulli, on voit que lafonction :

21exp(u) - 1

+ ; = ;coth;

est une fonction paire. On déduit alors que :

e t

B2m+1=0 avec m 2 1.

Il s’ensuit que les nombres de Bernoulli de rang impair ~ hormis le premier - sont nulset que seuls diffèrent de zéro les nombres de Bernoulli de rang pair. Voici donc les premiers

178

Page 171: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MACLAURIN

nombres de Bernoulli non nuls :

1BO = 1 B1 = --

21

301 1Bfj = - BS = - -

42 30691Blo 5= - B12 = -~

66 2 7307 3617B14 = - B16 = ~~6 510

174 611BIS 43 867= - B2,, = -~798 330854 513

Bas236 364 091Bz2 = ~ = -138 2730

1.3. Expression des polynômes de Bernoulli en fonction des nombresde Bernoulli

Pour IC = 0, l’expression (12.1) nous donne :

U uzn

exp(u) - 1=l+Blu+B2;+B&+.~ ~. + Bzn (2n)! + . .

il s’ensuit que :

u exp(uz) Uexp(u) - 1 = exp(u) - 1

exp(ux) =u2x2 u3x3 UkXk

1 + 7 + 7 + 7 + . . . + 7 + . . .

l+BIu+B~;+B,$+-~ Uzn~. + B2n (2n)! + . .>

= 2 $Bn(x) = 1 + B&); + B,(x): + B&>$ + ...n=O

L’identification des termes en u donne :

Bk cx) Xk xk-l

Ic! = XT+ ( k - l ) !

1‘..+ ~~;;1 si k est impair,

. ..+ -g si k est pair.

De là nous tirons l’expression générale :

&(x) = xk + xk-lB1 + x”-~C~B~ + xkp4C;B4 + . . .. . . + X&+l si k est impair,

. + Bk si k est pair.

Page 172: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.4. La formule d’Euler-Maclaurin dite formule de la somme

Il s’agit d’une méthode d’intégration qui utilise les nombres de Bernoulli; pour l’obtenir, nousallons intégrer successivement par parties l’expression suivante :

CC+11

F(x + h) - F(x) = / F’(t) dt = ]J”(z + h - t) dt.

z 0

On aboutit alors à la formule usuelle :

F(x + h) ~ F(z) = hF’(z) + $“‘(x) + . . + h’“pqn:)(2P)!

h

+...+J

F(2p+1)(x + h - t)& dt. (12.5)

0

Maintenant, nous allons appliquer la relation (12.5) aux dérivées successives de F(z), en nousarrêtant toutefois au même ordre à chaque fois. Nous obtenons les formules suivantes :

h[F’(z + h) - F’(z)] = h2F”(z) + . . + h2p j7(2P+.)(2p - l)!

+ h ~ t) t2p-1(2p ~ l)!

dt, (12.6)

h2[F”(z + h) - F”(z)] = h3F”‘(s) + . . + h2P Jd2”) (4(21, - 2)!

h

+ h2J'

F(2p+1)(x + h ~ t)t2"-2

(21, ~ 2)!dt, (12.7)

0

h” [F@)(s + h) - &‘@)(z)] = hk+‘F(“+‘)(z) + . + (2phyk)! F(2P)(x)

1L

+ h’”J’

F(2p+1)(x + h - t) t2p-” d t . ( 1 2 . 8 )(2p ~ k)!

0

On poursuit le calcul jusqu’à l’ordre (217 - l), soit :

h

h2P-l $2PF1+-+ /+F(2PPl)(X)l = h2Pj7(2P)(x)+ h2P-1

/F(2p+‘)(x + h - t)t dt. (12.9)

0

À présent, nous allons multiplier l’égalité (12.5) par BO, puis l’égalité (12.6) par Bi/l! et ainside suite, c’est-à-dire l’égalité (12.8) par Bk/k!. Additionnons toutes ces relations, puis, en se

180

Page 173: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MACLAURIN

souvenant que B2m+l = 0, on obtient le coefficient de F (k) (x) que l’on désignera par c :

B&(k - 1) + B&(k - l)(k - 2)2! 3!

+. +B,k(k-1),.(-J-l). .j !

+...

)

expression que l’on peut écrire sous la forme :

1C= -

lC!l+c~&+c~B2+...+C2~B .+k 23 ...

où Cz est le coefficient du binôme. En utilisant la relation (12.4) du paragraphe 1.1, nousremarquons que :

c = Bk(1) - Bk (k est pair).

On en déduit alors que c = 0. En définitive, il reste :

F(x + h) - F(x) = -Blh [F’(x + h) + F’(x)] + Bz; [F”(x + h) - F”(x)]

F(2P4) (x + h) _ F@P-2)

h

+...+ J F(2p+1)(x + h - t) &

0 [ .

t2P-1

+ B1h(2p - l)!

2k+...+

B2kh2”t2P- B2p-2h2P-2 2(217 - Lk)!(Lk)! +. . + (2p - 2)!2! t 1 dt.

(12.10)

La dernière parenthèse s’exprime simplement en fonction du polynôme de Bernoulli de degré2p; pour cela on remarque que :

B2p-2h2P-2 h2P(2p - 2)!2! t2 = &qBZp

h2P-4~p=&&p(+%p].

(2P)!

Si maintenant on pose F’(X) = f(x), nous obtenons une expression canonique qui prend alorsla forme suivante :

x+h

Jf(t) dt = -Blh [f(x + h) + f(x)] + y [f’(x + h) + f’(x)]

zh

h2P~

+ ‘. . + (2p)! J f(2p)(x+h-t) b2p(;) -B2p] dt. (12.11)

0

Évaluation du reste - Le reste est donné par l’expression :

hh2P~

E = (2p!) oJ f(2p)(x+h-t) b2p(;) -n,,] d t (12.12)

181

Page 174: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

soit :

h h

f(2p)(x + h - t)B2p dt + &,/+2P)(s+h-i)B2, (4) dt .

0

Comme Bzp et BQ, (i) conservent chacun un signe constant, on peut appliquer à chacun desdeux termes de cette relation la formule de la moyenne en trouvant un nombre 0 compris entre0 et 1 tel que :

E = $$~fc2pJ(x + Oh)Bapl + l& fcap)(x + Oh) / Bzp (;) dtl

0h

mais :.I

B&/h) dt = 0,

0

on obtient en définitive :

1.5. Application au calcul des intégrales simples

Considérons un intervalle fini (a, b) divisé en n sous-intervalles de longueur identique h,autrement dit, on définit des points xk en progression arithmétique sur l’intervalle (a, b) telsque :

x0 = a, xl = a + h, ~2 = a + 2h, . . . , x, = a + nh = b.

Appliquons la relation (12.11) à chaque sous-intervalle puis effectuons la somme de toutes cesrelations. En posant pour plus de clarté yk = f(u + kh) avec k = 1,2,. . . , TL, nous obtenons :

b

a;yo+yl+y2+-. +

B2h27 F’(b) ~ ml

B4h4+ 4! [j-f”(b) - f’ff(u)l + . . + B2p-2h2P-2 [fc2~-3)(b) _ f(2~-3)(~)]

(2p - 2)!

l’erreur étant majorée par

E = l%J;;~+l 2 f(2P)(Xi).i=l

Remarque : On reconnaît dans la première parenthèse du membre de droite l’expression de laformule des trapèzes que du reste on obtient rigoureusement en faisant p = 1 dans la dernièrerelation.

182

Page 175: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MACLAURIN

Application au calcul de la constante d’Euler - Par définition, la constante d’Euler (1707-1783) est donnée par l’expression :

y = liliv(

1 + ; + ; + ; + ‘. +. ‘. + ; - log,(m))

Cette série ne converge pas très rapidement, aussi lui préfère-t-on un développement asympto-tique encore appelé série semi-convergente que l’on obtient de la façon suivante : dans l’expressionprécédente, on fait f(x) = loge(z), h = 1 et ICI = m (entier positif quelconque). On obtient alorssans problème :

1=log,(m)+y-&-&---

120m4 & + . ’ +(-lPh +. . .

k = l2,qrn2”

Retenons les treize premiers nombres de Bernoulli (non nuls), et calculons la somme pourm = 13 : alors, on obtient y avec quinze chiffres significatifs exacts en utilisant la représentationdes nombres sur huit octets (16 chiffres significatifs).

1.6. Application au modèle des chaleurs spécifiques selon Debye (1884-1966)En 1912, Debye a proposé un modèle de la chaleur spécifique des solides qui aboutit au résultatsuivant (le modèle ainsi que l’utilisation des nombres de Bernoulli sont présentés dans l’ouvragede Rocard cité en bibliographie) :

z

.IY3

du -3 x

expb) - 1 exp(x) - 10

où x = U/T (U est une constante dépendant uniquement de la nature du corps considéré, elles’appelle température caractéristique). On se propose d’établir une table de la chaleur spécifiquede l’argent pour lequel U = 215 K. On écrit les relations suivantes :

Xexp(x) - 1

avec &k+r = 0,n=O

Y3exp(y) - 1 n=O

puis on calcule l’intégrale :2s exp;; _ 1 dy = 2 yn+3

x2k+3

0 n=. (n + 3)n!B, = ; - ; +F

k=l (2k + 3)(2k)! B2k

on déduit que :

d’où

1+3~ci?2&$ .kEl (2k)!

Cette dernière expression a fait l’objet du programme argent. c qui est donné sur le Web (*).

*http://www.edpsciences.com/guilpin/

183

Page 176: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.7. La méthode de Romberg

Quand on calcule une intégrale 1 = 5: f(x) d IL~ p a r 1 a méthode des trapèzes avec un pas h, = $$,n

on obtient la relation suivante :

If = + f(u) + f(b) + nj f(a + khn)k=l

avec comme expression de l’erreur mathématique de troncature :

E, = -vf”(:,) avec a < a: < b.

Si n tend vers l’infini, la suite Inn, générée par la méthode des trapèzes, converge vers la valeurde l’intégrale. On peut alors songer à accélérer la procédure de convergence au moyen d’un desalgorithmes présentés au chapitre 2, mais on peut aussi utiliser le fait que l’erreur est donnéepar la formule d’Euler-MacLaurin en soulignant toutefois que la fonction f(x) doit être (2~ + 2)fois dérivable sur l’intervalle (a, b). Revenons à cette expression de l’erreur :

h2Pt2hn

E = (2JT+ 2)! J’ f2p+2(x+hn-t) [n,, (;) -n,,+,] &0

2et nous notons que cette erreur est un polynôme en h,. L’idée de la méthode de Romberg reposesur le calcul de 1, pour des valeurs différentes de h,, et de construire le polynôme d’interpolationde la variable hk passant par les 1n puis de calculer la valeur de ce polynôme d’interpolationpour h, = 0. Il faut bien remarquer que la valeur obtenue de In pour en h, tendant vers zéroest une extrapolation du polynôme d’interpolation.

Pour réaliser l’extrapolation, on aura recours à la procédure de Richardson généralisée- généralisation qui semble avoir été conçue à cet effet. Comme l’erreur est un polynôme enhi, on prendra :

Malheureusement, si nous appliquons le procédé de Richardson à la suite des In, la conditionassurant la convergence ne sera pas vérifiée car :

hnlim ~h

= 1 quand n tend vers l’infini.n+l

Pour pallier cet inconvénient, et assurer la condition de convergence, on choisit la suite S,formée par les valeurs Iz,,. Autrement dit, on calculera les intégrales 1n par la méthode destrapèzes avec un pas donné par l’expression :

b - ahz, = ~

2 ”avec ho = b ~ a.

On vérifie alors que l’on obtient :

X, ho 2n+1lim- = -~ =x,+1 2” ho

2.

184

Page 177: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES PoLwvôMEs DE BERNOULLI, FORMULE D'EULER-MACLAURIN

Reprenant l’expression de la méthode de Richardson généralisée et en posant :

F(O) = 0 e t F(z,) = 2,

nous pouvons écrire :

T(k+l) _ (ho/2n)Tf21 - (ho/2n+“+1)TTF72 (ho/2n)2 - (/@/2n+k+1)2 :

ce qui s’écrit encore :

T(“+l) =4k:+‘T~~l - Tik)

n 4’“+1- 1 .

En résumé, on utilise les relations suivantes :

h =bpa0-n ’

hz=;,

Sio) = h,, f(a) + f(b)2 +ef(a+kh,,) avec m = 2n - 1.

k=l

1.8. Un exemple numérique

On se propose de calculer l’intégrale suivante :

1

1 =.I

1% (1+ xl dz =1 + x ; [log,(2)]’ = 0,240 226 5 0 7

0

et de former la suite des Ik à partir de ho = f . On obtient alors le tableau 12.1

Tableau 12.1.

Suite initiale

0,22 8

0,235 5

0,239 03

0,239 926

0,240 151

0,240 066 60,240 216 00

0,240 206 6 0,240 226 030,240 225 87 0,240 226 653

0,240 224 6 0,240 226 6510,240 226 64

0,240 226 5

L’erreur est E = 0,14 1OW”. L’epsilon-algorithme appliqué à la même suite donne le résultatsuivant : I = 0,240 225 49 avec une erreur E = 0,l 10F5.

1 8 5

Page 178: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Si la méthode de Romberg donne un résultat avec un ordre de grandeur meilleur que lerésultat donné par la méthode de l’epsilon-algorithme, on obtient encore de meilleurs résultatsavec beaucoup moins de calculs en utilisant la méthode de Gauss-Legendre dont voici les résultatsen 4, 6 et 12 points.

4 points I = 0,2402286 points I = 0,240 226 509

1 2 points I = 0,240 226 507.

Ces derniers calculs ont été réalisés avec une machine fonctionnant avec 10 chiffres significatifs.

2. Autres méthodes d’intégration

Si les méthodes fondées sur la technique de Gauss sont, d’une façon générale, les plus perfor-mantes, il existe un certain nombre d’algorithmes très simples qui méritent d’être présentés, neserait-ce que pour la réflexion qu’ils suscitent.

Il est bien entendu que l’on s’intéresse ici à l’intégration numérique des fonctions dontl’intégrale sur un intervalle fini (a, b) a un sens, d’ailleurs cette fonction peut être continuepar morceaux avec des points de discontinuité de première espèce. Cela signifie que l’on effectuele calcul sur les différents morceaux selon une des méthodes que nous allons exposer, et que nousen ferons ensuite la somme.

Une intégrale peut avoir un sens bien que la fonction à intégrer présente une apparence dediscontinuité de seconde espèce : nous avons rencontré un exemple à propos de la méthode deGauss généralisée : les singularités étaient alors contenues dans la fonction-poids aux bornes del’intervalle fondamental.

Quoi qu’il en soit, nous nous intéressons au calcul de :

1 = f(z)dzsa

où a et b sont des nombres finis et f(z) une fonction continue possédant des dérivées jusqu’àl’ordre nécessaire pour le besoin des calculs d’erreur.

2.1. La méthode des rectangles

L’intervalle sur lequel s’effectue l’intégration est divisé en N sous-intervalles de longueur égaleh = (b-a)/N c e qru nous définit une suite d’abscisses xi en progression arithmétique. La valeurde l’intégrale entre deux points consécutifs xi et xi+1 notée si est approchée par s: :

si = hf(xi) ;

la sommation des si fournit une approximation de l’intégrale 1. Désignons par 1’ l’approximationobtenue :

N-l N-lI’.= c si = c f(G).

i=o i=o

Page 179: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES PoLyrvônnEs DE BERNOULLI, FORMULE D'EULER-MACLAURIN

Estimation de l’erreur mathématique - L’erreur due à l’approximation mathématique s’écrit :

E = II- 1'1.

Désignons par F(U) la primitive de la fonction f(x). Nous pouvons écrire :

puis :

Ei = si - si = F(x~+~) - F(zi) - hf(zi) = F(xi+h) - F(G) - kf(G).

Cette expression va nous permettre d’obtenir une évaluation de l’erreur en effectuant undéveloppement limité de F(Q+~) à l’ordre deux avec l’expression du reste de Lagrange, soit :

E, = F(Q)+ hf(zi)+ ;f'(qi) -F(G) ~ hf(zi)

où ni est un nombre compris entre ICI et X~+I. À partir de là, on obtient une estimation de Ei,soit :

suivie de celle de E :

E = ; Nff'(,ii).i=o

Cette expression prend une forme plus simple en majorant la somme, soit :

où Mr est le sup de la valeur absolue de la dérivée f’(x) sur l’intervalle (a, b)

2.2. La méthode des trapèzes

En conservant les notations du précédent paragraphe, on désigne par si la valeur de l’intégralecalculée entre deux points consécutifs zi et zi+l ; elle est approchée par si :

s: = ; [f(%+1) + f(G)1

qui représente la surface du trapèze déterminé par les points xi, X~+I, f(~i) et f(~i+r). Endésignant par 1’ l’approximation de l’intégrale 1 obtenue par sommation des si, nous pouvonsécrire :

N - l

1’ = c s; = ;f(x,,) + f(%N) + 2 Ne f(xi) .

i=O i=l

1 8 7

Page 180: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Estimation de l’erreur mathématique - Cette technique va nous permettre de gagner un ordrede grandeur en précision par rapport à la méthode des rectangles. Écrivons la nouvelle valeurde l’erreur que nous appelons Ei :

I-3, = si - s: = F(~i+l) - F(xi) - ; [f(xi+l) + f(xi)]

= F(Xi+tz) - F(G) - ; [f(Xi+fL) + f(G)]

Effectuons un développement limité de F(~i+h) et de f(~i+h) respectivement à l’ordre troiset deux avec les expressions associées du reste de Lagrange, soit :

où vi et Ei sont deux nombres compris entre zi et X~+I. À partir de là, on obtient une estimationde E, :

où Bi est un nombre compris entre xi et IC~+I. Il s’ensuit l’expression de E :

Cette expression prend une forme plus simple en majorant la somme, soit :

E = -NM2 = (i’~~,1 2 12N2

où A42 est le sup de la valeur absolue de la dérivée deuxième f”(z) sur l’intervalle (a, b).

3. La méthode de Simpson (1811-1870)

La méthode de Simpson repose sur l’utilisation de la formule d’intégration dite des trois niveaux.Cela signifie que l’on réalise une interpolation parabolique au lieu de l’interpolation linéaireutilisée dans la méthode des trapèzes, mais le gain est plus conséquent car la formule des troisniveaux étant exacte pour un polynôme de degré trois, l’interpolation réalisée est celle d’uneparabole cubique. Le calcul de l’erreur nous montrera qu’il en est bien ainsi, en constatant queson expression est proportionnelle à 1/N4.

Toutefois, une légère différence existe dans le découpage de l’intervalle (a, b) qui est maintenantréalisé à l’aide d’un nombre pair de points, soit 2N ce nombre, ainsi h est donné par l’expressionh = ( b - U)/~N.D ans ces conditions, la formule d’intégration qui porte sur trois pointsconsécutifs s’écrit :

puis :

h4 = - [f(Qi) + 4f(Qi+1) + f(X2i+2)1 ,

3

N - l

1’ = c 5’: = ;f(Xo + f(xN) + 2 Nc f(Qi) + 4 N$ f(Xzi+i) .i=o i=l i=O

Page 181: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MAC%AURIN

Estimation de l’erreur mathématique - En adoptant le procédé exploite pour les méthodesprécédentes, nous écrivons la nouvelle valeur de E, :

G = si ~ s: =F(%+a)- F(zzi)- ; [f(zai)+4f(z2i+1)+ f(xai+a)],

= F(X2i + 2h) ~ F(Z22) - ; [f(X2i + 2h)+ f(zzi)+ 4f(xz+r)].

Effectuons un développement limité de F(xzi + h), f(zai + 2h) et de f(x2% + h) respectivementà l’ordre cinq pour le premier et quatre pour les deux autres; on obtient :

EL = 2hf(zi) + 2h2f’(4 + $f”(z) + ~~“(CC) + $&) - ; (f(x) + 2hf’(zi)

+ 2h2f”(2i) + +(Xi) + ~/qo)) - ; (f(x;) + 4f(G) + 4hf’(Xi) + 2Pf”(L7Ji)

où [i, (p,i et Oi sont deux nombres compris entre x2i et x2%+2. À partir de là, on obtient uneestimation de Ei :

E, = ;f’“(pi)

où pi est un nombre compris entre zi et X~+I. Il s’ensuit l’expression de E :

E = $ ” flv(pi).i=o

Il est aisé d’obtenir une forme plus simple en majorant la valeur de la dérivée sur l’intervalle(a, b), on obtient le résultat suivant :

E = zNM4 = BM4, (il y a 2N points),

où Md est le sup de la valeur absolue de la dérivée d’ordre quatre sur l’intervalle (a, b).

Remarque : Autant il est aisé de tirer des conclusions quand au rôle joué par N dans chacunedes méthodes, autant il est impossible de savoir quoi que ce soit concernant les majorations desdérivées d’ordre de plus en plus élevé. Les quelques exercices que l’on peut mener facilementle montrent fort bien : dans bien des cas, la majoration d’une dérivée d’ordre m conduità des résultats décevants qui contrebalancent le gain obtenu par la puissance de N (granddénominateur).

Prenons un exemple simple :10

I= /exp(-z") dz.

0

Les dérivations successives de exp( -x2) génèrent des polynômes qui ont une grosse parenté avecles polynômes d’Hermite (cf la formule de Rodriguès générant les polynômes d’Hermite). Touscalculs faits, on trouve les résultats suivants : Mr = 0,43, M2 = 0,893 et Md = 10,95, ainsi, surl’intervalle (0, lO), et l’on voit que

M4- = 25,5.M l

189

Page 182: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3.1. Méthode de Newton-Cotes (1682-1716)

Soit une fonction f(z) continue sur (-1, +l) laquelle possède des dérivées continues sur lemême intervalle jusqu’à l’ordre (n + 1) au moins. On connaît un échantillon de la fonction f(z)constitué de (n+ 1) points yk = f(xk) correspondant à des abscisses en progression arithmétiquexl,=-1+%

On se propose de calculer l’intégrale 1 = Y~(X) d x au moyen d’une approximation J qui-1

consiste à remplacer f(x) par le polynôme de Lagrange donné par la formule de Lagrange, soit :n

+1 rp-x3)

J = &k)/ ‘;” dz = 2 f(xk)&.k=O -l n(xk - xj)

k=O

j#k

Le calcul des Hk s’effectue au moyen du changement de variable xk = - 1+ %, ce qui donne :

Hk = (-1)“-k2 “u(u - 1)nk!(n ~ k)! s . . . (u - k + l)(u - k - 1). . . (u - n) du,

0

Hk = (-1)“-k2 nP&h) d u .nk!(n - k)! s

0

Nous allons transformer Pk(u) en l’écrivant sous la forme suivante :

l’exposant (k) rappelant qu’il s’agit des coefficients du ke polynôme. Cette expression peut fairel’objet d’une intégration terme à terme à condition de connaître les ay). Cela est aisé à l’aide desrelations de Newton puisque l’on connaît les racines de Pk(u) lesquelles sont les entiers positifssuccessifs à l’exception de k. On calcule au préalable les S” qui sont les sommes des racines àla puissance m.

L’intégration de Pk(u) entre 0 et n est immédiate. si l’intervalle d’intégration est (a,b), lechangement de variable permet d’obtenir :

+1

sf(x) dz = 7 2 Hkf(a + kh) a v e c h = e .

-1 k=O

L’expression de l’erreur E = 11 - JI est estimée à partir de l’expression de l’erreur commiseen remplaçant f(x) par le polynôme de Lagrange PL(X), soit :

+1

E =s

{f(x) -PL(X)) dx >-1

y%+2

E = (;y+;)! Rn+2

nn

sn(u - j) du

o j=o

1 9 0

Page 183: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI, FORMULE D'EULER-MACLAURIN

où A&+i est le sup du module de ~C”+‘)(Z) sur l’intervalle (a, b). Rappelons que le calcul deM n+i est rarement simple. L’intégration du polynôme sous le signe somme est effectuée de lamême manière que celle de Hk.

Sur le Web(*), on trouvera le programme cotes-i. c qui réalise cette technique d’intégrationsuivi d’un autre programme cotes-2. c qui calcule la quantité :

Il faut prendre quelques précautions pour calculer cette dernière intégrale. Si le principe quenous venons d’utiliser pour calculer les Hk demeure, la valeur absolue pose un problème que l’onsurmonte de la façon suivante : comme la fonction à intégrer s’annule pour les entiers successifs,dans chaque intervalle constitué par deux entiers successifs, la fonction est soit positive soitnégative (elle est alternativement négative puis positive etc.). Pour obtenir une majoration del’erreur, il suffit d’intégrer entre deux entiers consécutifs, de prendre la valeur absolue du résultatet d’en effectuer la somme depuis zéro jusqu’à 12. Au préalable, on aura écrit le polynôme dedegré n + 1 sous la forme :

n+lP,(u) = c a$%“,

j=o

à l’aide des relations de Newton. Les premières valeurs calculées sont données dans letableau 12.2.

T a b l e a u 12.2.

n Q(n)

3 0,823 10-l4 0,968 lO-’5 0,973 10-s6 0,888 10-47 0,717 10-58 0,529 10-69 0,354 10-7

1 0 0,219 10-a

Il est intéressant de s’arrêter sur le calcul d’erreur concernant l’exemple de l’intégrale deGauss :

I= &]exp(-z) dz.

0

*http://www.edpsciences.com/guilpin/

191

Page 184: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

La dérivée d’ordre n + 1 de l’expression sous le signe somme, notée g(x) est donnée par lespolynômes d’Hermite (cf. chapitre 10) :

= (-l)“+‘Kn+r(x) exp

Cherchons le sup de la valeur absolue de cette expression dans l’intervalle (0,2). Désignonspar A&+i cette valeur. Elle est obtenue pour l’une des valeurs qui annulent la dérivée de g(z),soit :

= (-l)“K,+z(s)exp

Ce sont donc les zéros du polynôme d’Hermite de degré n+2 qui sont les extremums de g(x), onles note a&. Il est facile de calculer les valeurs de g(ak) correspondant aux racines ak contenuesdans l’intervalle (a, b) ici (0,2), et de choisir la plus grande valeur absolue. Cette opération vaêtre rendue aisée par l’usage des coefficients HI, calculés lors de l’intégration de Gauss-Hermite ;en effet nous avons :

de là, on tire :

j7(“+2) = (n + l)!Jzk

(n + 2, iKn+l (uk)]2 ’

Pour fixer les idées, choisissons n = 8, alors nous trouvons :

J = 0,477250 155

La consultation de la table donnée chapitre 10 (concernant le polynôme de degré 10) nous montreque seules deux racines nous intéressent dans l’intervalle (0,2), elles donnent des extremums dumême ordre de grandeur et l’on trouve :

d’où

Mn+l = 217,

E(n = 8) < Jg- 0 , 5 2 9 lO@ = 4,6 10-5,

e t

J = 0,47725 f 0,00046.

Ce résultat peut apparaître médiocre, en fait il est dû à la majoration excessive de ladérivée d’ordre (n + 1). En général, il est très difficile de calculer formellement la dérivéed’ordre n d’une fonction, et rares sont les exercices qui le permettent, aussi ne s’attardera-t-onqu’exceptionnellement sur leur majoration.

Cette raison explique pourquoi il n’est pas possible de comparer directement, dans le casgénéral, les résultats fournis par la méthode des trapèzes et par la méthode de Simpson puisquela première méthode donne une précision en fonction de la dérivée deuxième et la seconde enfonction de la dérivée quatrième. La comparaison n’a de sens que dans l’étude de cas particuliersau cours desquels on sait expliciter les dérivées et les majorer convenablement...

Quoi qu’il en soit, ici, pour 7~ = 8, les six premiers chiffres significatifs sont exacts...

192

Page 185: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12. LES POLYNÔMES DE BERNOULLI. FORMULE D'EULER-MACLAURIN

4. Éléments de bibliographie

A. ANGOT (1965) Compléments de Mathématiques, Éditions de la Revue d’optique.N. BAKHVALOV (1976) Méthodes Numériques, Éditions MIR.H. BESTOUGEFF CH. GUILPIN M. JACQUES (1975) La Technique Informatique, Tomes 1 et II,

Éditions Masson.M. CROUZEIX et A.L. MIGNOT (1984) Analyse numérique des équations différentielles, Éditions

Masson.B. DÉMIDOVITCH et L. MARON (1979) Éléments de Calcul Numériques, Éditions MIR.G. HACQUES (1971) Mathématiques pour I’lnformatique, Éditions Armand Colin.P. HENRICI (1964) Elements of Numerical Analysis, Édition Wiley.F. HILDEBRAND (1956) Introduction to the numerical andysis, Édition Mc Graw-Hill.R. KRESS (1998) Numerical analysis, Springer.D. MCCRACKEN et W. DORN (1964) Numerical Methods and Fortran Programming, Éditions

Wiley.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Éditions Dunod.J.R. RICE (1969) Approximation des Fonctions, Éditions Dunod.Y. ROCARD (1967) Thermodynamique, Éditions Masson.G. VALIRON (1955) La Théorie des Fonctions, Éditions Masson.

193

Page 186: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 dans le champ réel

Ces types de problème relèvent du vaste cadre de l’analyse fonctionnelle. S’il est rare de trouverune primitive à une fonction donnée, il est encore plus rare de pouvoir exhiber une fonction fqui soit solution d’une équation différentielle donnée. Pour s’en convaincre, il suffit de considérerune des toutes premières équations différentielles rencontrées dans la physique : l’équation dupendule simple dans le plan. Désignons par 8 l’angle que fait le pendule avec la verticale etécrivons l’équation différentielle à laquelle obéit Q au cours du temps t :

d’B(t)dt2 + w2 Sin[e(t)] = 0.

Cette équation différentielle ne possède pas de solution formelle connue c’est-à-dire de solutionexprimable au moyen des transcendances usuelles. D’autant plus que la nature des conditionsaux limites peut singulièrement compliquer le problème à savoir :

a. Conditions de Cauchy (178991857). On connaît à l’instant t = to la valeur de la fonctioninconnue et de toutes les dérivées jusqu’à l’ordre le plus élevé figurant dans l’équation.

b. Conditions aux limites (ou de tir). On connaît les valeurs de la fonction inconnue à desinstants différents.

Ici nous avons choisi le temps comme variable puisque l’exemple retenu est le pendule simple,mais rien n’est changé en faisant usage d’autres variables.

Ici, nous ne cherchons pas à résoudre le problème différentiel dans le cas le plus généralimplicite que l’on écrit :

mais nous nous contenterons d’étudier le cas explicite suivant :

g=f(g )...) $,y).

195

Page 187: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Celui-ci se ramène à l’étude d’un système différentiel de n équations du premier ordre, enposant successivement :

dy-=udt ’du-x2,dt ’

. . . . .d w-=zdt ’

dzce qui donne (n - 1) équations lesquelles jointes à - = f(y, u, U, . , 2) constituent un systèmede n équations différentielles du premier ordre.

dt

Dans un premier temps nous étudierons les techniques usuelles de résolution des équationsdifférentielles du premier ordre dans le cadre du problème de Cauchy, puis nous procéderonsaux généralisations qui permettront l’intégration des équations différentielles dont l’ordre estsupérieur à un.

Enfin, nous donnerons quelques indications à propos du problème aux limites qui ne concerne,cela va de soi, que les équations d’ordre supérieur à un.

1. Les équations différentielles du premier ordre

C’est donc le problème de Cauchy qui seul nous concerne ici. Sous la forme explicite, nous auronsà intégrer l’équation générale suivante :

avec la condition que la solution doit prendre la valeur yo pour la valeur ~0 de la variable.

2. Les théorèmes d’Arzelà (1847-1912)et de Cauchy-Lipschitz (1832-1903)

Il convient de s’assurer de l’existence d’une solution et la réponse est apportée par le théorèmed’Arzelà que l’on admettra sans démonstration i

Sous la seule’condition que f(~, y) soit continue dans le rectangle ~0 5 2 < ~~+a, Iy - yo1 5 b,alors l’équation différentielle admet au moins une solution $(x) qui prend pour z = x0 la valeuryo et qui est définie pour ~0 5 z 5 20 + h, h étant le plus petit des deux nombres a et b/M oùM = su~lf(~~)l d ans le rectangle considéré. Rien n’est changé si l’on remplace la condition320 < Ic 5 320 +a par 20 -a < z 5 20.

À présent, c’est l’unicité de la solution qui va retenir notre attention, elle est assurée par lethéorème de Cauchy-Lipschitz :

Si de plus la fonction f(lç, y) est lipschitzienne (cela signifie qu’il n’y a pas de tangenteverticale), soit :

I.f(x,~l) - f(z, yz)I < A Iyy1 ~ yzI avec A fini,

alors la solution 4(z) qui prend la valeur yo pour la valeur ~0 de la variable est unique. En outre,dans le domaine précédemment défini, 4(x) est continue.

196

Page 188: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION ms ÉCXJ.~TI~N~ DIFFÉRE~TIELLJB DANS LE CHAMP RÉEL

Remarque : Si f (x, y) es m me en un point particulier, il faut examiner s’il s’agit d’un pôlet ’ fi .1

simple ou d’un point singulier essentiel. Dans le premier cas, si la fonction ~f (2, Y)

est régulière,

elle conserve les bonnes propriétés puisque l’on pourra intégrer x en fonction de y.

On trouvera dans l’ouvrage de G. Valiron cité en bibliographie une démonstration de cesthéorèmes au moyen de la méthode itérative de Picard (1890). Comme elle constitue aussi uneméthode numérique simple à mettre en œuvre, nous allons nous intéresser à cet aspect.

3. La méthode de Picard (1858-1941)

La technique est intéressante dans la mesure où elle substitue une équation intégrale à uneéquation différentielle, soit :

Y(X) z

J

dz = y(z) - y0 =J

fh y(t)1 dt.Y0 x0

Nous allons former une suite de fonctions de la manière suivante :z

Y~(X) = YO +s

f(4 yo) dt,

x0z

Y~(X) = yo + J f[t, yl(t)] dt,x0. . . . . . . . .

Y~(X) = YO + J f[t, s-l(t)] dt,x0. . . . . . . . .

On montre alors que la limite de y,(~) quand n tend vers l’infini est la solution unique del’équation différentielle dans le cadre des hypothèses énoncées dans les théorèmes d’Arzelà et deCauchy-Lipschitz. De plus, il convient de signaler que la série de terme général yy, - Y~-~(X)est absolument et uniformément convergente pour x appartenant à l’intervalle (x0, 20 + h).

La conduite du calcul est fort simple :

a. On découpe l’intervalle d’intégration (a, b), dans lequel la fonction f(z, y) a les bonnespropriétés, en n sous-intervalles égaux définis par les points xk en progression arithmétique :

b - ah=-- e t xk = a + kh.

n

b. NOUS calculons la fonction Y~(Z) = yo + 7 f(t, yo) dt, c’est-à-dire l’ensemble des échantillons

de Y~(X) aux points xk.c. Ensuite, on calcule Y~(X) à partir de Y~(X) et ainsi de suite.d. On arrête les calculs lorsque les valeurs de y,(b) et yn+r (b) sont égales à la précision que l’on

s’est fixé à l’avance.

197

Page 189: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Remarque 1 : Cette belle méthode itérative présente l’inconvénient d’être lentement conver-gente.

Remarque 2 : Comme la méthode est absolument et uniformément convergente il n’est pas utilede conserver la fonction yn(x) intégralement avant de procéder au calcul de la fonction suivanteyn+i(x). Il suffit donc d’écraser les valeurs au fur et à mesure des calculs. Non seulement cetteremarque simplifie grandement la programmation mais encore elle accélère la convergence duprocédé.

Précision de la méthode

La suite de fonctions étant absolument et uniformément convergente, sur le plan strictementmathématique, il suffira d’effectuer les calculs à un ordre suffisamment élevé pour obtenir laprécision souhaitée à l’avance. Par suite, on est en droit de penser que c’est la techniquenumérique retenue pour calculer les intégrales qui limite la précision des résultats (elle estfonction du pas h). Les problèmes sont malheureusement plus compliqués que cela.

On trouvera sur le Web (*) 1 e programme picard. c qui réalise cette procédure.

4. Méthode de la série de Taylor

Nous allons développer la fonction y(xk+i) au voisinage de y(xk) en série de Taylor en utilisantles notations yk et yk+l :

Yk+l = Yk +h h2 h3y y; + gY; + SYk’ + . .

yi est donné par l’équation différentielle et vaut simplement f(xk, yk), ensuite, par dérivation,on obtient :

= dxk, Yk),

e t

On peut aller aussi loin que ce que l’on désire.La technique de calcul est simple : à partir de x0 et yo on calculera y1 au point xi, puis y2 au

point x2 et ainsi de suite jusqu’à x, = b.Lorsque l’on arrête le développement en série de Taylor au premier ordre, la méthode s’appelle

méthode d’Euler.On trouvera sur le Web (*) 1 e programme taylor . c qui met en œuvre cette technique.

*http://www.edpsciences.com/guilpin/

198

Page 190: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION ms ÉQUATION~ DIFFÉRENTIELLE~ mNs LE cH.hw RÉEL

5. Méthodes de Runge (1856-1927) et Kutta (1867-1944)

5.1. La méthode en trois points

Nous allons présenter cette technique de façon géométrique, puis nous verrons ce qu’elle signifieanalytiquement et nous proposerons une généralisation à plusieurs points.

À partir du point A(zo, yo), nous calculons au moyen de la méthode d’Euler les coordonnéesdu point B [Q + h/2, y(~ + h/2)], soit :

= YO + Wzo, T~O)P.

On détermine le point C [XO + h, y(~ + h)] en effectuant une interpolation parabolique, c’est-à-dire en supposant que les trois points A, B et C sont sur une parabole. Pour cela on utilise unepropriété géométrique de la parabole selon laquelle la tangente en B à la parabole est parallèleà la sécante AC. On peut alors écrire :

y1 = y(zo + h) = YO + h.f [zo + h/2, YO + hf(zo, yo)/

L’ordonnée de C n’est pas la valeur définitive que nous allons conserver comme approximationde l’intégration en zo + h. La formule des trois niveaux permet de trouver une meilleureapproximation de C en écrivant :

so+h zo+h

/ dy= j- f[z, Y(Z)] dz = y1 - yo = ; [f(A) + 4f(B) + f(C)]“ 0 “0

expression dans laquelle f(A) signifie f(ze, y~)

f(B) signifie f 1x0 + WA yo + V(a, go)/21

f(C) signifie f (50 + h, yo + hf (20 + W, 1Jo + hf(zo, yo)/2))

La technique de calcul consiste à écrire :

UO = f(zo, Yo),

Ul = f (50 + W’, YO + hUo/2) >Uz = f(zo+h,yo+hUl),

puis y1 = yo + ; [Uo + 4Ul + U2].

Ensuite, à partir de ~1, on calcule y2 et ainsi de suite jusqu’à atteindre la borne b souhaitée.On trouvera sur le Web (*) 1 e programme runge . c qui réalise cette procédure.Cette procédure montre que l’on itère trois fois la fonction f(z, y). Nous pouvons retrouver

ce même résultat par voie analytique. Cette façon de procéder est généralisable ce qui permetd’augmenter la précision des résultats. Sans s’attarder sur les développements, nous donnons lesrésultats du calcul en quatre points.

*http://uww.edpsciences.com/guilpin/

1 9 9

Page 191: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5.2. Les méthodes en quatre points

Il existe plusieurs variantes de la méthode, en voici deux :

1. On calcule les valeurs suivantes :

Ul = h.f (20 + h/3, YO + Uo/3),

Uz = hf (20 + W3, yo - Uo/3 + Ul) ,

u3 = V(~O +~,Yo + Uo - Ul + U2),

et y(x0 + h) = Y(Q) + z + F + y + ? .

2. On peut aussi calculer cette autre suite :

uo = hf (XO,YO) ,

ul = hf (20 + W’, YO + UoP) ,

U2 = kf(~o+W,yo+R/2),

U3 = hf (20 + h, YO + U2) ,e t y(~0 + h) = y(zo) + z + : + ? + ? .

Il faut savoir que les coefficients numériques sont calculés par identification de la formuleprésentée et du développement en série de Taylor le plus élevé possible.

5.3. Les méthodes en seize points (ordre 8)

Il faut résoudre un système de 285 équations pour satisfaire les conditions d’identification eten 1981, P.J. Prince et J.R. Dormand ont réalisé ces calculs et ont produit les coefficientsnumériques jusqu’à 16 points.

Souvent nous utilisons leurs résultats pour intégrer les équations différentielles, et ceci de lafaçon suivante : on intègre avec la méthode d’ordre 7 et l’on estime l’erreur à l’aide de la méthoded’ordre 8 qui sert de référence. Ceci permet de calculer aussi le pas d’intégration adapté au typede l’équation différentielle que l’on traite.

On retrouve ce type d’intégration dans quelques programmes fournis avec les corrections deproblèmes (cf. annexes H et 1).

6. Les méthodes d’Adams (1819-1892)

On se propose de calculer la valeur de la solution yj pour la valeur correspondante de l’abscissexj. Les abscisses ne sont pas nécessairement en progression arithmétique et l’on les notesimplement dans l’ordre croissant (20 < ~1 < x2 < . . . < x, . . . < x,} = T, T étant l’intervallesur lequel on désire effectuer les calculs et sur lequel la fonction f [x, y(z)] a les bonnes propriétésénoncées dans le théorème de Cauchy-Lipschitz. On note h, = x,+1 - x,.

200

Page 192: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION DE~ ÉQu.~TIONS DIFFÉRENTIELLE~ DANS LE CHAMP RÉEL

On suppose que l’on connaît les n premières valeurs qui ont pu être obtenues au moyen d’uneméthode de Runge et Kutta par exemple. On se propose de calculer la valeur de yn+r au pointx,+1 au moyen de la relation :

“n+l

Ynfl = Yn +s

fh ~(~11 dz,

expression dans laquelle nous allons approcher la fonction f[z, y(z)] au moyen du polynômed’interpolation de Lagrange de degré u, ce qui signifie que la détermination de ce polynômenécessite la connaissance de v + 1 valeurs calculées précédemment.

6.1. Méthode de Adams-Bashforth

On désigne par Pyn(x) le polynôme de Lagrange de degré v qui interpole la fonction f[z, y(z)]dans l’intervalle (z,, ~ç,+r). On adopte la notation :

Pvn(xn-j) = f[x,-j, y(x,-j)] = fn-j avec j = 0, 1,. . V.

La valeur approchée de yn+r est donnée par l’expression :

“n+l

Yn+1 = y72 +s

f’vn(x) dz,

on en déduit la valeur de fn+r :

fn+l=f(&X+l> Yn+l)

Explicitons le polynôme de Lagrange :

On peut poser

puis :

En définitive, la méthode d’Adams-Bashforth a (ZI + 1) pas s’écrit :

Y~+I = yn + 2 h&L,jfn-j avec n>u,j=o

et

fn+l = f (%+1, YYn+1 1

201

Page 193: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Remarque 1 : Il faut une plate-forme de démarrage pour appliquer l’algorithme d’Adams-Bashforth, elle peut être obtenue par une méthode à un seul pas telle que celles que nousavons présentées précédemment.

Remarque 2 : Rien n’interdit de modifier le nombre de pas au cours des calculs.

Remarque 3 : La taille des pas hj n’est commandée que par des considérations sur la précisionet la stabilité.

Remarque 4 : Comme la méthode existe pour v = 0 (il s’agit de la méthode d’Euler), il suffitde concevoir un programme qui fonctionne avec un pas variable de 0 à V, ainsi l’algorithmedevient « auto-démarrant ».

6.2. Cas où les xj sont en progression arithmétique

On désigne alors simplement par h le pas, et l’on remarque que le polynôme d’interpolation deLagrange est également le polynôme ascendant de Newton (cf. chapitre 6) ; ainsi L,,j(z) prendune forme plus simple que l’on désigne par ZVj(z) car, comme on va le voir, cette expression nedépend pas de n :

k#.?

de même B,,j ne dépend plus de n et l’on désigne par b,, cette nouvelle expression qui s’écrit :

buj = J’ Zvj(u) du = j fi u-le du.

0 o k=O Ic -jk#jPar ailleurs, nous avons vu que le polynôme de Newton ascendant (cf. chapitre 6) pouvait

s’écrire, en posant u =x - 2,-, sous la forme :

h

Plm(u) = fn + UAff, + y 1) pj-, + . . + u(u + 1) . . . (u + V - 1) ayfU! n

qui s’exprime avec la notation plus concise :

(“‘:-y=u(u + 1). ‘. (u + j - 1)

$ ,

de la manière suivante :

Pvn(u) = 2 aqj=. n(“+;-‘).

De là, on obtient :

Page 194: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION DES ÉQU.~TIONS DIFFÉRENTIELLE~ DANS LE CHAMP RÉEL

avec

Il y a moyen de calculer directement les rj ainsi que les bvj qui en découlent, si bien qu’il n’estplus utile de calculer les différences successives des fn. Les expressions à exploiter s’écrivent :

yn+l = yn + h k b,jfn-j avec n 2 u,j=o

et fn+l = ~(G+I,Y~+I).

6.3. Calcul des coefficients rj et bvj

Nous allons montrer que les yk sont les coefficients du développement en série entière de lafonction :

1

S ( x ) =J

(1 -x)-” dcr = -&i,z”.

0 k=O

En effet, la dérivation successive sous le signe somme, puis l’égalisation à zéro de 2 conduitau développement en série de MacLaurin de S(z), et l’on trouve que :

%= j(‘“+;-‘) du.0

D’un autre côté, l’intégrale est directement calculable :

1 1

S(z) = ( 1 -X)-O da! = exp[-alog,(l -z)] da =J J -’log,(l - x)

0 0

Nous pouvons donc écrire :

S(x) log,(l - x)G = - 1 .

Le développement en série entière de cette expression donne :

=- 1 .

L’identification des termes de même puissance en x conduit aux relations :

m - l

203

Page 195: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

soit encore :

Cette dernière relation est donc vraie quel que soit m, et l’égalité demeure en remplaçant m parm - 1 ou (m + 1) autant de fois que cela reste compatible avec le fait que m est supérieur ouégal à zéro. En particulier, elle est vraie pour m = 1 dans le premier membre et m quelconquedans le second, ainsi on trouve :

yo=l=g (m -T + 1)

quel que soit m positif.

À partir de cette relation on calcule la suite 71, 72, 73 et ainsi de suite.Le calcul des b,j s’effectue en fonction de b,_ l,j et de yV pour 0 < j < V. D’abord, il est aisé

de calculer b,, à partir de la relation de définition :

b,, =s’ lyv(u) du = ] Ufi E du = (-1)” ] Uj “; ’~ du = (-l)yyy.

0 0 k=O 0 k=O

À présent, exprimons Z,,~(X) en fonction de (“‘Y-‘). On peut écrire, pour j < v :

Zvj(3J) = (-l)jCi (--‘)Z.

De la même façon, on calcule iV-i,j(~) :

Zv-&z) = (-l)jCy’ (“‘v’)s.

Maintenant, effectuons la différence lyj(x) - ZyP1,j(~) :

Zvj(czz) - ZY~l,j(cz) = (-qc?; (y) (5 -!!A) = (Fl)q+;-l).

Intégrons terme à terme sur (0, l), on obtient :

bvj = b,-l,j + (-l)%‘$p avec O<j<v.

En définitive, nous savons calculer les b,j sans difficulté à partir des yv. Sur le Web (*), ontrouvera le programme bashf ort . c qui utilise cette technique de calcul.

*http://www.edpsciences.com/guilpin/

204 $

Page 196: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION DE~ É~~UATION~ DIFFÉRENTIELLES DANS LE CHAMP RÉEL

6.4. Méthode de Adams-Moulton (1872-1952)

Au fond, il s’agit d’une variante de la méthode qui vient d’être exposée. La différence provient dufait que le polynôme d’interpolation passe par fn+i = f (x,+1, gn+i) valeur qui ne sera connueque lorsque la valeur de y,+1 sera connue. On comprend alors que la nouvelle technique soit uneméthode implicite car il nous faudra résoudre une équation implicite pour obtenir la valeur dey,+~. Le gain de la méthode repose sur le fait que le polynôme d’interpolation gagne un degré.

Nous posons donc :

Q v+~,n(xn-j) = f [z,-j,y(xn-j)] avec j = O,l, . . u,

~1~s Qv+l,nbn+d = P[G+~,Y(G+I)] = fn+l,

cette dernière valeur est inconnue.Le polynôme de Lagrange qui interpole dans le ne intervalle est alors de degré (V + 1). Il prend

la forme :

soit encore :

Q V+l,&) = i: fn-jL+l,n+l,j+lC4.j=-1

Comme précédemment, posons :

La technique de résolution consiste à séparer ce qui est connu de ce qui doit être calculé parrésolution d’une équation implicite :

yn+l - hJL,-d(rç,+l, yn+l) = yn + c h,D,,jfn-j avec n > u.j=o

(Le membre de droite est une constante calculable directement, et il reste à résoudre l’équationimplicite figurant dans le premier membre égale à ladite constante.)

6.5. Cas où les xj sont en progression arithmétique

L’expression du polynôme de Newton devient :

Q v+l,&) = fn+l + ;A’&+1 + uiuz; ‘)A2fnll + . . + u(” ‘(2, ;)” + n)A”+lfn+l

u+k-1 zPG+l

kA"fTLt1 avec u=

h ’

Ici encore, nous pouvons nous dispenser du calcul effectif des différences successives, seulesles valeurs fk pourk = n + 1,. . . , n - v devront être connues.

205

Page 197: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

La quantité D,,j ne dépend plus de n et l’on désigne par d,j cette nouvelle expression quis’écrit (attention au changement de variable qui définit u) :

De là, on extrait :

0

dvj =J'

L+I,~+I (u)du=]Esd..

-1 -1 k=Ok#3

Yn+l =Yn+h-p fn+l;;; I c &+*‘) du=y.,+h!f&~fn-1

avec

“i~](~+;-‘) ,u~i”u+l~~$b+j-~) du,-1 -1

L’expression générale à itérer devient plus simple :

yn+l - h,&-lf (x,+1, yn+l) = yn + 2 h,dvj.Lj.j=o

6.6. Calcul des coefficients Sj et d,

Nous allons relier les coefficients ~?j aux coefficients y&. Écrivons 6j et effectuons le changementde variable u - 1 = 2 :

puis décomposons le dernier membre sous le signe somme :

à présent il suffit d’intégrer de zéro à l’infini et l’on obtient :

sj = “ii - yje1 avec 60=~0=1.

Nous pouvons également calculer directement la suite des 6, en réutilisant la relation établità propos des rj, à savoir :

m-1 m

2 & - 2 (m -! + 1) = O.

Page 198: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGR.~TI~N DES ÉQUATIONS DIFFÉRENTIELLES DANS LE CHAMP RÉEL

Le développement puis la factorisation des coefficients qui ont le même dénominateur permetd’écrire :

()=‘y0 mm-t1

+ 70 -Y1 +..,+ %-j -Ym-j+1

.i+... + (rm-1 - XL),

ce qui donne :

O=Ck”o cm -“k + 1) quel que soit m positif.

Il nous reste à exprimer les d,j en fonction des Sj. Nous avons d’abord :

0

6, =.I

L+l,v+l

- 1

(u) du = j fi 2 du = (-1)V+1j & & du = (-I)“+%+i.-1 k=O

Comme précédemment, nous écrivons Zu+ij+i(s) en fonction de (::y). On peut écrire, pourj<u:

1 v+l,j+l(z) = (-l)j+lcj+l z + v rfJ + v + 1

v+l v+l z+j+1‘( >

Maintenant, effectuons la différence ZV+l,j+l (x) - ZVj+r (x) :

L’intégration de deux membres sur l’intervalle (-1,O) permet d’obtenir :

d = d _v.7 + (-l)j+lCj+lbu 1,3 v+1 v+l avec O<~<U.

Ici encore, on sait facilement calculer les d,j en fonction des &,+i.On trouvera sur le Web(*) 1e programme moulton. c qui réalise l’intégration numérique des

équations différentielles du premier ordre au moyen de cette procédure.

7. La méthode des différentiations rétrogrades

Il existe une catégorie de problèmes différentiels qui sont particulièrement rebelles aux méthodesd’analyse usuelles, c’est-à-dire les méthodes de Runge et Kutta et les méthodes d’Adams.Bien que les conditions de Cauchy-Lipschitz soient vérifiées, il peut arriver que la structurede l’équation différentielle soit tout à fait mauvais, c’est-à-dire que la discrétisation explicite faitapparaître des instabilités. Ce type de problème porte un nom : il s’agit de problèmes raides,on n’obtient pas d’approximations numériques convenables à l’aide des méthodes usuelles.

*http://www.edpsciences.com/guilpin/

207

Page 199: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Lorsqu’on rencontre un problème raide, ces difficultés peuvent être éventuellement contournéesen utilisant des méthodes adaptées, et il convient de tester les méthodes de Runge et Kuttaimplicites ou la méthode des différentiations rétrogrades. Nous présentons maintenant cettedernière méthode.

L’idée consiste à interpoler la suite des yn par le polynôme de Lagrange II,,(z) de degrév (n > v+ 1). Le polynôme sert alors à trouver une approximation de yn+r pour la valeur2 = X,+1, ainsi nous écrivons :

JLn(Xn+l-k) = Yn+l-k avec k = O,l,. . ,v.

Pour obtenir la valeur de y,+r, on écrit que :

Nous allons expliciter le polynôme de Lagrange dans le cas particulier utile où le pas estconstant et vaut h :

II,,(x) = 2 Cln+l-j fi x - xTL+1-k .j=o k=o~7x+1-j -%+1-k

k#.?

On désigne alors par n,,(u) la nouvelle expression qui prend la forme suivante :

‘irm(u) = -gYn+l-j g sX

en posant : u = n+l - II:

j=o h ’k#.i

On obtient alors :

d,(O) = -hf (X~+I, ~n+l) >

et n,,(G) = yn+l-k avec k=O,l,...,v où <k = %+1 - x,+1 - k

h .Nous allons dériver T vn(~) par rapport à U, après avoir donné son expression en fonction de :

Qvn(u) = fi (l- ;>m=l

ainsi que de sa dérivée C&(U). Développons T~,(U) de la manière suivante :

nvn(u) = Yn+l fi + + 2 Yn+l-j kfJ y$ .k = l j=l

k#j

On note que, puisque j # 0 :

et que

-

q:&L) = -qv?%(u) . -g- llrnmzl ( 1 - Z)’

208

Page 200: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGR.~TION DE~ &U.~TI~NS DIFFÉRENTIELLES DANS LE CHAMP RÉEL

ce qui donne :

dAv = - 2 ; car qvn(0) = 1.j=l

Donc :

Dérivons par rapport à u et faisons u = 0 :

= -hf (X~+I, yn+l 1.

En réécrivant la dernière égalité, on obtient :

soit encore :

Formellement, on peut écrire une expression semblable à celles établies à propos des méthodesd’Adams :

v

avec :

S+I - ha,f(z,+l, yn+l) = c u,~Y,+I-~,j=l

e t

Sur le Web (*), on trouvera le programme retrogra. c qui réalise cet algorithme.

*http://www.edpsciences.com/guilpin/

2 0 9

Page 201: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

8. Les équations différentielles du deuxième ordre

L’étude des équations différentielles du deuxième ordre relève de l’étude des systèmes d’équationsdifférentielles du premier ordre, et elles en constituent un cas particulier. En effet, écrivonsl’équation résolue par rapport à la dérivée seconde qui soit la plus générale possible dans cesconditions :

d2y~ = L?(X> Y> Y’)dx2

il est alors possible, comme nous l’avons vu précédemment d’écrire :

dy-=zdzdz-=dz dz, Y, z).

Il ne coûte rien d’étudier le système général suivant :

2 = f(X,YJ)dz- = S(T Y, 2).dz

8.1. Cas du problème de Cauchy

En xc, on connaît les valeurs yo et ~0, alors le théorème de Cauchy-Lipschitz se généralise de lamanière suivante :

Si les fonctions f(x, y,Z) et g(x, y, )z sont continues dans le parallélépipède xc 5 x < x0 + a,JY - y01 5 b et 12 - ~01 5 c, et si les fonctions sont lipschitziennes c’est-à-dire que :

I~(~,Y,~)-~(x,Y~,~~)/<A~Y-~~/+BIz-z~I,is(xç, Y> 2) - dz, yl,a)l < A Iy - y11 + B Iz - 211,

alors le système différentiel du premier ordre (ou l’équation différentielle du deuxième ordre)admet une solution unique y = 4( x e z = g(x) laquelle prend pour x = x0 les valeurs) t$(x0) = YO et +(x0) = ~0 et qui est définie pour x0 < x 2 xc + h, h étant le plus petit des troisnombres a, b/M et C/M où M étant la borne supérieure de if\ et /g/ dans le parallélépipèdeconsidéré.

a - Méthode de Picard - Nous formons la suite de fonctions de la manière suivante :

Yl(X) = YO + .? f(t,~o,zo) dtx0

Zl(X) = zo + 7 g(t, yo, 20) dtx0

210

Page 202: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION DES ÉQUATIONS DIFFÉRENTIELLES DANS LE CHAMP RÉEL

puis

Y2 (XI = YO + 7 f(t,vl,-4 dtx0

4x1 = zo + 7 g(t,yl,a) dt

x0

. . . .

Yn+l (XI = YO + 7 f(t, ~n, 2,) dt20

Zn+l (xl = zo + 7 g(t, yn, z,) dt.x0

. . . . .

b - Méthode des séries de Taylor - Il suffit d’écrire les expressions suivantes :

h h2 h3Ykfl = yk + ,Y; + !Yk + -&tt + ’ ’ ’

hzk+l =

h2 h3 ,,,zk + 3”; + 32; + Tz” + ” ’

a v e c y; = f (xk, Yk> zk)

4 = 9 (~k,Yk, zk) >

ensuite, par dérivation, on obtient :

= k(Zk,Yk, zk),

= ~(xk,Yk, zk)>

et ainsi de suite.

c - Méthode de Runge et Kutta en trois points - La technique de calcul consiste à écrire :

uo = f(Xo,Yo,Zo),

V o = f (xo + W, YO + hUoP,zo) >

wo = f (xo + h, YO + hVo, ~0) ,

&l =g(xo,Yo,~o),

SO = g (20 + h/2, YO, 20 + hRo/2) ,

TO = g (20 + h, yo, zo + hSo) ,

puis y1 = y0 + t [VO + ~VO + WO] ,

21 = zo + ; [Ro + 4so + TO]

Ensuite, à partir de y1 et zl, on calcule y2 et 22 jusqu’à atteindre la borne b souhaitée.

211

Page 203: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

d - Méthode de Runge et Kutta en quatre points

1. On calcule les valeurs suivantes :

vo = hf (x0, Yo, 20) >

v, = hg(~o,Yo,~o)>

UI = kf (~0 + h/3, YO + Uo/3, ~0) ,

v, = hg (20 + h/3, YO, zo + Vo/31 ,

U2 = hf (20 + 2h/3, YO - Uo/3 + Ul, 20) >

v, = hg (20 + 2h/3, YO, zo - Vo/3 + VI) ,

U3 = hf (zo + h,yo + Uo - UI + Uz,zo),

v, = hg (20 + h, YO, 20 + Vo - 6 + fi),

et y(~ + h) = y(~) + $ f % + y + ?l

z(zo + h) = 2(x0) + : + 9 + 7 + ;.

2. On peut aussi calculer cette autre suite :

uo = hf (20, yo, zo) >

Vo =hg(~o,Yo,Zo),

UI = hf (20 + W, YO + UoP, ~0) ,

K = hg (~0 + W, YO, 20 + VI/~,

U2 =V(~O+ h/‘J,yo+U1/2,zo),

v, = hg (~0 + h/2, YO, 20 - W2),

U3 = V(~O + ~,YO + UZJO),

v, = hg (50 + h, YO, 20 + Vz) ,

e t y(~ + h) = y(q) + ? + % + + + :,

z(zo + h) = z(zo) + : + ; + ; + ;.

e - Méthode d’Adams-Bashforth dans le cas d’un pas constant

Y,+I = yn + h--&fn-i avec n>v,j=o

et

fn+l = f(G+1, YY,+l>&+l >)

2 1 2

Page 204: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

13. INTÉGRATION DE~ EQUATIONS DIFFÉRENTIELLES DANS LE CHAMP RÉEL

puis

Z,+I = z, + h h&-j avec n>u,j=o

et

Qn+1 = g(GL+l,Yn+l,~n+l),

Sur le Web (*) figure le programme pendul-0. c qui met en œuvre cette technique.

f - Méthode d’Adams-Mou/ton dans le cas d’un pas constant

Y~+I - hd+lf (G+I, ~n+l, z,+l) = yn, + c hd,jf,,-j avec n > V,

j=o

Z,+I - hdw-lg (x,+1, yn+l, z,+l) = z, + 2 hd,,g,-j avec n> u.j=o

Remarque : Ici, il y a à résoudre un système non linéaire de deux équations à deux inconnuesdont les racines sont yn+i et z,+i. Toutefois, si le prix du calcul est trop élevé, on pourra secontenter de l’algorithme suivant :

dans lequel on n’a plus qu’à rechercher la racine locale d’une première équation implicite quidonne yYn+l puis la racine d’une seconde équation implicite qui permet de déterminer z,+i.

g - Méthode des différences rétrogrades

yn+l - ha,f (x,+1, y,+~, z,+I) = c QY~+I-~,j=l

&+1 - hct~g(2,,+1,Yy,+l,~n+l) = ~uvj&+l-,.j=l

Ici encore on retrouve le problème rencontré lors de l’utilisation de laMoulton, on le traite de la même façon.

s-

*http://www.edpsciences.com/guilpin/

213

Page 205: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

8.2. Le problème aux limites

On peut rechercher une solution y = $( z e z = $(z) telle que, par exemple, elle admette) tYO = 4(x0) et y1 = $(a) ou encore yo = $(~a) et ~1 = +(zr), avec dans les deux cas ~0 # 21.

Il n’y a plus de théorème d’unicité analogue à celui de Cauchy-Lipschitz. Le problème est plusdélicat, et pour s’en convaincre, il suffit de considérer l’équation du pendule. On se donne ~0 etya à ta. Il est bien clair que l’on ne peut pas imposer une seconde condition n’importe comment :elle doit être compatible avec les liaisons du système étudié. Lorsque ce problème de conditionsaux limites se présente, on peut l’aborder de la façon suivante :

On fixe une condition, par exemple yo = $(x0) et l’on choisit arbitrairement l’autre conditionà la même limite pour ~0, soit ~0. La technique consiste à ajuster zo de telle sorte qu’à la limite~1 la seconde condition imposée soit remplie. L’ajustement de zo s’effectue par tâtonnements enessayant de trouver deux valeurs Z, et zb (qui encadrent la valeur cherchée 20) à partir desquelleson recherche za par dichotomie, d’où son nom : la méthode de tir.

9. Équations différentielles d’ordre supérieur à deux

Ce qui a été dit pour le deuxième ordre peut être généralisé sans grande difficulté pour les ordressupérieurs et les algorithmes se transposent de la même manière que celle qui a été présentéepour le deuxième ordre.

10. Éléments de bibliographie

M. AINSWORTH (1995) Theory and numerics of or-dinar-y and partial equutions, Clarendon Press.M. BACH (1998) Anulysis, numerics und applications of differentiul und integrul equations,

Longman.J. BARANGER (1991) Analyse numérique, Éditions Hermann.M. CROUZEIX et A.L. MIGNOT (1984) Analyse numérique des équations différentielles, Éditions

Masson.J.P. DEMAILLY (1991) Analyse numérique et équations différentielles, Presses Universitaires de

Grenoble.J. FAVARD (1962) Cours d’Analyse de l’École Polytechnique, Tome III : Théorie des équations,

fascicule 1 : Équations différentielles, Éditions Gauthier-Villars.P. HENRICI (1964) Elements of Numericul Anulysis, Wiley.F. HILDEBRAND (1956) Introduction to the numericul unalysis, Mc Graw-Hill.D. Mc CRACKEN et W. DORN (1964) Numericul Methods and Fortran Programming, Wiley.H. MINEUR (1966) Techniques de Calcul Numérique, Éditions Dunod.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Dunod.0p.J. PRINCE et J.R. DORMAND (1981) High order embedded Runge-Kutta formula+ Journal

of Computation und Applied Mathematics, volume 7, no 1.

214

Page 206: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14 Intégration des équations‘;*y’:,$; $2; ‘z’:“:.:;/ -. =/, / ,‘y”,~ , ,/~;;:y& “;;fp,j; ‘ii i7*-K- .:,:. - / , / . :.:” i,,‘”:‘g ’ ; * ;;i_ ;, . ‘8.” ,/ ‘ii aux dérivées partielles

Nous nous proposons d’étudier quelques méthodes d’intégration d’équations aux dérivées par-tielles du premier et du deuxième ordre dans le champ réel. Ce problème généralise l’intégrationdes équations différentielles ordinaires lesquelles ne dépendent que d’une seule variable ; à partirdu moment où nous sommes en présence de plusieurs variables, dans les équations, figurent,presque de façon inéluctable, des dérivées partielles.

Cette remarque induit une conséquence immédiate : les méthodes que nous allons développerpeuvent également s’appliquer à la résolution des équations différentielles ordinaires.

Hormis quelques techniques très pointues attachées à des problèmes d’espèce et qui sortentdu cadre de cet enseignement, on peut dire que, grosso,modo, les méthodes utilisées ont toutesen dénominateur commun la réalisation d’un maillage se superposant au domaine D sur lequelon désire effectuer l’intégration numérique. C’est aux nœuds de ce maillage que l’on calcule lesvaleurs de la fonction faisant l’objet de l’équation aux dérivées partielles. On voit bien qu’ils’agit de la généralisation de la notion de pas, celui-ci pouvant être constant ou variable selonles besoins.

Le premier problème qui se pose concerne les domaines ayant un point à l’infini, tandis quele second concerne les techniques à pas variables. Il ne faut voir là que des problèmes liés àla géométrie du domaine ainsi qu’à la nature de l’équation aux dérivées partielles. Ce sont lesraisons qui expliquent qu’il existe deux types de méthodes numériques pour intégrer les équationsaux dérivées partielles :

a. les méthodes aux différences finies,b. les méthodes aux éléments finis.

Fondamentalement, ce sont les mêmes techniques qui utilisent les mêmes approximationsdes opérateurs différentiels, et ce qui les différencie repose sur la technique de maillage dudomaine considéré. Les méthodes aux différences finies exploitent un maillage à pas constants(quel que soit le type de coordonnées utilisées) et proposent deux types de résolution : l’uneest explicite, c’est-à-dire que les inconnues aux nœuds du maillage sont données explicitementpar les équations, l’autre est implicite, alors les inconnues constituent un système linéaire qu’ilconvient d’inverser. Dans ce dernier cas, on a affaire à une matrice «creuse », c’est-à-dire necomportant que des zéros hormis la diagonale et son voisinage, il existe alors des méthodesd’inversion spécifiques de ce type de matrices (cJ le chapitre 5 consacré au calcul matriciel).

Les méthodes aux éléments finis proposent un maillage adapté au type de problème considéré :là où la fonction inconnue varie beaucoup, le maillage est serré, là où la fonction inconnue varie

2 1 5

Page 207: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

peu le maillage est très grand. Cela conduit à une sorte d’optimisation du temps de calcul etde la quantité de calcul, mais, en revanche, conduit à des études préalables longues et coûteusesqui restent en général du domaine du spécialiste. C’est précisément la méthode retenue dansl’étude de la résistance des matériaux ; on note à ce propos que l’on a affaire à des domaines demême type.

1. Considérations sur les équations aux dérivées partielles d’ordreau plus égal à deux

Dans un repère cartésien orthonormé tridimensionnel de coordonnées (z, y, z), l’équation auxdérivées partielles du deuxième ordre la plus générale à laquelle obéit la fonction Q s’écrit de lafaçon suivante :

Ici encore, les cas offerts par la physique sont généralement des formes explicites, et c’estplutôt l’étude des formes linéaires qui va retenir notre attention. Nous limitons toutefois notreétude aux équations linéaires à deux variables indépendantes x et y (ou t), ainsi l’équationdevient :

A(x, Y>Z + B(x, Y)

où D est une fonction pouvant dépendre linéairement de a, g et g uniquement.L’analyse de ce cas particulier permet de distinguer trois types d’équations aux dérivées

partielles linéaires du deuxième ordre selon les racines de l’équation caractéristique (théorie deMonge (174661818) - Ampère (177551836)) :

1. B2(x,y) - 4A(x,y)C(x, y) < 0 : c’est le type elliptique, il s’agit de l’équation de Poisson(1781-1840) qui admet comme cas particulier l’équation de Laplace,

2. B2(x, y)-4A(x, y)C(x, y) = 0 : c’est le type parabolique, le prototype est fourni par l’équationde la propagation de la chaleur ou encore de la diffusion,

3. B2(x, y) ~ 4A(x, y)C(x, y) > 0 : c’est le type hyperbolique dont l’exemple est l’équation depropagation des ondes (cordes vibrantes par exemple).

La recherche d’une solution numérique à l’intérieur d’un domaine D passe par la connaissancede certains renseignements concernant la fonction @, il s’agit des conditions aux limites(éventuellement à un instant t) : ce sont les conditions sur la frontière F du domaine D. Parmiles différentes manières d’imposer les conditions aux limites, nous évoquerons les deux plusimportantes :

a. Les conditions de Dirichlet (180551859). En tout point de la frontière F, nous connaissonsla valeur de la fonction a, c’est aussi le problème de Cauchy.

b. Les conditions de van Neumann (1832-1925). En tout point de la frontière F du domaine,nous connaissons la valeur de la dérivée norrnale de la fonction a. Généralement ce type deconditions conduit à utiliser une méthode d’intégration implicite.

Remarque 1 : Les conditions aux limites peuvent dépendre du temps. Par exemple, il estpossible d’étudier la propagation d’une perturbation thermique sinusoïdale dans un milieumatériel.

216 i

Page 208: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14. INTÉGRATION DES ÉQUATIONS AUX DÉRIVÉES PARTIELLE~

i

i

s

Remarque 2 : L’obtention de solutions générales aux différents types de problèmes présentésdépend de la nature de l’équation aux dérivées partielles, mais c’est surtout la forme géométriquede la frontière (qui possède ou non des propriétés de symétrie) qui permet de savoir sil’on doit s’orienter vers la recherche de solutions formelles ou vers la recherche de solutionsnumériques.

2. Les opérateurs de différence

Au domaine D on superpose donc un maillage le plus adapté possible à la forme géométriquede D. Quelle que soit la méthode utilisée, il faut pouvoir exprimer les opérateurs différentiels enfonction des différences fournies par le choix discret des points (nœuds du maillage). Ici, notrepropos se limite aux opérateurs différence première et différence seconde, cependant, le caséchéant, la généralisation peut se faire sans difficulté, mais il est rare de rencontrer des dérivéespartielles au-delà de deux.

Dans un repère cartésien orthonormé à deux dimensions (2, y), on considère une fonction«bien élevée » @(CC, y) qui possède les bonnes propriétés de régularité (continuité, dérivabilitéau moins à l’ordre trois, etc.). Soient trois points tous distincts A(xa, ya), B(q,, yb) et C(x,, yc)pour lesquels nous avons : 2, < xb < x,, et yu. < yb < yC. La dérivée partielle en B par rapportà x est approchée par l’opérateur différence première ainsi défini :

La dérivée partielle en B par rapport à y est donnee par l’expression :

d@(xb, Yb) = dQ>(xb>Y) ~ @(xb,!/b) - @(%y~) ~ @(xb, &‘c) - @(xb,Yb)

dX Yb &Y Y/, Y11 ~ Ya Yc - Yb

La dérivée partielle d’ordre deux par rapport à x, calculée en B, est approchée par l’opérateurdifférence seconde ainsi défini :

@(xc, ?/b) - @(zb, !/b) _ @(xb: Yb) ~ @(%m !/b) 1

xb - 2, xc - Xb

la dérivée partielle d’ordre deux par rapport à y s’écrit :

d2@(xbd lyb = & (““@$>y)) Iybdy ”

~ @(xb, Yc) - @(xb, Yb) _ @(xb, Yb) - @(xb> !h) 1 .

!/c - Yb !/b - YY,) Yc - Yb

Il n’est pas très difficile de voir que, compte tenu des bonnes propriétés de la fonction a, lesopérateurs de différence tendent vers les opérateurs différentiels lorsque xb - x, tend vers zéro(ainsi que 2, - xb) ou encore lorsque L/b - yYn tend vers zéro (ainsi que y, ~ yb).

217

Page 209: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUILIÉRIQLJEAPPLIQUÉ

Dans le cas particulier où le maillage est régulier (points en progression arithmétique), onobtient des expressions plus simples en désignant par 6x et Sy les raisons des progressionsarithmétiques :

d@(zb), !/b) ~ @(x6, Yc) - @(xb, !/b)

dX Y b 6Y ’

d2@(x, Yb)

8X2

~ @(xc, Yb) - 2@(xb, Yb) + @(&, Yb),

“b 6X2

d2+b,Y)

dy2 Yb =

@(xb, Yc) - 2@(xb, L/b) + @(x6, !h)

SY2

Valeur de l’opérateur de différence sur les bords du domaine

Il n’est pas toujours simple de faire coïncider les nœuds du maillage avec les bords du domainequand bien même aurions-nous choisi un système de coordonnées correctement adapté auproblème; alors nous sommes amené à calculer la valeur des opérateurs de différence sur lespoints qui sont à l’intersection du réseau formant le maillage et la ligne constituant le bord dudomaine. Voyons ce qui se passe à deux dimensions (CJ? Fig. 14.1).

.Y

3

Bord du domaine

i4

0 ’+ Figure 14.1. Valeur de l’opérateur de différence

Xsur les bords du domaine.

Nous pouvons écrire :

On en déduit que :

!eJo= 26x(1 + a)

(T+Y),

!z~o= 2 (Y+?);by(l+ b)

2 1 8

r

Michaël 2 Sévrain
Michaël 2 Sévrain
Page 210: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 14. INTÉGRATION ms ÉQU.~TIONS AUX DÉRIVÉES PARTIELLES,

en généralisant sur la troisième dimension :

dz@ 2 4>5 -ao @6 -@O

sz2 0 bz(l + c)-+-.dz 62 >

3. L’opérateur laplacien

Compte tenu de son importance, il mérite qu’on s’arrête quelque peu sur lui et notamment quel’on donne son expression en fonction des opérateurs de différence dans le repère cartésien ainsique dans les systèmes curvilignes orthogonaux classiques.

3.1. Repère cartésien orthonormé

M(i, j ~ 1, k)i - - - - - -$ - - - - - l M(i, j + 1, k)

Figure 14.2. Repère cartésien/

SX

orthonormé. X

Désignons par 6x, Sy et Sz les dimensions de la maille élémentaire, l’orientation du maillage àtrois dimensions étant définie conformément à la figure 14.2. Il vient immédiatement que :

aqx, y, Z)i,j,k = & [@(i + l,j, k) + @(i - l,j, Ic) - 2@(i,j, k)]

+ & [@(i,j + 1, Ic) + Q(i, j ~ 1, k) - LQ(i,j, k,]

+ $ [cqi, j, k + 1) + qi, j, k ~ 1) - LQ(i,j, Ic)] .

219

Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Page 211: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Figure 14.3. Coor,do,rl,,rl,i~,s cu/l%rrd~ique,s

3.2. Coordonnées cylindriques (r, 8, z)

Dksigrlolw par CI~, r6fl ct 6~ Irs dimmsions de la mailk Clhmt;~irr (cj’. Fig. 14.3).

+ & [Q(i.j. x: + 1) + @(i.,j> k -- 1) ~ @(i,j. k)]z 1

4. Résolution des équations de type elliptique

On sc propose dc calculer les valeurs d’une forlction Q ohéissarit 5 une kluation de Poisson :

A@( Y) = p(F).

2 2 0

Page 212: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14. INTÉGRATION DE~ RQUAT~ONS .~TJX DÉIIIV~~ES F.ARTIELLE~

Figure 14.4. Coorrlonm2e.ç sph,Criqur.s.

Dans tic nornbrcux cas p( F) = 0, ct nous tlevons résoudre IIIE: équation dc Laplaw :

A@(F) = 0.

Les fonctions qui olkksent à cette CquaLtion portent, un nom. on lts appelle fonctionsharmoniques. La recherche de CCL> solutions dais lc cas des symibks usuelles s’t’ffectuc sousla forme dc produits de Laplace et elle aboutit à un bon noml~rc dc fonctions dites spéciales,al1trenient dit ccllcs qui jouent un rôle important en analyse : sinus, wsinus, fonctions ticLegendrc associks, fonctions dc Weber-Hermite, dc Bcssel. de Neumann. de Mathieu ctc:.

Dans lc cas de l’équation dc Poisson, IIOUS connaissons une solution particulib :

du ét,ant 1’6kment de volume. Il suffit d’ajouter c:ett,e solution aux solutions dc l’équation dcLaplace (kluation sans sec:ontl membre) pour obtenir la solution complète (kyuatiori linbaire).

1Clallleureuscmcnt, lorsque le probkne étudik n’admet pas dc symktries simples, 1~:s solutionsformelles drviennent cx<:c:pt,iorlrlelles ct, pratiquement dans tous les cas il f’aut avoir recours aucalcul nurri&icliie.

4.1. Conduite du calcul permettant la résolution numérique de l’équation de Poisson

Par raison de simplicités, 1101x3 étudierons le probkmc ths un rcpèrc~ cartésien ortlioiiormt? ctnous choisirons 63; = 6y = 6z = h.

221

Page 213: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NU&RIQVE APPLIQUÉ

Maintenant, exprimons Q(i;j, k) au point M(a, j, k) en fonction des valeurs prises aux pointsplus proches voisins de hi(i,j: k) :

qi, j, k) = g [a+ + l,j, k) + Q(i - l,j, k) + Q(i, j + 1, k)

+ Q(i;.j - 1, k) + @(i, j, k + 1) + @(1;,j> k - 1) ~ h”p(i,j, k)].

4.2. Méthode de Jacobi (1804-1851)

C’est une mkthodc itérative qui consiste à affecter aux nteuds du maillage une valeur arbitrairede l’ordre de grandeur de celles qui SC situent, sur la frontière. La dcrniere relation i:tablic permetalors de calculer tous les points adjacents à la frontière, lesquels sont les seuls à être modifiks.La réitération de l’exploitation de la formule pcrrnet de proche en proche de modifier tous lespoints du maillage. On montre que la méthode est convergente. Au rhe tour d’it,krat,ion; on écritles relations qui font appel aux calculs effectubs au (n - 1)’ :

d”‘(i> j, k) = ; [a+‘)(i + 1, j, k) + Q> (“--‘I(i - l>j, k) + Q+‘)(j,j + 1, k)

+ d’“-“(i,j - 1, k) + Q> (n-1)(“> j, k + 1) + Q +l)(i>j, k - 1) ~ h”p(i,j, k)]

D’un point de vue pratique, il faut deux tableaux pour mcttrc tn couvre cet algorithme. Detoute façon, il n’est pas trk utile de programmer cette procédure car la mCthode de Gauss-Scidclen est une importante amélioration.

4.3. Méthode de Gauss-Seidel (1821-1896)

On peut montrer que la technique itérative de Jacohi est convergente et ahsolumcnt convergente.Gauss et Seidel ont profité de cette proprikti: pour améliorer la rnkthode de .Jacohi : au coursdu calcul, on peut faire immkdiaternent usage des valeurs qui viennent, d’êt,re calculkcs et, nousn’avons plus besoin de sauvegarder les différents tours d’itbration. Nous n’avo11s plus besoin qued’un seul tableau dans lequel les valeurs sont « écrasées » succcssivernent. Ccttc rnét,hode exigtenviron deux fois moins dc calculs que la mkthodc de Jacob car elle converge beaucoup plusrapidement .

4.4. Application

On se propose d’étudier les équipotentielles d’une lampe triode que nous prksentons assezsimplifik. Une larnpe triodc est constituée d’une cathode K, d’une anode A et d’une grille G1:Gx, Gx, Gd, Gs, G(i. La figure 14.5, page ci-contre montre la coupe de cette lampe simplifike.

L’anode A est un cylindre métallique de rayon 1 cm port6 au potentiel 100 volt,s par rapport,à la cathode qui SC trouve au potentiel zéro. La cathode est un simple fil métallique de rayonnégligeable placé sur liaxc du cylindre de l’anode. La grille est constituée dc six fils parallèles à lacathode disposés régulièrement sur le cylindre de rayon T = 0,2 cm, ces six fils ktant rnaintennsau Potent)iel -5 volts par rapport à la cathode. On se propose de déterminer la carte du potent,ieldans un plan perpendiculaire à l’axe de la triode.

Pour ce faire, nous ferons usage des coordonnées polaires à, cause dc la symétrie cylindrique.Comme le probkme admet une symétrie d’ordre six, nous n’avons donc besoin pour effectuerles calculs que de faire varier l’angle H dans l’intervalle (0,7r/3) te , nous compléterons ensuitepar symétrie.

Nous choisissons le rnaillage suivant : 68 = 7r/36 et 6~ = O:l cm (cf. Fig. 14.6. page ci-contre).

222

Page 214: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14. INTÉGRATION DES ÉQUATIONS AUX DERIVÉES PARTIELLES

Figure 14.5. Représentation schématique

d’une lnm.pe triode.

Figure 14.6. Maillage d’une partie

du domaine de la triode.

AnodeK

Cathode

4.5. Technique opératoire

On met des zeros partout aux nceuds du maillage hormis aux points A, GI et K. Nous calculonsle potentiel sur les droites D 1, Dz, 03 et Db. Nous complétons par symétrie car sur la droiteDF> le potentiel est le même que sur la droite D 9, et celui de la droite Da est le mCmc que celuide la droite Dl. Nous avons donc besoin d’un tableau contenant 88 valeurs et nous arretonsles calculs quand deux valeurs calculées au même point au centre du maillage, lors de deuxitérations consecutives, sont Sgales ü une certaine précision près.

On trouvera sur le Web (*) 1 c programme triode. c qui réalise le calcul des potentiels par laméthode de Gauss-Seidel.

*http://www.edpsciences.com/guilpin/

223

Page 215: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5. Résolution des équations de type parabolique (méthode explicite)

5.1. Maillage pour une coordonnée d’espace et la coordonnée de temps

Cornriie prKdcrnrurnt~ nous choisissons un maillage rbgulier, ct, la maille ~lhncmtaire a la killecT:cSt. Nous pouvoiis écrire :

mqx, t) ~ qx + 6x, t) + q:x: - hr, t) ~ 2qn. t)

a2 .r..t 6:IJ

+D(.c, t) ~ qz t + n‘t) ~ q.c; t)at .r.t h‘t

Au moyeu ch diff&ences finies. l’expression de 1’6qnatiorl dcvicnt :

5.2. Conduite du calcul pour obtenir la résolution approchée de l’équation de diffusion

Les valeurs cn chaque point du rrmillagc au temps 1 + ht ne dCpcnd(~rlt que tics vakurs calculksà l’instant, t. La solut,ion du problCme est &tcrmirlC+ par une suite tl’oph-atious 6lhcmta~irescffcctui33 CI part,ir ch.3 coritlitions iiiitialcs, ct il est facile tic s’apcrcmY)ir que &tc~ m6tlde u’cstpas itérative (les vsleurs changent, au cours du temps) :

qz. t + 6-t) = 9(Z) t) + g [fD(zr + ch. t) + qx - &r:, t) ~ ‘Lqx, t)]

Au temps t = 0, nous connaissons la valeur de @ CU t,ollt poiut, du maillage. Au temps ht. uouscalculoris au moyeu de la relation ci-dessus les valeurs en c‘llacluc~ poirlt (111 maillage. cm tenantcompte tics conditious iruposks au systhc @tu&+ (conditions aux limites). Puis nous cfhkuonsles calculs au temps 26t par le rr&nc: procéd6; ct, aiiisi clc suitr, ii11 tclll~>s 3Ot. . rsfk Nous

obtenons alors 1’Pvolution du syskhne au cours du temps.

5.3. Problème de stabilité

Nous ne pouvons las choisir u’irrlportc~ corumcnt 1~: quadrillage de l’cspac~c~ (x. t) ct lr: ca.lculproposé est st~ablc lorsque la conditiori suivant,e est rcniplie :

cy valmt 2, 4 cm Ci sclori qu’il y a une. tlcux ou trois coordoririCcs d‘cyacc.Le non-respect clc la condition de sta.lClitk est, sanctionuC~ irriirl~diatrrll~llt, : on obtient, très

rspidcrncnt ri’irriport,c quoi : ou ahoutit à uu tl@üsserncnt dc capac‘itb (overflow) qui produit unarr?t de la rriachinc~.

2 2 4

Page 216: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14. I.NT&RATI~N DE:S ÉQU.~TIONS A~IX DÉRIVÉES PARTIELLES

5.4. Application : Refroidissement d’une plaque homogène

Une plaqué hmnog~?nc d’kpaisscur i ! = 10 cm mt port& a la. trrup~rat~ure uniforme Ho = 90 “C. Autemps f = 0, c>llc est, plong&; dans un rkrvoir d’eau 5 la température 01 = 10 “C suffisanirricntgrand c:t, bim agit6 pour qiw l’on puisw admettre que l’briergie &lPc par la plaque nc clmngcpa,s de fac;ori riotable la teinp&dure du réservoir. On sc propow dc dik:rrniner la ~,mipkratureà l’int,Prieur dc la plaque fn fonct,ion dc lin distmw z c,t, du temps t (ou notera la symétrie duprol)lèmr) La, plaqur est t‘11 cuivre dont le coefficient, de tliffusion est D = 1,12 crn”sP1 Autmut de cornl)ieii de tririps pouvons-nous adrncttrc qiic 1iL tcnipi:mture est 2. nouveau uniformedans la plaqw. c’est-k-&-c> lorsqiw la, teinp6rdure la plus élevée ut tl6passc que dc 0.1 “C lat~mip6ratim du tlicmnostat ?

Il est tout à, fait intérrssmt dr corripare~ les résultak du calcul riiirn6riqiic rwcc les rk1dtatsdu c;kd formel. C‘est ce genre de problème que Fourier a t,raitF ct pour lcqwl il II trouv6 lasolutioii sous forme tl’uii d~velol)l>eriierit, en série de sinus et tic cosinus qui, ai~,joiml’liui, porksou nom (Thkorie malytiyue de la cldrur, 1822).

On trouvera sur lc Wcb (*) 1 c progrmm~c chaleur. c qui t,raite ce prol~lèrne.

6. Résolution des équations de type hyperbolique (méthode explicite)

Nous rec:lirrc:lions une fonction Q qui prend certaines valeurs sur le hortl d‘un doriiairic ct quiobbit 5. l’kluatiori suivmtr :

expressioii dms l a q u e l l e (’ e s t u n e wnstarite appelbr c+kitt ck l’oritlc litm tlms 1~ milieu<onsidk+ (vitesse de phase).

La foiiction tl&mcl tirs trois vari;tt>les d‘espace 2. y. î et, de la variatdc clc tcrrips t. CornrncprMdtrnnicnt. pour kt,utlicr l‘intPgrat,ion dc ccttc équation. noiis m coiis~mmis qw la seulemordonnk: d’mpaw 2. L’klimtion sc rkluit alors à, l’~~xpression :

32q2, t) 1 dz@3z” r2 3t”

6.1. Maillage pour une coordonnée d’espace et la coordonnée de temps

Cornrnc pr@c~~derrirrierit. nous choisissons 1111 rriaillagt rkgulicr~ ct la rmilk 616rncml,airc~ a la tkllrbzh‘t. Nous pouvorls écrire :

Au moyen clcs diff6rcncw finks, l’expression de l’iquatiorl tlcvicnt :

225

Page 217: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5.4. Application : Refroidissement d’une plaque homogène

Une plaque homogène cl’6paissr:ur / = 10 cm est, portbe n la tcmpk;tt,urr uniforme 8,) = 90 “C. Autemps t = 0. elle est plong6c dans un réservoir tl’e;ru à la température 01 = 10 “C suffisan~mrnt~grand et lkri agit,6 pour que l’on puisse adnwt,tre que l’éncrgic cklée par la plqur: ne changepas de faqon notalde la. températurc du réservoir. On SC propose de d6tc:rminer la. tempPrat~ure?i l’intbricwr de la plaque cn fonction de la tlistancc~ :1: et du temps t (on notera la. sym6trie duproblème). LR plaque est en cuivre tlont le coefficient dc diffusion est D = 1.12 cn?s- ‘. Al1bout dc combien de temps pouvons-nous atlmcttrr que la. t,empkdure est, à. nouveau uniforincdans la plaque, c’est-Mire lorsque la tc~mptraturc la plus @lev+e nc tlbpa,sse que dc 0.1 “C latcmptrature du tlicwilostat ?

Il est tout à fait, intkwaiit~ dc comparer les rksultats du calcul numtric~ue avw lw rkultatsdu cald formc,l. C’est c’c gtnrc dc probkmc que Fourier a trait6 et, pour lcqwl il a l,rouvC lasolution sous forme d’un dfvcloppcmrrit, en s6ric dc sinus et, tic cosinus qui. ai~,joiud’Iiui. porteson nom (TlGwrie ;inalytiquc tic la. dialeur, 1822).

On trouvera sur lc Wcb (*) 1 e programme chaleur . c qui tr;i,ite ce prol)l?mc~.

6. Résolution des équations de type hyperbolique (méthode explicite)

Koils rec~hrrcllons lme fonction Q qui prend certaines valeurs sur le bord tl’lm domaine ct quiol+it à. l’kluat,ion suivaritc :

c~xprrssion dans l;tquelle c est une cwnst,antc appelée cCkrit,P de l’on&~ libre tlrtris le milicucorisidér6 (vit,csse de phase).

La fonct,ion dkpentl des trois variables tl’cspaw XT, y. z ct de la variabk~ de temps t. Commeprtcklcmment. pour 6tudier l’intégration de cette 6qu;ttion. nous nc wnservons qu(~ la seulecoordorm~e cl’csl~ac:c: CE. L’kpiat,ion SC‘ rkluit alors à, l‘expression :

iS”Q>(z; t) 1 a2ù,arr” - (f2 (yt2

6.1. Maillage pour une coordonnée d’espace et la coordonnée de temps

Comme préréclcmmrnt, nous clioisissoiis im maillage r&g&X”, et la maille 6ltmentairc a la taillehz&. Nous pouvons &rirc :

Au moyen des tliff6rences finies, l’expression de l’équat,ion devient :

*http://www.edpsciences.com/guilpin/

225

Page 218: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL. DE CALCUL NUMÉRIQUE APPLIQUÉ

6.2. Conduite du calcul pour obtenir la résolution numérique de l’équation de propagation

Les valeurs en chaque point du maillage au temps t + St ne dépendent que des valeurs calculées àl’instant t et a l’instant t ~ 6t. La solution du probleme est déterminée par urle suite d’opérationsélémentaires effectuées a partir des conditions initiales, et l’on voit ici encore que cette mcthoden’est pas itcrativc :

qx, t + ht) = r2fD(x + 6x, t) + r2qx ~ 6x, t) + 2(1 ~ T2)4>(X, t) - qx, t - &),

expression dans laquelle on a posé :

Au temps t 5 0, nous connaissons la valeur de Q en tout point du maillage. Au temps 6t: nouscalculons au moyen de la relation ci-dessus les valeurs en chaque point du maillage, en tenantcompte des conditions imposées au système étudié. Puis nous effectuons les calculs au temps26t au moyen de ce qui s’est passé au temps t = 0 et au temps t = St, et ainsi de suite au temps36t, . . , n&, . Nous obtenons par ce moyen l’évolution du système au cours du temps.

6.3. Problème de stabilité

Ici encore, nous nc pouvons pas choisir n’importe comment le quadrillage de l’espace (z: t) etl’algorithme propose est stable lorsque la condition suivante est remplie :

<y valant 2, 4 ou 6 selon qu’il y a une, deux ou trois coordonnées d’espace.Ici encore, le non-respect de la condition de stabilité provoque l’arrêt quasi immédiat de la

machine:

Application : Profil d’une corde vibrante pincée - Une corde vibrante ABC est fixée à cesdeux extrémités B et C, et, à l’instant initial t = 0, cette corde est disposée conforrnérnent à lafigure 14.7.

.Y

A

LT/B n>

L c xFigure 14.7. Profil d’une corde pincée.

Sachant que L = 100 cm, h = 1 cm, c = 300 mspl et (L = 15 cm, on se propose de dctcrminerles profils successifs de la corde sur une demi-période. On note que l’on doit retrouver un profil

2 2 6

Page 219: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

14. INTÉGRATION DES ÉQUATIONS AUX DÉRIVÉES PARTIELLES

symctrique au profil initial. On observera aussi la propagation des ebranlements de chaque côtédu point A.

Sur le Web (*), on donne le programme corde. c qui rcalise la simulation d’une corde pincée.Il est intéressant de comparer les résultats avec ceux fournis par la solution analytique.

7. Éléments de bibliographie

M. AINSWORTH (19%) Theory and numerics of ordin,ary and partmr! eguations, Clarendon Press.J. AMES (1972) Nonlinear partial differential eguations in engineering, Volumes 1 and 2,

Academic Press.J. FAVAR.D (1962) C o’urs d ‘Analyse de l'École Polytechnique, Tome III : Théorie des équations,

fascicule 1 : Équations differentielles; Gauthier-Villars.J. GIRERD et W. KARPLUS (1968) Troi ement des équations dirférentielles ssur calculateurs,t,

arithmétiques, Gauthier-Villars.P. HENRICI (1964) El,t=ments oj NumericaI Analysis, Wilcy.F. HILDEBRAND (1956) Introduction to the numerical anakysis, Mc Graw-Hill.D. MC CRACKEN et W. DORN (1964) Numerical Methods and Fortrun Programm,kg, Wiley.H. MINEUR (1966) Techniques de Calcul Numérique, Éditions Dunod.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculate~urs arithmétiques,

Dunod.P.A. RAVIART et J.M. THOMAS (1988) In,troduction à l’analyse rxumérique des kquations aux

dérivées partielles, Dunod.A. TVEITO (1998) Introduction to partial d$ferentiul equations : a computational upproach,

Springer.

*http://www.edpsciences.com/guilpin/

227

Page 220: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15 (Les séries de Fourier

Les séries de Fourier jouent 1111 rôle important en calcul numériquc~ et OII les retrouve lors desproblèmes d’approximation des fonctions, dc lissage; d’interpolation ct aussi dans les problèmesde filtrage numérique. En toute rigueur le calcul pratique des séries dc Fourier n’est pas adissocier du calcul des transformées de Fourier, et nous aborderons l‘étude du trPs puissantalgorithme de Cooley-Tukey. On se bornera donc ici à etudier les fonctions pcriodiques dcperiode 25r puisqu’un changement lineaire de variable permet toujours de se ramener a cc cas.Ccpcndant on pourrait tout aussi bien s’int&esser aux fonctions pcriodiques de pbriode 2: c’est)-a-dire dans l’intervalle (-1, +l), dans la mesure où l’on souhaiterait ctudier en mbme temps lesdevcloppernents en série de Tchebycheff.

Au cours de cc chapitre, on se contentera de rappeler 1111 certain nornhre de theor?mcsfondamentaux dont on omettra la démonstration.

1. Petit apercu historique

L’origine des séries de Fourier remonte à 1822 quand est paru l’ouvrage de Jean-Bapt,iste-JosephFourier (1768 1830) sous le t,itre « Théorie Analytique de la Chaleur ». C’est en résolvant « lcproblème du mur » en regime transitoire que Fourier a fourni une expression formelle constituéed’une somme trigonométrique infinie. Il est intéressant de rapprlcr ici les grandes lignes de ccproblème ainsi que sa solution. On recherche donc la solution de l’équation de la chaleur dansun milieu homogène et isotrope constitué par un mur indéfini d’epaisstur h. On designe par Dlc coelhcient dc diffusion thermique dans lc milieu, par Q la température, par J: la seule variablespatiale et par t la variable temporelle. Il convient alors de rcsoudre l’équation :

d”8 1 ae-=--.d2J2 D dt (15.1)

Posons H(z.t) = X(z) . T(t) fi 1, h, >ha n c e rec erc cr les solutions sous la forme dc produits dcLaplace. Nous obtenons :

D~“(Z) T(t) = X(z) T’(t)

d’où l’on tire :

,X”(X) ~ T’(t)~_~.X(x) T(t)

(15.2)

Page 221: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMEIUQUE APPLIQUÉ

Comme lc premier membre dc (15.2) est constitué d’une fonction nc dépendant que de z et,comme le second membre est constitué d’une fonction nc dépendant que de t: leur intersectioncommune ne peut &tre égale qu’à une constante que l’ori désigne par -k?. Comme on va lc voirle signe moins résulte du fait physique que la tempbrature ne peut pas croître indéfiniment defqon spontanke. On obtient alors les kquations :

X”(X) + k”X(z) = 0, (15.3)

T’(t) + k2T(t) = 0. (15.4)

Maintenant, pour déterminer compktement la solution il est, nkessaire dc faire intervenir lesconditions init,iales et aux limites.

Au temps t < 0, T = T, pour 0 < z 5 h et T = TO partout hors du mur.Au temps t = 0, on a T = TO sur les parois du mur c’est-à-dire pour z = 0 et z = h. Les

solutions des kquations (15.3) et (15.4) s’écrivent :

T(t) = A’exp(-kDt) X(x) = B’cos(kz) + C’sin(kz),

A’: B’ ct C’ ktant des constantes d’inGgration. Une solution de (15.1) s’krit :

/3(:1*; t) = [A COS(~;~) + B sin(kz)] exp(-k2Dt), (15.5)

expression dans layuclle A et B sont des constantes, ce sont des combinaisons linéaires des autresconstantes A’. B’ ct C’. Il reste à appliquer les conditions aux limites ct les condit,ions initiales :

O(0, t > 0) = Q(O> 0) = r,, = A:

6’(h,t > 0) = H(h,O) = TO = Acos + Bsin(kh)

Pour simplifier les équations, on peut rkaliser un changement d’origine des tcmpérakures etposer :

TO est la nouvelle référence, et l’on obtient :

A=0

0 = B sin(kh)

La solution non triviale impose :

kh,=n?r avec n-0,1 ,2 ,3 . . . .7l

dor1c k = 7-l-h

avec ,n = 0, 1,2,3, . ,

et l’expression (15.5) s’krit alors :

Q(~C, t) - TO = L3 sin (7x) exp [- (y)ZDi]

230

Page 222: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES T)E FOURIER

Il nc reste plus qu’3 déterminer le coefficient B: et, cn toute rigueur, B dépend de 11,. Comptetenu de la linkarité de 1’6quation (15.1); la solution la plus génbrale doit donc s’krire :

On remarque qu’à l’instant t = 0 : 0(.z. 0) ~ TO = T, ~ TO = T: pour 0 < .ç < il> donc :

(15.6)

Multiplions les deux membres dc (15.6) par sin (y:~) ,tjc intégrons de 0 à h. On olkient~ :

]Tisin (yz) dz = B,, [siIL’ (yz) dz

0

à cause de l’orthogonalité des fonctions sinus (voir le prochain paragraphcl). Le rncml)rr~ ticgauche est diffkent de zCro quand 71 est impair soit n = 2p + 1, quant, au membre d<, droite, ilvaut h,/2. On déduit donc la solution gérkale :

e(x, t) ~ TO = 4: 2 ij&y siri [(2p + l)i.c] exp [-i,iy, + ,,?,i,i (15.7)7r=l

D’une façon plus générale, si au temps t < 0, la condition da.ns Ic mur s’Ccrit F(z) pour 2compris entre 0 et h, alors la condition (15.6) prend la forme :

F(z) = F B,, sin (7~) . (15.8)rt-1

La somme est le développernent de F(z) en série de sinus, les proIn%%% dr paritk ou desymétrie ayant annulé les coefficients des termes en cosinus.

En définitive, la solution spatiale est donnée pa,r lc dkvcloppemcnt de la condition initialedans le mur (ici, c’est la fonction «fen%re » qui est une constante dans un intervalle fini et, quiest, nulle ailleurs).

2. Orthogonalité des fonctions sinus et cosinus sur une période

Il s’agit dc calculer les expressions suivantes :

27T

K = J sin(rLz) sin(rrlz) dzIl2T

L = J sin(,/ls) cos(7rm) dz:0277

M = J cos(nz) cos(m2) dz.0231

Page 223: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCTJL NUMÉRIQCJE APPLIQUÉ

Pour cela on utilise les formules usuelles dc trigonométrie à, savoir :

sin(a + h) = sin(a) cas(h) + sin(b) Cos(a)

sin(u - b) = ski(a) Cos(b) ~ sin(h) cos(cI)

CO~(U + b) = COS(U) COS(~) ~ sin(a,) sin(b)

COS(~, ~ b) = COS(U) COS(~) + sin(n) sin(b)

qui nous perrnettcnt, d’obtenir :

ski(a) COS(~) = [sin(a + b) + sin(n ~ O)] /2

COS(U) COS(b) = [COS(Q + b) + cos(u - b)] /2

sin(u) ski(b) = [CO~((I. - b) ~ cos(u + b)] /2.

L’intf?gration des expressions K: L ct M au moyen des dations prkédcntes foiud les égalitkssuivantes :

3. Série de Fourier associée à une fonction périodique

Ori s’intkresse à une fonction f(z) périodique dc pério&, 27r. à laquelle on associe la skietrigonométrique :

susceptible tic représenter la fonction f(z) d arls l’intervalle (0; 27r). Supposons que nous ayonsl’égalitk :

f(x) = 2 + g n, cos(n,z) + j?j b,, sin(rbz),71=1 rr=l

(15 .9)

nous prkiserons ultérieurement les conditions pour que la fonction et le di:veloppcment trigo-nométrique propos6 soient égaux mais, pour l’inst,ant cherchons à, calculer les cocBicients a, etb,,. Pour cela.; multiplions les deux membres de la relation (15.9) par COS(~~) ct intégrons sur lapériodc :

et en tenant compte des relations d’ortliogonalité, on obtient :

(15X]

2 3 2

Page 224: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES DE ForrRrER

et, corllrrle

ceci explique l’origine du çoeflicicnt ao/2 : tous les ah. sont calculk au moyen dc la mkrle formule.DC la même façon, multiplions les deux membres de la relation (15.9) par sin( Icx): puis

intégrons sur une période ; cn tenant compte des relations d’orthogonalite, on obtient :

(15.11)

4. Conditions d’égalité de f(x) et de la série de Fourier associée

On admettra sans di:monstration les théorèmes siiivants :

4.1. Théorème I

Si f(z) est une fonction periodiquc dc pikiode 2~r, continue et pourvut d’une dérivée prcnii?rccontinue f’(z). sauf eventuellement en un nombre fini de points sur une période et, qui sont alorsdes points de discontinuit6 dc première espèce pour f(z) et f’(z), 1a série trigonorri~t,riqiic (15.7)est, convergente pour tout n: et a pour somme f(z) dans le cas dc la continuité et [,f(z + 0) +f(z - O)I/L dans le ca.~ de la discontjinuitjP (convergence simple).

4.2. Théorème II

Le théor+me 1 est conservé si f(z) est à variations bornees sur un intcrvallc dc pkriode 25~.

Définition d’une fonction à variations bornées - Soit f(z) une fonction d&iic sur miintervalle (n: h). On divise (a, b) en n sous-intervalles partiels au moyen de (n ~ 1) points t,elsqw :

a < ICI < 52 < 5y < ‘. . < Lcn-l < b,

soit, S la somme définie par :

Si, quelle que soit la décomposition de (u? b), la somme S,, rcstc infbricurc a 1111 nombre Mfini, on dit que la fonction f(z) es ,.t à variations hornks sur (Ut h).

4.3. Théorème III

Appcle thi:or?rnc dc Jordan (1838-1922). Si f(z) est p ériodique de periodr: 27r. et à variationsbornées sur tout intervalle fini, alors sa série de Fourier est convergente et uniformémentconvergente clans tout intcrvallc où f(.z) est continue.

233

Page 225: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUE

5. Quelques propriétés remarquables

5.1. Sur la vitesse de décroissance des coefficients a,, et b,

Si la strie trigonomhtrique est convergente, alors a, ct h,, tcndcnt vers zbro au moins commel/n. cependant, la convergence de la série peut Ctrc trks lcntc.

Si la shic trigonomCtriqllr: est convergente et uniformément çouvergcntc. a,, ct h,, tcndcnt,vers zéro comme 1/srL”7 f(~ ) -t 1x eb a 01s çoutinuc partout sur ime ptriode.

R6ciproqucmcnt, si f (x) n’est pas continue, lhn au moins des coefficients tend vers zéroCoIIIrIl~ 1/71.

5.2. À propos du théorème de Jordan

Si les conditions du théorème de Jordan sont vérifiées, alors la shic dc Fourier est int6grak>ltterme & terme. À propos de ce théorème, on peut, SC poser la question dc savoir si toutes lesfonctions continues sont développa.bles eu série de Fourier. La rkponse est, non. En cffct, toutesles fonctious continues ne sont, pas à varktious bornées ct l'on peut trouver des exemples defonctious contimies dont la si:ric trigonométrique associk diverge en un point parce que lafonction n’est pas à variations borntes.

5.3. Sur la parité des fonctions f(x)

Si f(x) est, une fonction paire, la série trigonométrique associée n’admet yu’uri développementen cosirms (fonction paire) j les coefhcierits des termes en sinus sontj nuls.

Si f(.~) est ur1c fonction impaire, lc dhcloppcmcnt II~: comprend que des termes en sinus. ettous les arr sont nuls.

5.4. Dérivabilité d’une série de Fourier

Si a(~) et .f’(~) 1,ossèdrnt, des discoutirmités de premi&e espèce en nombre fiui sur l’intervalle(0, 27r). et sorit, corit,inues ailleurs, alors f(:Z;) est dhcloppablc cn s6ric dc Fourier. mais la sérieconvcrgc lcntcmcut ; l’un des coefficients arr ou h,, tend vers ztro avec l/n et la série dtrivkene converge pas. En revanche, si f’(~) et f”( z existent et sont coiitinues sa.uf éverituellement)eu un nombre fini de points daus l’intervalle (0, 27r) où il cxistc pour ces deux fonctions desdiscontimlith d c prcmikrc C~~~:C:C~, alors, on peut calculer directement UII dheloppement de.f’(:c) WI skie de Fourier.

Remarque : Deux séries dc Fourier dont les sommes c:oiincidr:nt, sur un intervalle intkrieur à. unepbriode, nc sont, pas néccssaircmcnt idcntiqucs c’n dehors de cet intervalle.

5.5. Quelques développements traditionnels

a - Soit la fonction paire de période 27r définit ainsi :

f(x) = r-:x’ si 0 S:I: < 7r

f(x) = 5 - 7r si ~ rr< z < 0.

Comme .f(.c) est u n e fonctiori c o n t i n u e et, paire, ou cn tlhluit immkliatement que lescoeffkients b,, sont nills. Il reste à calculer les cc, :

2.x

234

Page 226: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LE~ SÉRIES DE FOURIER

Les termes correspondant à une valeur de n pair sont nuls, il s’ensuit que :

4

%+l = r(‘$)+ 1)“’

avec p = 0, 1,2, . On trouve no = 7r.

b - Soit la fonction f(z) = 2 - 1/2 si 0 < z < 1.On obtient le d&Aoppcment suivant :

f(z) ~i (sin(f7rz) + sin(l7rz) +. + sin(Tr) + .)

C - Soit la fonction qui vaut 1 sur (0,7r) et -1 sur (+r, 0).Cette fonction est impaire, donc les uy1 sont nuls. On trouve :

d'où

La dérivke dc cc dkveloppement n’est pas mi dCvcloppement convergent,, cependant on pourral’utiliser quand mêrne pour calculer f’(z) . (cf. 5 8.2 de ce chapitre).

5.6. Note sur le calcul effectif des coefbcients de Fourier

Il n’est pas nécessaire de calculer les coefficients de Fourier au moyen des intfigrales. et il estplus efficace sur lc plan de la précision des calculs ainsi que du temps d’exécution d’utiliser latransformée de Fourier numCrique que l’on abordera au chapitre 16. Donc. il n’est pas utile drfournir 1111 programme qui calculerait directement les intégrales.

6. Approximation des fonctions par une série de Fourier tronquée

La première application des skies de Fourier concerne l’approximation d’une fonction f(z).Lc d~vcloppement alors est limitk à l’ordre 12. La démonstration repose sur le théor~mcd’approximation de Wcierstrass selon lequel toute fonction continue sur l’intervalle (0; b) peutetre approchée par un polynôme Pr, (:x) tel que :

quel que soit z appartenant à (a, b). Da.ns cette expression E est 1111 nomlw positif aussi petitque l’on veut. On trouvera urle démonstration complète dans l’ouvrage dc .J. Bass, COU~S deMuthémutiques, Tome 1, p. 312, Masson, Paris 1961.

2 3 5

Page 227: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

6.1. Théorème

Si l’on veut approcher au sens des moindres carres UIIC fonction f(z) définit sur (a, b) parune skie trigononktriquc et que ccttc S&ic est tronqukc à l’ordre n, alors les coefficientsdu développement trigonométrique sont @aux aux coefficients du d~vc,loI>pr:rncnt CII shic dcFourier.

Bien entendu ce Worèmr est, valable sous réserve que les conditions de validité de dévelop-pcmcnt en skrie de Fourier soient vérifiées. Autrement dit. le développement en série de Fouriertronqué & l’ordre n est celui qui. parmi tous les dhcloppcmcnts trigononi~triqucs possiblestrouyués à. l’ordre 71, assure la mcillcurc approximation, au sens des moindres carrks. d’unefonction développable en série trigonomktrique.

Nous allons dhontrcr ccttc proposition dans le cas d’m1e fonction éc~lallt,illorlrlée.

Approximation d’une fonction échantillonnée - Considhons une fonction f(z) périodique depériode 227 dont on connaît uniquement 2N+ 1 valeurs yk. pour 2N+ 1 valeurs zk dc la variable.Les 2N + 1 valeurs de la variable sont réparties en progression aritlmkt,ique sur toute la pkiodc.soit :

N - 1-;,0,;,...>

N - lTTT, NT, . ’ N r

Comrnc f(7r) = f(-7r), seules 2N valeurs ~(XL) sont indépendantes. On a poli6 :

CE, x T1N

avec 1 = -N + 1: -N + 2:. . , -1,O; +l, . . ~ N.

Nous allons donc approcher f(z) p a r une expression trigonomktriquc dont la forme la plusgh6ralc est :

dc telle sorte qu’elle vérifie le critère des moindres carrés. Autrement dit, on désire rendrel’expression :

E”= 2 ~(XL) - Ao - e[Ak COS(~~) + Bk sin(kz)]

2(15.12)

l=-N+l k=l

la plus pctitc possible. On y parvient, CII écrivant que :

dE” 3E2y&=0 ct w=o.

Pour obtenir des expressions commodes d’emploi, il faut utiliser 1111 certain nombre de relationstrigonométriques qui s’établissent en se serva.nt de la formule de Moivre (1667 1754) ct del’expression de la somme d’une progression géométrique. Voici ces relations dans lesquelles j et

236

Page 228: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES DE FOURIER

k sont des entiers appartenant à (0: N) :

k sin(jzl) cos(klrïl) = 0l=-N+I

F sin(jz,) sin(kzr) = 0 s i j # kI--N+1

2 COS(,jzl) cos(kzr) = 0 s i j # k1=-N t-1

N N

C sin(kzl) = C cos(kn*~) = N s i k # O:Ni=-N+l I--N+1

N

Compte tenu dc ces relations. on calcule les derivées de l’expression (15.12) par rapport, auxcoeficicnts Ak ct Bk. On obtient alors les relations suivantes :

AN = & F ~(XI) CO~(N~,)/--N+I

et si k # 0, N

Ak = ; Bk = ; 2 f(z/) sin(kz,).I=-N+l [=-N+I

On reconnaît sans grande difiïculti: les coefficients du d6veloppcment en série dc Fouriercalculés par la méthode des rectangles.

Remarque très importante - Lorsque l’on effectue le calcul numkrique des coefficients deFourier de fonctions périodiques, on est tenté d’utiliser des nkkhodcs offrant, en a.pparencr plusde précision, telles; par exemple, la méthode des trapèzes ou la mkthodc de Simpson. À bien yréflkhir, ces méthodes privilégient certains points cn leur affcctantj des poids diffkrents, mais onne doit pas perdre de vue que lc calcul de toutes les intkgrales peut Ctrc réalis sur n’import,cquel intervalle pourvu qu’il ait la longueur d’une période. Conclusion. nous devons utiliser w1em6t,hode qui affecte à chaque point le même poids : il n’y en a qu’une seule, c’est, la méthodetics rectangles.

On retrouvera rigoureusement le meme procédé lors du calcul des transformkes dc Fourier parles algorithmes appropriks.

237

Page 229: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Un exemple numérique - On a fabriqué une dent dc scie tout à fait analogue à la premièrefonction développée, et il est intéressant de noter le comportements de l’approximation auvoisinage de la discontinuitk de la dérivée première. On a. tronqué la skie trigonomktriquc àl’ordre 10.

On trouvera sur le Web (*) le programme echantil . c riialisant la dkmlposition en série deFourier de fonctions périodiques connues au moyen d’un écllantillonnage déterminb selon desabscisses cn progression arithmétique.

7. Cas où la fonction est discontinue à l’origine

Dans ce cas, la notion de pi:riodicit@ au sens strict ne s’applique plus: ccpcndant, cela ne changerien à l’analyse prkédemmcnt réalisée; en effet deux solutions pcuvcnt Ctrc apportées à ceproblème :

1. On choisit comme nouvelle origine un point où la fonction est, corkinue ; ainsi il n’y a plus dediscontinuité à l’origine et ce faux prohlèmc a disparu.

2. On sait très bien obtenir lc développement en série de Fourier des fonctions en dent de scieprésentant une discontinuité à l’origine. Par conséquent7 il suffit dc r(%ranclicr convenablementune fonction cn dent dc scie qui annule la discont,inuité. En faisant usa.ge de la. propriété delinéarité des intégrales, on déduit que le développement en série clc Fourier de deux fonctionsdéveloppables est, la somme de chacml des deux développcmcnts ; cc qui rkout, notre prolAkne.

8. Le phénomène de Gibbs (1839-1903) et I’epsilon-algorithme

Il s’agit d’étudier le comportement du développement en série de Fourier de la fonction f(x)au voisinage d’un point de discontinuité. Nous allons nous intéresser A un cas très classiqurconstitué par la fonction « rectangle » ou fonction «fente » :

(J(“) 1i-l si -7T < cc < 0$-1 si O<X<T

dont nous avons dkj% btabli le dévcloppcmcnt cn série de Fourier. soit :

Bien que g(z) tcndc vers fl, lc dCvcloppcment associk f(z) lc ui rst continu tend vers zkropour la valeur z = 0. À prknt nous allons Ctudier le comportement de f(z) au voisinage dezéro. Pour cela, considérons le dkveloppemcnt tronqub 5 l’ordre n, dc .f(:r) que nous dPsignonspar S,(z) :

On peut encore krirc :.,

$S,,(:l:) =J’

{cas(t) + cos(3t) +. ‘. + cos[(2n, ~ 1)t]} dt:

0

*http://www.edpsciences.com/guilpin/

238

Page 230: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES D E E’OLJRIER

ct puisque

on obtient, :

sin(2,nt)cas(t) + cos(3t) + ‘. . + COS[(272 - 1)t] = msino

3

Les cxtrernurns de S, (:E) sont donnés par sin(2nz) = 0. Soit encore :

lm

zk = !navec k= 1,2,3;...n,

La courbe reprkeutant S,,(X) va cffectucr une série d’oscillations pour un point 5 quclcouqucchoisi dans le voisinage de l’ordonnée y = 1. Ou voit sans trop dc difficultk que lc premiermaximum est le plus grand ; pour le calculer on peut écrire :

?r/‘h 71sin(2nt) dt = 2 sin( 11,)

2 sin( t) 7l J’ 2n sir+L/2nj)du

0

eu ayant, posé u = 2nz.Pour les grandes valeurs de n et les petites valeurs de 5, on peut effectuer un dkveloppement

lin&6 de sin(u/2n) et remplacer cette expression par SU/~T~. Ainsi quand ‘II tend vers l’infini et:r: vers zéro; on obtient :

2 7r

-i’

ski(u)

77 Ud7L = +T)>

i>

où Si(z) est la fonction sinus intkgral que l’on peut calculer au rnoycn du dbvcloppenlcnt ensérie entière suivant :

Si(z) = & ~ 2 r+ Y& - . + (-1)”

T2r2+l

(271, +‘i)!(272 + 1) + ”

La fouctiou reprksentée par la série trigonornétriquc fait un saut brusque d@passaut de 17 O/cla valeur de g(x). Pl us on prend de termes, plus cette anomalie se trouve repoussée sur l’axedes y.

8.1. Usage de I’epsilon-algorithme et disparition du phénomène de Gibbs

Nous allons appliquer l’epsilon-algorithrnc à la suite des sommes partielles S,, (x). Nous avonsconsidk+ les termes depuis 5’71 jusqu’à Ss5 pour la valeur z = 0,l de l’argument. Les résultatst,rouvks sont présentés dans le tableau 15.1, page suivmte.

L’cpsilou-algorithme appliquk à ces quinze valeurs donne le résultat suivant :

0.999 998 031

On voit que l’epsilon-algorithme fait disparaître le fkheux phCnorr&ne de Gibbs et 1~s

iuccssantes oscillations au voisinage d’un point de discontinuité.

239

Page 231: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCTJL NUMÉRIQUE APPLIQUÉ

Tableau 15.1.

0,990 709 7310,999 733 5621.008 519 5561,016 728 8341;024 054 2651,035 047 8141>038 349 4211.040 045 4371,038 5816601,035 560 1171.025 708 4471,019 325 920

Sur le Weh (*): on dorme lc programme epsi12. c qui mont,re ce gcnrr: dc calcul.

R e m a r q u e : Le phénomène dr Gihbs n’est pas propre au dk&qq~emcnt d’une fonctionprkentant mlc discontinuité de premitkc espke sur 1me l)asc de sinus et, de cosinus. Lc prol&meest inhPrcnt à, chaque point, dc discontinuité quelle que soit la hsc de fonctions continues utiliséeet le d~vcloppemcnt continu nc peut en aucun cas représentc,r convcnablemcnt ur1c discontinuitk.Il n’en est plus de mCme si la base des fonctions (orthogonales si possihlc) est constitukc defonctions discont,inues t,elles que les fonctions de Hadamard, Walsh, Palcy et dc Haar. Lespoints de discontinuitk ne sont plus la source d’oscillations. ct les fonct,ions ~c:hantillonn~essont parfaitement rendues.

8.2. Retour sur les fonctions f(x) présentant des discontinuités

Nous avons dit que la fonction f(z) admctt,ait un développement, en skie de Fourier maisqu’au moins une skie dc coefficients (a,(, ou h,,) tendait vers zéro c:onmie l/n.. Si l’on dérivechacun des deux mcmhres, on voit que lc seconde membre est une skie divergente puisquee’cst une série de terme en cos(krc) ou sin(kz). L‘rpsilon-algoritllme tire nkmmoins parti de cesdonnées en calculant les sommes partielles de la série divergente. ~NOUS avons pris pour exemplela fonction qui vaut -1 pour z appartenant à l’intervalle (-T, 0) et -tl pour z appartenant, àl’intervalle (0: 7r) :

la dbrivée s’bcrit :

le rnembre de droite est divergent alors que le membre de gauche est nul partout sauf aux pointsn: = -T. æ = 0 et z = T où f’(z) est, 1111 pic (1~ Dirac. C’est hicn ce qur donne l’cpsilon-algorit,hlrle.

*http://www.edpsciences.com/guilpin/

240

Page 232: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES DE FOL~RIER

et, l‘on trouvera sur lc Web (*) lc programme dirac . c qui permet de calculer f’(z:) eu exploitantle développement cn série.

9. Représentation des séries de Fourier avec un terme de phase

Dans bien des applications, et notamrncnt en &~ctricitb. il est souhait,ahle d’ut,iliser urlc autreforme pour le dheloppemcnt en série dc Fourier (qui rend plus fa& d’emploi la uotiond’impbdancc par exemple). On peut, alors prkfbrer conserver uniyuemcnt~ ou les sinus ou lescosinus ct faire apparaître à l‘intérieur des expressions un terme dc phase, soit, :

f(x) = 2 + 2 dl2 cos(nx ~ pll) = $ + 5 cl,, [COS(~~) COS(~,,) + siu(nr) sin((pT1)]II =l 7t=1

En rapprochant cette expression du dévcloppemcnt (15.9)) nous obtenons par identification :

Q[] = d” (1. ,I = 6, COS(%) b,, = cl,, sin(prL) cl,, = (signe dc u)Ja,,a + b7,x.

10. Écriture du développement sous forme complexe

Comme c’est à partir de cette étude yut nous allons établir les transformbes de Fourier. nousprocPderons d’abord ü l’extension dc la pkriode yut l’on désigne par T au lieu de 27r. En posantjti = 27r/T, la série s’écrit, alors :

f(x) = 7 + g a, COS(TLWZ) + 5 b,, sin(nwrc).1,=1 n=l

(15.13)

ct, les cocfficierits deviemlcnt :T

b,, = g 7 f(z) sin(nwz) dz.

0

À présent, écrivons les cosimis ct les sinus en termes complexes :

COS(?LWIc) =exp(jnwz) + exp(-jnwrr:)

2

sin(rwz) =exp(jnwz) ~ exp(-jnwz)

2.j

w qui dorme pour f(:r) l’expression :

f(r) = $ + -gu,>exp(jnwz) + exp( -~TU,)

+ i: h,exp(jnwz) - exp( -j??hJX)

2II = 1 71=1 2.j

*http://www.edpsciences.com/guilpin/

241

Page 233: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCLJL NUMÉRIQUE APPLIQUÉ

Soit encore :

(15.14)

Les coefficients sont alors donnes par les expressions suivantes :

’ars - jb,, = 12 T.

/ f(x)[cos(nwz) - j sin(nwz)] dn: = $ / f(z) cxp(-,jnwzr) dz

0

Si l’on rcmarquc que l’on obtient (a, - jb,,)/2on t,rouvc des formules plus faciles d’emploi cn

Alors, la série trigonométrique s’écrit :

Cc

0

à partir de (n, + jb,)/2 CII changeant n en -n,posant :

c,, exp(jnwz).

ct les coefficients sont donnCs par l’expression :

Il faut bien noter que ces dernières expressions n’apportent rien de plus que les preccdentes dupoint de vue du calcul, mais elles servent d’introduction commode aux transformces de Fourier.

11. Approximation des fonctions au sens de Tchebycheff

Les problèmes d’approximation au sens dc Tchebycheff ne sont pas à dissocier dc l’étude desséries de Fourier. Soit une fonction f(z) continue à dérivées continues sur un intervalle (a; b).Nous recherchons une approximation g(z) de la fonction f(z) dans cet intervalle de telle sorte quesup If(z) - g(z)1 soit lc plus petit possible. C’est ce qui est convenu d’appeler l’approximationau sens de Tchebycheff.

Examinons le cas où g(z) est un polynôme P,(z) de degré n. Pour l’amour de la simplicité eten faisant usage d’une transformation linéaire classique, ramenons l’intervalle (a, b) à l’int,ervallecanonique (-1, +l). R,appelons rapidement quelques résultats fondamentaux relatifs à l’inter-polation par des polynômes. Le polynôme qui passe par les (~2. + 1) points d’abscisse cv, est lepolynôme de Lagrange L,(z) dc degri: n. L’erreur commise &(x) est donnce par l’expression :

où 7 appartient à l’intervalle (- 1, + 1).

2 4 2

Page 234: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉIUES DE FOURIER

L’erreur sera rendue minimum cn utilisant la propriété essentielle des polynômes de Tchehy-chcff, ce qui nous imposera le choix des abscisses, à savoir :

22+17rcY=cos ~-( >r1+12

a v e c i = 0,1,2,3,. ;n.

Ces valeurs reportées dans l’expression du polynôme permettent, d’obtenir une formulefournissant l’erreur minimum au sens de Tchebychcff. Pour des raisons pratiques, il est possibled’opérer dc la facon suivante : toute puissance de 2: notée zk, peut s’exprimer au moyen d’unecombinaison linéaire de polynômes de Tchebycheff dont les degrés sont égaux et, infkieurs & k.Donc, formrllemcnt :

Il nous reste alors à calculer les coefficients pk. Pour cela; nous allons kcrire l’erreur minimumE,, (x) sous la forme d’un polynôrne de Tchehycheff :

Posons alors 5 = COS(&). Eu égard a la définition des polynômes de Tchebychcff, on prut krirc :

~[COS(Q)] = cpi CO~(~Q) + En cc=(Q) = Q(Q),k=O

tn se souvenant que pour les valeurs <y~, nous avons :

et pour les valeurs

2i+17rQt=--n.+12’

nous avons :

Q(Qi) = cpi. CO~(~Q~).k=O

Les coefficients pk sont donc les coefficients du dkveloppement en skie de Fourier, tronqué àl’ordre 72, dc la fonction paire ~[COS(Q)]. On peut écrire :

Po = & 2 Q(Qi)k=O

ou cncorc :

243

Page 235: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

12. Application des séries de Fourier au filtrage numérique

D’un point dc vue très simple, le filtrage numérique est une opcration linéaire que 1’011 réalisedans l’espace reciproquc: de Fourier dans le but de modifier lc spectre dc fréquences ou denombre d’ondes (filtre passe-bas, filtre passe-haut, ct filtre passe-bande pour faire reférenceaux applications radioclectriques). Ensuite on rctournc à l’espace direct. Nous reviendronsplus en détail sur ces espaces, car pour ce qui concerne les séries de Fourier cette distinction.pointant fondamentale, est peu perceptible dans la rncsure ou les fonctions sin(nw2;) et cos(nwJ)dépendent directement des arguments de l’espace direct ct de l’espace reciproque. c’est-a-dire zet w.

Pour fixer les idees nous allons etudier un filtre sans contrainte. On prut dire qu’un filtrelinéaire est tout simplement un ensemble fini de coefficients Ak qui dépendent, uniqucmrntde l’opcration que l’on souhaite réaliser mais certainemcnt~ pas de la fonction f(t) a filtrer.coefficients qui viennent ponderer les valeurs des echantillons :

a(t) = 2 Akf(t + kht), (15.15)

k=-M

où Q(t) représente la fonction filtrée à l’instant t, 6t représente l’intcrvallc de temps entre deux

~cliant,illonnages, M et, N sont deux entiers positifs.L’etude des filtres numériques lineaires peut passer par la notion de fonction de transfert. On

Ctudie donc l’action du filtre sur un signal sinusoïdal que nous écrirons :

f(t) = exp(,jwt).

Par définition, la fonction de transfert en w du filtre (15.15) est donnée par l’expression :

T(W) = @ct)w(.%-t) ’

on obtient, donc :

T ( w ) = e Ahexp(jkw&).k=-nr

(15.16)

Très souvent on SC donne une fonction de transfert T(w), et il s’agit alors d’exprimer lescoefficients Ak correspondant à un filtre dont, la fonction de transfert T_A~N(W) soit la plusvoisine de T(w) au sens des moindres carrés. Autrement dit ~ il convient de minimiser, dansl’espace réciproque de Fourier, l’intkgrale calculée sur une pcriode 27r/St :

in/ht

1 =J

JT-*fN(w) - T(w)lL dw.

-/Jr

Il s’ensuit que les Ak sont tels que :

244

Page 236: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES DE FOURIER

et, en reportant la relation (15.16) dans la dernièrt intégrale, il est possible d’écrire :

dlaA,,, = 2

c Ak exp(jkw&) - T ( w ) exp(jmw&)dw.1En faisant usage de la relat,ion d’orthogonalité :

+TT/Ot.I exp[jw(m + k)&]dw = zLTn,k.

on en déduit que :

+r/h‘tA.2k 2iT .I

T(w) exp( -jkwSt)dw.

-T/&

Deux remarques s’imposent :

a. Les Ak sont indépendants de M et N.b. Les Ak sont les coefficients de Fourier du développement de la fonction de transfert T(w).

12.1. Application à l’étude d’un filtre passe-bas

a - Nous allons porter notre attention sur un des filtres les plus simples à réaliser : la fonction«fenêtre » dans l’espace réciproque de Fourier. Ce filtre se définit de la façon suivante :

0 5 lwl 5 Wl T(w) = 1:

f-4 I /WI I n/bt T(w) = 0.

Comme c’est manifestement 1111 filtre symétrique, les termes en sinus sont nuls. Il reste acalculer les termes en cosinus :

A/i = ; cos(kw16t)WiSt

a v e c Au = ~Ii-

b - Il est préfcrable d’utiliser un filtre constitué d’une fonction continue afin de reduire lesoscillations données par l’approximation. Aussi, pourra-t-on choisir un filtre du type suivant :

Wl I /WI < wz T(w~={~+cos(d3}:2

w2 5 lwl < 7r/& T(w) = 0.

Tous calculs faits, on trouve les coefficients suivants :

Ah: =7T

2k [7r” ~ k26t2(w2 - WI)21[sin(kw&) + sin(kwr&)] avec Au = (w2 + wl)St .

2n

Un bon exercice consiste à représenter lc filtre théorique ainsi que la fonction de transfertapprochée pour N = M = 20 (cf. équation (15.15))) e nsuite, d’appliquer ce filtre à une fonctionprésentant des irrégularités (courbe expérimentale entachée d’erreur).

245

Page 237: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

12.2. Remarques sur les opérations mathématiques réalisées lors du filtrage

L’q+rat,ion de filtrage que nous venons dc réaliser traduit une convolution dans liespacc direct.Dans l’espace réciproque de Fourier nous avons réalis6 lc produit simple de deux fonctions quisont la transform& de Fourier de la fonction f(t) à filt. rcr ct de la fonction <X fenêtre 8 T(w)qui est, 1111 filtre passe-bas. Dc retour dans l’espace direct, le produit simple de deux fonctionsest transformé en produit dc convolution. Nous reviendrons sur ces aspects des problèmes cnabordant 1’Rtudc des transformées dc Fourier. Cette derni6rc rcmaryuc prend tout son sens quandon passe à la programmation qui se rbduit au calcul du produit de convolution dc fonctionsp&iodiqur:s. Notons hicn, ici, que la fonction de transfert est sym6triyue ce qui peut donnerl’illusion de calculer imc fonction de corrélation..

Oii trouvera sur le Web (*) lc programme filtre. c qui ri:alise le filtrage de données numé-riques entachées d’crrcur.

13. À propos du développement des fonctions non périodiques

Il est parfaitement 1i:gitime de développer cn série de Fourier (au sens large) une fonction f(z)non p62riodique dans la. mcsiire où l’intcrvülle dc définition (a, 6) (1st fini et que la fonctionSat)isfait aux conditions légitimes du d6vcloppemcnt. Il existe une restriction importante dansla mesure on l’on ne pr,iit pas se servir du d6vclopprment en dehors de l’intervalle de définitionde la fonction. Par ailleurs. il est convenable de dire que lc développement en s6rie de Fourierconst,itue un prolongement analytique dc la fonctjion f(z) en dehors de l’intervalle (a, b).

En ce qui concerne les fonctions non p&iodiyues définies sur un intervalle infini, elles font,l’objet de traitements spbziaux appelés transformations de Fourier.

14. Calcul des séries de Fourier à coefficients approchés dans L*

Dans certains cas, le calcul d’une série au moyen de ses coefficients est un protGmc mal posédont on trouvera 1’6tude dans l’ouvrage de Tikhonov citk cn bibliographie. Voici un exempleconcernant une série convergente :

fi(t) = 2 ar, cos(nC).n=n

Supposons que Ics coeficicnts a, soient enta&& d’erreur ct que l’on ait :

c, = a,, + - avec cg = ao.n

A la place dc fl (t) on obtient la fonct,ion00

fz(t) = c CLr, cos(nt).71-O

Dans la m6triyue de L", les coefficients différent de :

donc ~1 est aussi petit que 1’011 veut.

*http://www.edpsciences.com/guilpin/

246

Page 238: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

15. LES SÉRIES DE FOURIER

À présent, examinons la dist,ancc entre les fonctions fi(t) et fz (t). Elle est, tlom& parl’expression :

Cette quantité peut être faite aussi graudc que l’on veut : la sCrie diverge pour t = 0.

15. Éléments de bibliographie

A. ANGOT (1972) Compléments de muthématique, Éditions Mass~.J. BASS (1961) Cours de mathématiques, Éditions Masson.R.. LASSER (1996) Introdu&on to Fowier series. M. Dckkcr.A. TIKHONOV et V. ARSÉNINE (1976) Méthodes de rc’solution des problèmes mul posc’s au sens

de Hadamurd, Éditions MIR., Moscou.

247

Page 239: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16 1 Les transformées de Fourier

Depuis la vulgarisation des algorithmes rapides (1965), le rôle des transformées de Fourier dansles problèmes de traitement de fonctions &.hantillonr~ées s’est notablement accru. Ce n’est paspour autant qu’il faille négliger l’apport considérable dc la théorie qui a fourni notamment uncatalogue de solutions formelles de problèmes. Cependant, le strict calcul numérique posé parun problème n’ayant pas de solution formelle connue était une entreprise à la fois très longuect très coûteuse. En calculant les intégrales au moyen de la technique des rectangles pour unefonction échantillonnées en 2048 points il fallait, avec une calculatrice de la fin des années60, environ 3 heures pour obtenir la transforrnée de Fourier. Le calcul des fonctions sinus etcosinus au rnoyen de relations de récurrence rnentionnées par J. Arsac a ramené le même calculà 3/4 d’heure tandis que l’utilisation de l’algorithme de Cooley-Tukey a permis d’effectuer latransformation en 45 secondes... Il ne faut pas oublier qu’ils ont eu des prédécesseurs meconnusqui ont ceuvré tout à fait dans la même direction et il est probable que l’idée originale de cetalgorithme soit due à Carl Rungc (185661927) et à KOnig. Sur cc sujet, on trouvera un petitaperçu historique dans l’ouvrage de E. Oran Brigham cité en bibliographie.

Les transformées de Fourier trouvent leurs principales applications en optique. en cris-tallographie, en analyse harmonique, cn traitement du signal, en résolution des équationsde convolution, en corrélation (théorème de Wiener (189441952) - Kintchine), en thcoric desprobabilités (fonctions caractéristiques), et d’une facon générale, dans tous les problèmes où ily a avantage à travailler dans l’espace réciproque.

1. Extension des séries de Fourier au cas où la période est infinie

L’idée consiste à isoler une partie de la fonction f(t) sur un intcrvallc fini (-T/2, +T/2): puisà procéder à son développement en série de Fourier, et enfin à faire tendre T vers l’infini et àexaminer le résultat. En posant :

on obtient le développement :

f(t) = !$ + 5 [a, cos(nfB) + b,, sin(nnt)]n=l

(16.1)

249

Page 240: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M.4NlrEL DE CALCUL hrU.W@RIQIJE APPLIQIJÉ

f(x) cos(n.12~) dz

h,!, = ; I’ f(z) sin(nRz) dz.

À présent, posons w = nR, cela nous pcrmct d’obtenir une autre forme du dkvcloppcmcnt :

f(t) = ff + k F R [CI ,, , , COS(~~) + h,, sin(wt)]cl=62

(16.2)

Dans cette nouvelle représentbion, on peut dire que (2 est l’a<:croissrment dr: w pris cntrc deuxvaleurs consécutives. Autrement dit, ou peut considérer que 62 est l’accroissement Sw dt: w. Lcdéveloppement (16.2) s’krit alors :

+T;a

f(t)=; / .f(z)dz+$$+j”,l( )[ ( )z C O S wn: COS(~~) + sin(wz) cos(wt)] dz. (16.3)

-T/z LECI -+/a

Soit encore :

Si, pour T tendant vers l’infini, l’on fait I’hypothk~ que :

tT/2 cccc1

lirn -T I’

f(z) dz = 0, que 6w A d w c t q11c 1 -+s

>

-T/aCL=62 0

alors on peut krirc :

f-(t) = ; 7 dw i,(x) cos[w(n: - t)] dz. (16.4)

0 -00

C’est lc dbvcloppcmcnt cn iutkgrale de Fourier de la fonctiou f(t). On peut encore écrire :

f(t) = ; 7+CC +CC

cos(wt) du.

-n

/ f(x) COS(~~) dz + sin(wt) / p(z) sin(wz) dz

00 ~00

Ces formes dc dhcloppcmcnt corrcspondcnt aux dhcloppcmcnts CII shic dc Fourier defonctions offraut « un spectre continu » encore appelé « spectre de bandes >>.

250

Page 241: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1.1. Intégrale de Fourier en termes complexes

Partons du développement en sh+ dc Fourier en termes complcxcs :

f(t) = CC~, exp(jnRt),

1avec c,, = -

T sf(x) exp(-jnk) dz.

--l-/2

En conservant les mnmes conventions que prk&hmncnt, :

nR = w et &ù + dw = (2,

on krit :

f(t) = A 1 c,, exp(jwt),-cc

d’où

En effectuant une extension A l’infini, nous obtenons :

On peut, encore poser :

f(t) = )‘G(w) exp(,jwt) dw

+m

G(w) = & / f(t) exp( -jwt) clt.

(16.5)

Il s’agit dans ccttc dernière forme d’une des exprc3sions les plus employi+s appelks l’unetransfornk: dc Fourier directe, l’autre transformbc dc Fourier réciproqur. Bien tics talks tictrzmsformées de Fonricr utilisent cette notation, cependant, on prkfbc utiliser tics formrs plus

251

Page 242: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

symCkriqucs eu adopt,ant les expressions suivantes :

f(t) = /G(x) exp(2~jwt) dw

-33

+,”G(w) =

/f(t) cxp-27rjwt) dt (16.6)

Les équations (16.6) sont des equat~ions fonctionnelles.

1.2. Relation entre différentes définitions

Les tables d’intégrales dc Fourier utilisent généralement une uotation plus concise qui ne faitpas usage du facteur 257 :

+CCQ(w) = .i’ f(t) exp(-jwt) dt;

que l’on peut ikrire encore :

Q(w) = 7f(t)cxp (-27~jw;) dt = G (&) .

-30

Remarque : Rien n’empêche de choisir des signes opposes dans les exponeritielles pour definirles transformées directes et réciproques, soit :

f(t) = /C(:i) exp(-2Qwt) dw

-x+Z=

G(w) =s

f(t) exp(2Tjwt) dt.

-00

Il est evident qu’il faut se tenir à un choix pour effectuer les calculs.

2. Conditions d’existence des transformées de Fourierdans les espaces L1 et L*

2.1. Définition

L’cspacc L1 est l’espace fonctionnel des fonctions intégrablcs en module, tandis que l’espace L2est l’cspacc fouctjionnel des fonctions de carre somrnable.

+oO

Si *f(x) appartient à L’ alors l’intégrale/’

If(x)1 dz existe..

-cx+30 +oO

Si f(x) appartient à L2 alors l’intégrales

f"(x) dx (011s

~(CE)~*(X) dz) existe.

252

Page 243: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

Dans ce paragraphe, nous dksirons rappeler les résultats t,héoriqucs essenticls. Il faut bienreconrlaître que l’usage pratique des transform6es dc Fourier passe exceptionnellement par lesconsidérations qui vont suivre, le physicien rencont,rant en gCnkra1 <t de honncs fonctions ». Quoiqu’il en soit,, un survol rapide de la t,hkorie doit, permettre d’éviter quelques pièges que l’on peutrencontrer dans la théorie des fonctions khantillonnées. Le prohkme fondamerkal repose sur lesconditions d’existence de 1’intCgrale dc Fourier qui est l’une des expressions (16.6).

Disons tout, dc suite que la notion d’intbgralc de Riemann ne suffit plus pour l’ttudc detels problèmes, et, que l’on doit lui substituer la notion d’intkgrale au sens de Lebesguc (18751941). Voici pourquoi : lc point essentiel repose sur le fa.it, que la limite d’une suite de fonctionsintégrablrs n’est pas nécessairement une fonction intkgrablc ni au sens de la convcrgencc simpleni au sens de la convergence uniforme. Le lecteur intércss6 trouvera des d&eloppcments et desexemples dans les ouvrages citts en bibliographie : cn particulier, des exemples de fonctionsbornées qui ne sont pas intégrables au sens de Riemann.

2.2. Conclusions

a. L’espace L1 des fonctions sommables au sens de Riemann n’est pas complet puisyw la limited’une suite de fonctions intégrablcs au sens de L1 n’est pas n6cessaircmc~nt une fonctionint,kgrable.

b. Il existe des fonct,ions parfaitement, d&nics qui ne sont pas intégrahles a.11 sens de Riemann.C’est, le cas dc fonction discontinues nc comportant que des discontinuitk de prcmike espèce.

Les rnathérnaticiens ont trouvé une définition plus génkrale dc l’intégrale de Riemann afinque L’ soit toujours ml espace vectoriel, complet au sens de la norme L1. Au fond; il s’agitd’un élargissement de la classe des fonctions intégrables. C’est k Henri Lchesguc (18751941)que revient le merite d’avoir découvert la nouvelle intégrale en 1902. Non seulcmcnt l’espaceL1 devient un espace complet mais aussi L2, ce qui lui confkre un intéret de tout premier planlors dc I’étudc des séries de Fourier et des développements en skies dc fonctions orthogonales.Nous ne parlerons pas davantage de cette intkgrale qui passe par la notion d’intégration dcmesures abstraites. Insistons toutefois sur un point csserkiel : lorsque l’intégrale de Riemann estrkellerncnt calculable, elle donne lc mêrnc résultat que l’intégrale de Lebcsgue.

3. La transformée de Fourier dans l’espace L1

On dit que f(z) appartient à l’espace L’ si, pour la fonction f(z) ü valeurs récllcs ou complexes,on a :

+LX

.I’If(x)1 dz = h (fi fini). (16.7)

Ici, la norrne est celle de la convergence en moyenne.

3.1. Théorème

La transformée de Fourier

+C=

F(t) =.i

f(x) exp(2njTjzt) dz

-CU

253

Page 244: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANTJEL r]E CALCIJL NUMERIQUE APPLIQUÉ

existe si f(,z) appartient à L’.En effet, on a les inégalitbs suivantes :

+CC +Oc

.I’f(z) exp(27rjzt) dz <

.IIf(z)1 dz = .f().

-<xi -00

Donc F(t) existe pour tout t, de plus F(t) est bornée uniforrnhent :

IF(t)1 < I.f(x)I

3.2. Propriétés essentielles dans L1

R.appclons que l’on note :

f (xl r, F(t)

1. La T.F. est linéaire.2. La translation qui consist,e à changer .r en (z - Ir/) donne :

f(x -Y) 3 F ( t ) exp(2rjty). (16.8)

3. La syrnktrie donne :

f(x) exp(-2r,jm) 3 F(t - z). (16.9)

4. La dilatation d’abscisse, si a # 0, donne :

(16.10)

Il faut, bien noter que le cas particulier ~1. = 0 nc prtsentc pas beaucoup d’inthêt. En effet.si 0, = 0, .f(O) est une coristantc et la fonction constante n’appartient pas à L’.

5. Si f(z) appart,ient à L1 et si la fonction XI(:~) appartient, aussi à. L1; alors F(t) admet, I)artoutune dkrivke F’(t) Imrnke qui est la transformée de Fourier de 2~,jzf(z) :

2-irjz.f (z) r_F; F ’ ( t ) .

Si f(x) est dériva& n fois, ct, si f(z) ainsi que sw n, prerniàres dkrivhs a.ppartjicnrirntj àLl ,l, d ors :

ou encore

6. Continuité de la transformée. Si i(z) appartient 5 L1 sa transformhe de Fourier F(t) estuniforrriémcnt continue pour toute va.leur de t.

254

Page 245: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FO~R~ER

7. La réciprocité dc la transformée de Fourier pose un problème dklicat. En effet, l’intkgrale(16.7) est prise au sens de Lehesgue, et sa valeur n’est pas modifiée quand on change lesvaleurs de f sur un enscmhle dr mesure nulle.

8. Si f et F appartiennent ensemble à L1, alors nous avons 1’Cgalité dc Parseval (1755 -1836) :

+^c>

/’ I~(:I$ c1.r = i,F(t),’ d t . (16.11)

-oc; -Ix

Il faut alors des propriktts dc continuitk pour dCterminer .f( )II” en t,out point, a partir deF(t). Du point de vue du physicien: l’Égalité de Parseval nc fait que traduire lc principe deconservation de l’bnergie.

3.3. Exemples de fonctions transformées de Fourier l’une dans l’autre

f(x) &fi F ( t )

exp( -7r.2.‘) 4=-G exp( 4”)

exp(-27474) fi1

7r(l + t”)

1 = 1 si z appartient à (-1/2, +1/2)

f(x) 7’6 ski(&)ts-7r-t

= 0 ailleurs

(= 1 si Ic appartiern à (a, b)

f (xl

I = 0 ailleurs

23 sin[&(h ~ u)]iTt cxp[j7rt@ ~ u)]

Dans ces deux derniers cas, F(t) n’appartient pas à L1, cependant la transformée dc Fourierinverse existe si l’on prend la valeur principale au sens dr Cauchy.

I = 1 - ]n*l s i .r appartjicnt a ( - 1 , +l)

P(z) 25ski(&) ’

( >7rtI= 0 ailleurs

4. Les transformées de Fourier dans l’espace L*

On dit, que .f (2;) à valeurs rklles ou complexes a.pparticnt à L2 si l’on a :

+CC

f”(:x) dz = if]‘,./’

(16.12)

c’est-a-dire que l’intégrale existe.

255

Page 246: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M,~NuEL DE CALCUL NTJMÉRIQUE APPLIQUÉ

Propriétés fondamentales

Si f(z) appartient à L2, on peut dknontrer que F(t) appartient aussi à L2 et que nous conservonsl’égalit6 de Parscval :

+CC +Oc

J’,f”(Lc) an: =

.I’F2(t) dt.

-30 -31:

Ch démonstrations reposent sur les propriétés des suites de Cauchy. Les autres propriétésrencontrées dans l’espace L’ restent vraies dans l’espace L2 à savoir : la linéarité, la translation.la dilat,atlion d’abscisse.

5. Produit de convolution dans les espaces L1 ou L2

C’est un problème qui joue un rôle important cn physique ct en traitement du signal. Notarn-ment. toutes les mesures expérimentales sont les rRsultats du produit dc convolution du signalfondamental et dc la fonction d’appareil. Par exemple, en spectroscopie, l’ohscrvation d’une raieest le produit de convolution du profil donné par la source lumineuse ct de la fonction d’appareilqui a permis l’observation. Si l’on utilise im spectromètre à fentes, en prcmièrr approximation.la fonction d’appareil est constiti& de la «fonction fente >> (triangle isocCle).

5.1. Définition

On appelle produit de convolution de deux fonctions f(z) et 9( )z une fonction h,(z) définie parl’int6grale :

+X2

.!*h(z) = f(?/)dlr: ~ Y) dz/ (16.13)

qui est notée d’une faLon plus concise : h = f * g.

Remarque : Le produit de convolution est commutatif, c’est-à-dire que h = f *g = g * f. Il fautrespecter certaines conditions pour que cette intkgrale existe. L’existence est, assurée notammentquand p et g appart,iennent à L1 ou L’.

Supposons qur les fonctions f(z) et G(t) appartiennent, à L’, dc telle sorte que :

+33

F(t) = / f(x) cxp(j27rzt) d z

e t

.9(z) =./’

G(t) exp( -j27rzt) dt.

256

Page 247: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMJhS DE: FOU~~I~~

Alors, g(z) est bornée et l’intégrale définissant le produit de convolution cxistc. Rcmplac;onsg(z) par sa transformée de Fourier dans 1’intAgralc (16.13) :

En inversant l’ordre des intkgrations, on obtient :

+CC +LX

.h(x) =.I

G(t) exp(-2jKtz)s

f(w) exd2Wy) h dt-430 pc.2

ct par suitje :

+CEh(x) = J G(t)F(t) exp-2jdx) dt,

h(x) ét,ant une fonction bornée et la fonction [G(t) . F(t)] appartenant & L1, il s’ensuit que h(z)est la transformkc dc Fourier dc G(t) F(t).

La démonstration est encore plus simple si f(x) et G(t) appartiennent à L2 ; cn effet, on saitque les transform~cs de Fourier g(z) ct F(t) appartiennent % L2. Il s’ensuit que la transformte deFourier transforme un produit de convolution en un produit simple de transform@es de Fourier.On résumera les opérations ainsi :

f(x) 3 F(t)

g(x) yl-i G ( t )

f *9 3 F. G

f.g 111-; F + G

5.2. Remarque sur le sens de la transformée de Fourier

Du point de vue de la physique, la connaissance de la fonction f(x) est stricteruent équivalenteà la connaissance de la fonction F(t) ; l’une et l’autre fonctions conticnncnt exactcmcnt la mêmeinformation. Par ailleurs, 1’Cgaliti: dc Parseval n’est rien d’autre que l’expression du principe deconservation dc l’hcrgic.

5.3. Sur la symétrie et la parité des fonctions

Si la fonction f(x) possede certaines propriétés de symétrie il en va de même de sa transforrnéedc Fourier F(t). Le tableau 16.1, page suivante donne les principales correspondances.

5.4. Transformées de Fourier et produit scalaire

Lc produit scalaire de deux fonctions p(x) et g(x) est défini par l’intégrale du produit des deuxfonctions :

(f(x),g(x)) = /i(x)g(x) dn: (= /f(x)g*(x) d2 si les fonctions sont complcxcs).

-!x. -cIcI

2 5 7

Page 248: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL LIE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau 16.1.

f (xlréelle paire

réelle impaire

imaginaire paire

imaginaire impair2

complexe paire

complexe impaire

réelle quelconque

imaginaire quelconque

partie réelle paire ;

partie imaginaire impairepartie réelle impair-c ;

partie imaginaire paire

F(t)rklle paire

imaginaire impaire

imaginaire paire

réelle impaire

complexe pair-c

complexe impaire

par-tic reclle paire ;par-tic imaginaire impaire

partie imaginaire paire ;partie recllc impaire

rkllc quelconque

imaginaire quelconque

Si f(x) et y(x) appartiennent à L2, ces fonctions admettent chacune une transformée deFourier désignée respcctivernent par F(u) et G(u). C omme nous avons l’cgalité de Parseval :

/’ f(x)f*(z) dz = / F(t)F*(t) tlt,-00 -00

IlOuS allons en déduire quelques propri+% sur le produit scalaire des fonctiorls appartenant àL2. La linearité de l’opération d’intégration nous permet d’ecrire :

+CO

/- [f(x) +y(~)] [f*(x) + g*(z)] dz = r,F(,, + G(t)] [F*(t) + G*(t)] dt,-00 -00

et

+CC

I’ [f(x) + jg(x)] [f*(x) ~ jg*(x)] dz = J,F(t) + jG(t)] [F*(t) - jG*(t)] dt.--m -cc

La combinaison de ces deux relations jointe a l’egalitt: de Parseval IIOUS dorme :

+CC

/’ f(x)g*(x) dx = /P(i)(:‘(t) dt.

-00 -x

258

Page 249: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

L’exploitation dc cette dernière égalité 6x1 liaison avec la convolution donrw également uneexpression intéressante concernant une forme de produit scahire :

(.f(x; - u),g*(x)) = Tf(x ~ su)g*(x) dz = ~r(t)G*(t)exp(2Tjtu) dt,

-00 -cc

d’aprh le théorème de translation sur l’axe des abscisses. Par ailleurs, iious ~VOI~S les relations :tm

.i’f(-x) exp(2njtx) dx = F(-t)

+a

J’f(-.x + u) exp(2rjtx) dz = F(-t) exp(2njtu),

-cc

il s’ensuit :

(f(-x + u),g*(x)) = /i(x ~ u)g*(x) dx = /i’(-t)G*(t) exp(2xjtu) dt.

pc.2 -cia

En rappelant que :

+CC +m *

sg*(x) exp(2Tjtx) dz =

[./

g(x) exp(-2rjtz) dz

-00 -cc I

= G*(-t),

et, eu remplac;ant g*(x) par g(x) on change G*(t) en G(-t), on peut, krirc :

(f-x + u), g(x)) = /i(x - u)g(x) dz = /‘ii)G(-t) exp(2;rjtu) dt.

Maintenant, remplac;orls t par -t dans la dernière @alité, nous ohtcnons :

(f(u ~ x), g(x)) = lmf(x - u)g(x) dz = /R’(t)C(i) exp(-2njtu) dt

-00 -00

soit , encore :

(f(u - x), g(x)) = /F(t)G(t) exp(-2rjtu) dt.

-(w

Si l’on fait IL = 0, on obtient l’cxprcssion :

U-x), g(x)) = (F(t), G(t)).

Comme f(z), g(x) d‘une part, F(t), G(t) d’autre part jouent des rôles syrrktriqucs, compte~IN de la réciprocité des transformations de Fourier, on a les autres relations :

(f(x)> g(-2)) = P’(t), G(t))>

(f(x)> s(x)) = P-t), G(t)),

(f(:~), g(x)) = (F(t), G(W)).

259

Page 250: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQCJE APPLIQUÉ

Certaines de ces relations sont utilisees dans les paragraphes kvoquant, l’approximation dcfonctions de L’ au moyen des fonctions du cylindre parabolique. fonctions rattachées auxpolynômes d’Hermitc (cf. Chapitre 10).

6. Sur le calcul numérique des transformées de Fourier

Il existe quelques fonctions dont on connaît la transfornkc de Fourier, lesquelles ont kt,krkmies dans des tables. Malhcllrel~senlent, les équations fonctionnelles (16.6) n’admettent pastolljours des expressions littérales de transcendances élémentaires. Un autre prohlèmc SC poselorsque l’on a affaire à des données expérimentales composées d’échantillons ~ lc plus souventdistribués selon une progression arithmétique. En apparence il sufit dc calculer nurnkiquementles intégrales (16.6). mais l’expérience montre que les temps de calcul sont prohibitifs et qu’il fauttrouver des algorithmes cxtrknernent élaborés pour parvenir à des temps de calcul raisonnables.Nous allons donc examiner le problème sous cet aspect en accordant notre attention aux fonctionskhantillonnées.

7. Cas des fonctions échantillonnées

Puisqu’il s’agit esscnticllcment d’un point de vue pratique, il faut préciser que les fonctions f(z)ne peuvent être connues que sur un intervalle fini (-a/2, +u/2). Ceci est dû aux impérkfsde naturc physique et humaine : le temps d’observation est limité et, la densité d’informationrecueillie pouvant ntre manipulée est finie. Par ailleurs, on supposera que la fonction f(z) est,donnée par un ensemble d’échantillons qui sont pris CII progression arithmétique, soit (2n+l) leurnombre ct l’on notera (zk, o/k) les couples de points représentant la fonction. D’arcs ct dkjà% onest en mesure de dire qu’il n’y aura aucune différence entre une transform@e de Fourier calculéenurrkriqucmcnt et la skie de Fourier. En effet nous avons procédé à l’extension de l’intervalledc définition des fonctions périodiques pour parvenir & l’étude des transformks dc Fourier, maismaintenant nous ne sommes cn mesure que de traiter numériquement les fonctions définies surun inkrvalle fini... Il va de soi que les algorithmes que nous allons décrire pcrmcttront dc calculerles co&icients des développements cn skie de Fourier. Avant d’cntrcprcndre à proprementparler l’ktude des algorithmes fondamentaux, il nous faut rappclcr les propriktés essentiellesdes fonctions échantillonnées et dc leur tra,nsformée de Fourier.

a. Lc pas d’khantillormage est h = a/(2n) et la période de la fonction f(z) est a, alors: dansl’espace réciproque, la période de la transformke de Fourier F(t) est T = [-1/(2h), +1/(2h)let son pas d’échantillonnage est T = l/u.

b. Le calcul des khantillons de la transformée de Fourier F(t) se fait, selon 1me progressionarithmétique de raison T. On calcule donc ~TL points dans l’espace réciproque.

On démontre qu’aucune information n’est perdue en opérant de cette sorte. 2n points enprogression arithmétique sont nécessaires et, suffisants. Le fait de prendre davantage de pointsn’apportera rien en prkision et cela ne fera qu‘accroître le temps dc calcul. En revanche, ilexiste un probkmc beaucoup plus délicat qui est celui de déterminer convenablement la périoded’échant,illonnage h. Nous reviendrons cn détail sur ces problèmes.

260

Page 251: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

8. Calcul par un algorithme ordinaire

Il s’agit ici de calculer les intégrales (16.6) au moyen de la méthode des reckanglcs ; la raison enest la suivante : comme les fonctions sont, pkriodiques, il est indispensable d’affecter & chaquepoint d’échantillonnage le rnêrne poids pour obtenir le même résultat quel que soit le point choisipour définir le début d’urlc pkriodc. On approche F(t) au moyen dc l’expression suivante :

71-lF(t) = h c f(W) exp(27r-jkht). (16.14)

k-71

Dans le cas où f(z) est une fonction rkelle, nous pouvons kcrire :

71 - 1 71-l

F(t) = h c f(M) cos(27rkht) + jh c f(M) sin(2z7kht).

Il est plus commode de poser :

rq = f(qh) + f(-&)s q = f(qh) - f(-qh) avec q=O:1,2 ,..., n,-1

e t T, = f ( - n h )

S 1L = - f ( - n h ) .

Cette façon de procéder rcvicnt à décomposer une fonction en une somme de deux fonctions,l’une paire et l’autre impaire ; en posant F(t) = FR(~) + jP~(t): cela nous permet d’écrire :

FR(t) = h 2 rk cos(27rkht)

FJ(t) = h c Sk sin(2xkht). (16.15)k=l

Remarque : Nous avons dkjà dit que les relations (16.15) ktaicnt simples à calculer mais qu’cllcsexigeaient un temps de calcul considérable. Cependant, il y a moyen de diviser le temps de calculpar trois environ en effectuant la remarque suivante : L’argument dc base des sinus et cosinus est :0,) = 27rht, ce qui fait que les argurnents des sinus et cosinus sont en progression arithmktiquede raison 00. Cornrne l’appel des fonctions de bibliothCque SIN et COS dcmandc 1111 tempsimportant, il est beaucoup plus astucieux de calculer ces fonctions au moyen des relations derkurrence du type :

COS[@ + I)@l] = 2 COS(@)) cos(p@~) - cos[(p - l)O”]

sin[(p + l)&] = 2 COS(@~) sin(pO0) - sin[(p - 1)00]. (16.16)

Les relations (16.16) ne sont pas uniques, et l’on peut trouver des relations de récurrence toutà fait analogues. Quoi qu’il en soit, il suffit de calculer au depart seulernent Ao = cos(00) et13” = sin(&) puis d’utiliser les formules de récurrence :

261

Page 252: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Quelles que soient les formules de récurrence utilisées, elles mettent en ouvre toujours unesoustraction, et l’on va observer une lente dégradation de la precision des valeurs calculees pourles sinus et cosinus. C’est pourquoi il est utile de les calibrer de temps en temps: c’est-à-dired’utiliser les fonctions dc bibliothèque tous les 1024 points par exemple et de calculer les pointsintermédiaires au moyen des relations de récurrence.

La transformée de Fourier réciproque ne présente pas plus de difficulté à calculer, on écrirasirnplement :

f(x) = T C F(lh) exp(-2nj2ht).1=-n

(16.17)

D’une faCon genérale, dans les relations (16.15) et (16.17), les fonctions f(z) et F(t) sont desfonctions complexes de variables réelles respectivement zr et t.

9. L’algorithme de Cooley-Tukey (1915- )

Il s’agit d’un algorithme que l’on désigne souvent sous le nom de FFT (fast Fourier transform).

9.1. La transformée de Fourier discrète

Il suffit de reprendre les formules (16.15) et (16.17) e n p récisant que les points qui doivent êtrecalculés sont ceux qui sont en progression arithmétique de raison T ou dc raison h selon l’espaceque l’on considère. Donc, si l’on fait a: = mr, on obtient :

F(mr) = h c f(kh) exp(2njkhmr) ;

mais comme T = 1/(2nh) il est plus commode d’écrire :

F(mr) = h C f(kh,)expk=-n

Réciproquement, on a la transformée inverse :

f(kh) = T c F(qh) expq=-n

(16.18)

(16.19)

Par ailleurs, si la fonction f(z) est périodique de période a, on aura les égalités suivantes :

F(mr) = h c f(kh)expk=-n+pl

f (kh) = T ny F(qh) exp (-2~.jg) . (16.21)q=-n+p2

(16.20)

quels que soient les entiers pi et pz. On s’aperçoit que le calcul des transformées de Fourierfait appel à des valeurs numériques qui sont strictement liées à la nature de l’échantillonnage.

262

Page 253: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

Comme cela est sans intérêt, on préfère travailler sur une transformée de Fourier normalisée,c’est-à-dire que l’on va effectuer une transformation linéaire des abscisses de tcllc sorte quel’intervalle arbitraire (-a/2, +a/2) soit transformé en un intervalle dc longueur unité: soitl’intervalle (-1/2, +1/2). Il faudra se souvenir de cette opération lorsque l’on désirera effectuerune interpolation dans les transformées de Fourier.

9.2. Normalisation de la transformée de Fourier

Pour obtenir la normalisation, il suffit donc de poser :

n = 2nh = 1, N = 2n, et pi = p2 = 0.

Il s’ensuit que :

h = l/N, T = 1: T = N = l/h.

Rappelons que T est la période de la transformée F(t). Puisqu’on ne calcule qu’un nombrefini de points de la transformée, il est plus commode d’écrire en indice lc numcro du pointc’est-à-dire que l’on notera désormais : F(mr) = F,,, et f(kh>) = fi;

Comme dans le cas du calcul des fonctions trigonomctriqucs, II~IE poserons : WN =exp(2nj/N). Par ce procédé, les transformées de Fourier discrctes normalisées s’tcrivent sin-plement :

(16.22)

Il faut bien reconnaître que, jusqu’à présent, nous n’avons pas amélioré la technique de calcul,et nous avons toujours besoin de N operations complexes pour mener à bien les calculs.

Maintenant, nous allons étudier un algorithme qui rend le temps de calcul non plus propor-tionnel à N2 rnais à N log, (N). P our des raisons qui deviendront évidentes par la suite, onchoisira un nombre N de données qui est une puissance de deux, et l’on posera N = 2’“.

9.3. Calcul de la transformée de Fourier au moyen de la technique de partage

Théorème - La transformée de Fourier d’une fonction quelconque cormue en N points est unecombinaison linéaire d’une transformée de Fourier de deux fonctions issues de la première et necomportant que N/2 points chacune.

Pour démontrer cette proposition, nous allons décomposer la fonction f(z) en deux fonctions,l’une constituée des indices irnpairs fzk+i et l’autre des indices pairs fzk. Il est bien entendu quel’on conserve l’ordre des échantillons dans la fonction f (cc).

On designe par u la fonction constituée par les échantillons d’indice pair et par v la fonctionconstituée par les échantillons d’indice impair, chacune de ces fonctions comprenant N/2 points.Les transformées de Fourier respectives de u et ‘v sont désignées par U et V; on obtient leurs

263

Page 254: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

expressions cn utilisant les relations (16.22) :

Si à prkcnt nous revenons à l’expression de F dans laquelle IIOIIS séparons les particsconstituées par les indices pairs et les indices impairs, nous pouvons écrire :

N/2-1 N/a-1

NFk z c QV$" + c ujT/liN"+-l)k'.

,y=0 ")=Cl

Il n’y a plus qu’à substituer les expressions de U et V, ce qui donne :

2Fk = U, + VjW;. (16.23)

Cette expression ne permet de calculer que la moiti6 de la transforrnée de Fourier, et il fautune autre relation pour obtenir l’autre moitie. Polir cela, il suffit de remarquer que les fonctionsU et V sont pkriodiques de @iode N/2, par conséquent 11011s po~lvons dire que :

Comme par ailleurs nous avons :

Wk+N/2N

nous obtenons la relation (16.24) :

~FA+N/~ = uk- - vjw;. (16.24)

À présent on comprend l’int6rCt d’avoir choisi pour N une puissance dc deux, puisqu’il va desoi que l’on va calculer chacune des transformées U et V par le même procédé.

9.4. Mise en œuvre de l’algorithme

Il y a plusieurs réalisations pratiques possibles pour utiliser cet, algorithme.

a. Si l’on dispose d’un langage récursif, c’est le cas du Pascal, du C, du PLl... ~ ct dans lamesure où lc temps de calcul n’est pas prohibitif il n‘y awra pas dc difficultks particulièrespour réaliser un programme car le tri des données initiales se fera par appel récursif.

b. Si l’on nc dispose pas d’un langage récursif c’ktait le cas du FORTRAN ct du BASIC ~il est indispensable de procéder à, un tri prkalable des données initiales afin de commencerles calculs de transforrnées par les fonctions contenant deux ~lkncnts, puis cn poursuivantpar les fonctions à quatre ékmentsT puis à huit, seize... Donc le problème qui se pose estcelui de la disposition convcnablc des khantillons au départ, lesquels ont été pris dans l’ordreséquentiel. Autrernent dit, il s’agit de savoir à quelle place (indice) il convient de mettre ladonnk d’indice k. Il y a deux rnéthodes usuelles qui permettent dc rkaliscr Ckgamment cettetâche à savoir le tri direct et le tri par inversion de bit.

264

Page 255: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE E'~URIER

a - Le tri direct - Dans l’ordre séquentiel on considère la donnée d’indicc k, ccttc donnée seraplacée a l’indice j : nous allons donner la correspondance entre k et j CII faisant l’hypothèse quele premier indice est zéro ct le dernier N ~ 1. Désignons par 4 l’exposant de deux qui permetd’encadrer le nombre k dc tcllc sorte que :

alors nous obt,iendrons la valeur de j au moyen de la rela.tion de récurrence suivante :

j = RN(k) = &(AI - 2(j) + &

et l’on prendra au dkpart : RN(O) = 0.Ccttc méthode s’applique pour k = 0, 1,2; 3.. . , N ~ 1. La manière dc l’exploiter sur un

cnscrrlblc de huit donntes numérotées de un à huit est presentee dans le tableau 16.2.

Indices initiaux

01234567

Tableau 16.2.-.. -~ ~~~

Indices finals

q = 0 I&(O) = 0 0q=o Rs(1) = R,(O) + 8/2 4q=l Rg(2) = I&(O) + 8/4 2q = l h(3) = Rs(1) + 8/4 6q=2 h(4) = l&(O) + 8/8 1q=2 h(5) = R*(l) + 8/8 5q=2 &(6) = I&(2) + 8/8 3q=2 Rx(7) = I&(3) + 8/8 7

b - Tri par inversion de bit - Pour des raisons de simplicitk, on considère encore que lesindices commencent a la valeur zero et se tJermincnt donc a la valeur N - 1. Il faut doncrn = log, (N) bits p our exprimer tous les indices de la fonction échantillonnitc dans le systèmebinaire. Pour obtenir l’indice j, il suffit d’intervertir l’ordre des chiffres binaires representant lenombre k avec m bits et l’on obtient ainsi la représentation binaire du nombre j.

9.5. Exemple

Nous avons huit données numérotées de zkro à sept et nous obt,enons UIE représentation binairesur trois bits. La façon d’opérer est schématisée sur lc tableau 16.3, page suivante.

9.6. Remarques générales

1. Certaines donnees conservent le même indice.2. Il est simple de passer d’une numérotation à l’autre selon que la première dom& à la valeur

xero ou la valeur un, et il suffira de retrancher ou d’ajouter une unité pour exploiter à notreconvenance l’un des deux algorithmes que nous venons de présenter.

265

Page 256: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau 16.3.

Indices initiauxDécimal Binaire

0 0 0 01 0012 0103 0114 100

5 1 0 16 1107 1 1 1

Indices finalsBinaire Décimal

000 0100 4010 2

110 6001 1

101 5011 3

111 7

10. Programmes de calcul des transformées de Fourier

On trouvera sur le Web(*) 1 es sous-programmes df ft0. h ct df f tinv0. h pour calculer lestransformées de Fourier. Nous avons retenu une méthode non récursive agrémentée d’unalgorithme de tri direct des données. Ces programmes nécessitent quelques commentaires.

1. Lors du calcul de la transformée directe, le calcul successif des transformée au moyen desrelations (16.23) et (16.24) irnpose la division des résultats par N. Cette opération a étérkalisée au cours du tri et non pas après les calculs (les opérations sont linéaires).

2. Comme le rnontrent les relations (16.22): il ne faut pas diviser les données par N lorsque l’oncalcule la transformation réciproque.

3. Il est très facile de se retrouver en présence d’un fâcheux décalage de T lors du calculdes transformk dc Fourier. Généralement ceci est dû au fait que les donnkes ont été malnumérotées au départ : il faut que le premier échantillon se trouve à l’origine. La plupart,des programmes exigent cette façon de procéder. Nous ne l’avons pas retenue pour la raisonsuivante : lorsque l’on traite des données échantillonnées au cours du t,emps: la premièredonnée qui se présente correspond à l’abscisse normalisée -1/2 et non pas zéro. Dans ce casil ne semble pas habile d’attendre d’être en possession de toutes les données pour effectuerle décalage d’abscisse avant d’entreprendre lc calcul effectif de la transformée de Fourier.C’est pour cela que la transforrnée de Fourier directe que nous proposons tient compte de cedécalage. Par conséquent, si l’on utilise ce prograrnme avec des données numérotées à partirde l’origine, on SC trouvera également en présence d’un déphasage de T. Il convient alors denoter que le module de la transformée de Fourier est correct.

4. Quelle que soit la manière retenue, les résultats de la transformée de Fourier directe sontdonnés à partir de l’origine. Autrernent dit, dans l’espace réciproque; le premier point calculéest celui correspondant à l’origine, et l’on aura les points suivants jusqu’à la demi-période1/(2h) ensuite viendront les points de la demi-période -1/(2h) jusqu’à zéro non compris.

5. C’est pour les raisons expliqués au cours du paragraphe préckdcnt que la transformée deFourier réciproque effectue les calculs à partir de l’échanti!lon correspondant à l’origine.

*http://www.edpsciences.com/guilpin/

266

Page 257: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

Espace direct Espace réciproque

~ 42 0 + cl/2 2 - T/2 0 +T/2 ”

Figure 16.1. Avech, = a,lN r = l/a,h = 1/T T = l/h,a = l/r N = TII-.

6. Lors de la mise au point d’un programme de transformkes de Fourier, il est raisonnable deréaliser simultanément la transformée directe ct la transformée réciproque qui n’admettentque peu de différences. Ainsi, après avoir obtenu la transformée directe, on revient dansl’espace initial au moyen de la transformée rkiproque... et l’on doit retrouver les donnéesinitiales (à partir de l’échantillon correspondant à l’origine). Cela constitue 1111 bon test demise au point. Par ailleurs, ce procédk permet d’apprécier de façon tangible les erreurs quiviennent altérer les résultats, car on observera de toute façon des divergences par rapport auxdonnées initiales, divergences qu’il est souhaitable dc trouver de quelques ordres de grandeurde l’erreur de troncature affectant les nombres traités en rnachinc. Cependant, il convient, dcse souvenir que le calcul rapide des fonctions trigonomét,riques intervenant dans les calculssont des sources d’incertitude qu’il ne faut pas négliger.

11. Un problème fondamental : quelle doit être la périoded’échantillonnage de la fonction f(x) ?

Rappelons que la taille de la période d’échantillonnage h de la fonction f(z) va dtterrniner lat,aillc du domaine de représentation de la transformée de Fourier F(t) dans l’espace réciproque.Ajoutons que la taille du domaine de définition de f(z) déterminera la taille dc la fréquenced’échantillonnage r dans l’espace réciproque. Au fond, chaque fois que l’on trait,e de transforméesde Fourier, il est indispensable d’avoir présent à l’esprit la figure 16.1.

La déterrnination dt la période d’échantillonnage h, pour une expérience donnée, n’est pasun problème banal : il n’est pas question d’effectuer url échantillonnage de n’importe quellefaçon quand bien même ne serions-nous pas intkressés par la partie dc la transformée de Fourierau-delà d’une certaine valeur de l’abscisse fh~.

Il y a deux façons de procéder avec une fonction f(t), laquelle a fait l’objet d’un enregistrementcontinu, afin d’obtenir une bonne période d’échantillonnage dans l’espace direct.

11.1. Détermination expérimentale de ho

On effectue un échantillonnage à la période h puis on calcule la transforrnée de Fourier F(w).Pour que F(w) appartienne à L1 ou L2, il est nécessaire qu’au moins elle soit, nulle à l’infini,c’est-à-dire au bord du domaine (-0,5, +O, 5). (Elle peut évidemment devenir nulle avant lebord...)

Si tel n’est pas le cas, on rnodifie le pas d’échantillonnage h pour s’assurer de la nullité dela fonct,ion F(w) au-delà de lwOI. Bien entendu, on a tout intérêt à cc que l’annulation, dansl’espace normalisé, s’effectue au bord du dornainc (-0,5, +O, 5) et non It l’intérieur pour labonne raison qu’il est, inutile dc rkaliser des calculs qui n’apprennent rien sur la TF. Dans ces

267

Page 258: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

i!!fANLJEL DE CALCLJL NUMÉRIQUE APPLIQUÉ

conditions, OII deduit que l’étendue de l’cspscc réciproque est, (-wo: +w~) soit 2~0 ct que lafréquence d’échantillonnage est :

2wrl7”() = -:

N

il s’ensuit que la <~bonnc pcriode » d’échantillonnage ho est donni:e par l’expression :

h>U = &0

c’est la période d’echantillonnage dc Shannon (1916 ). Autrement dit j il faut, cchantillonner àune fréquence au moins deux fois plus grande que la plus grande fréquence apparaissant dansle signal à traiter pour ne rien perdre de l’information contenuc dans le signal. Quand cettecondition est remplie, Shannon a montre que l’on pouvait elfectuer une interpolation rigoureuseG(w) dans l’espace réciproque de la fonction F(w) au moyen de la relation :

Démonstration - On isole une période n de la fonction f(t) dc l’espace direct cn la multipliantpar une «fonction porte » r(t) :

g ( t ) = f(t) r(t).

La transformée de Fourier de g(t) notée G(w) est continue, périodique et, definie numérique-ment pour les valeurs w = Icra :

G(w) = F(w) * R(w) (produit dc convolution),

où R(w) est la transformée de Fourier de la fonction porte; soit :

sin( 27rTw)

de là, I~OIIS tirons :

R(w) = 2$Jlw ;

11.2. On impose ho

Dans cc cas, il est indispensable de procéder au filtrage du signal avant de 1’~c:hantillorlner et ilne devra pas comporter de frcquences supericurcs à :

1

W”=2ho’

sous peine de voir apparaître dans le spectre des «battements » avec la fréquence d’échantillon-nage. C’est réellement cc problèrne qui est traité dans la réalisation d’un disque numerique. Lafréquence d’échant,illonnage est fixée aux environs dc 45 kHz. Il s’ensuit que le signal ne doit pascomporter de fréquences superieures à 22,5 kHz ou tout au plus ces frcqucnces, si elles existent.auront une amplitude très attémicc ~ au moins 20 dB par octave.

268

Page 259: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE F~URIE~<

Si tel n’est pas le cas, supposons alors qu’il existe, par cxcmple, dans lc signal urle fr6qwncede 30 kHz. Nous verrons, ou plutôt entendrons, une frsquenct rbultant du battemrnt decette fréquence avec la fréquence d’échantillonnage, c’est-à-dire 15 kHz. On comprrnd trèsbien que toutes les frkquences comprises entre 22,5 ct 45 kHz vont battre avec la fr6quenced’échantillonnage et recouvrir le spectre qui a été obtenu entre 0 et 22.5 kHz. C’est ce quecertains auteurs appcllcnt le « repliemcnt du spectre ».

011 comprend tout le danger qu’il y a à effectuer un échant,illonnage sans connaître la plusgrande fréquence composant le signal et qui soit non n&&yahle en amplitude.

12. La distribution de Dirac (1902-1984)La distribution de Dirac joue un rôle intbressant dans l’étude des transformi-rs de Fourier, etl’on consultera avec intérêt l’ouvrage d’Arsac sur les t,ransforrnées dc Fourier des distributionst,cmpérkes.

12.1. Définition

On considare la suite de fonctions :

= 0 si n: < 0 et, :r > 1fil (X;l 1

71

=n s i O<:r:<-.n

La distribution de Dirac, notée 6(z), est la limite de flZ,(~) lorsque n tend vers l’infini. 6(x) est,encore appclke impulsion unité car sa surface est @ale 2 1 (cornmc toutes les fonctions f,!(X)par construction). L’intégrale dc la fonction de Dira(: est notée Y(t) :

Y(t) =.i

S(z) dz,

-00

clic vaut 1 si t > 0 ct 0 si t < 0. Elle s’appelle fonction de Heavisidc (1850~ 1925) ou 6chclonunité.

12.2. Quelques propriétés

a-

+X.f(x)S(x) dz = f(0)

6 - Dc nGme, si a < 0 ct b > 0, on peut écrire :

b

Jf(x)S(x) dz = f(0).

car S(Z) est nulle partout sauf cn z = 0.R.éciproquement, la dbrivée de la fonction de Heaviside est, la fonction de Dira(:.Y(t) est encore appelée la fonction échelon unité.

269

Page 260: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - Théorème - Dans l’algèbre de convolution, 6(z) joue le rôle d’élément unit6 :

T*f = f

Par exemple,

+Oc +CC

sf(x - t)?i(t - u) dt =

.If(t)S<y(x ~ t) dt = f(z - a)

S,(z) étant la fonction 6(z) qui a subi la translat,ion a.

d - Transformée de Fourier de 6(x) et propriétés connexes

1. La transformée de Fourier de la fonction f(z) = 1 est la fonction de Dirac.

+CC

s1 exp(2njvt) dt = 6(y)

-00

2. Rkciproquement :

+CCJ’ d(v) exp(-2Kjvt) dv = 1.

Remarque : Considérons la fonction id(t) à qui l’on fait subir deux translations symétriques+a :

is(t-u) a1z exp(-2Tjav)

ib(t + u) 25 a exp(2Tjnv)

En additionnant membre à membre, on obtient :

; [s(t + u) + s(t - u)] z5 cos(2nuv)

Si f(t) fi F(v),

alors :

+CXI d(t)f(t) exp(-2rjvt) dt = F(0)

e tJ’

6(t - u)f(t) exp(-2njvt) dt = F(n,)

270

Page 261: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

16. LES TRANSFORMÉES DE FOURIER

12.3. La fonction « peigne B de Dirac encore appelée sha(t)

On peut montrer que la fonction (distribution) Cr=-, s(t - k), avec k entier est sa propretransformée de Fourier. On en dkduit ensuite la formule de Poisson :

laquelle permet d’écrire :

2 d(t - k) = F exp(-2Tjtn).k=-cc 77=-03

La fonction sha(t) permet de représenter la fonction d’échantillonnage d’une fonction quelconqueà la fréquence F, (ou à la période T,) :

sha(t) = T,: 2 d(t - kF,:).

Soit f(t) la fonction que l’on désire échantillonner dont la forme échantillonnée s’appelle Q(t)et dont la transformée de Fourier est F(v) :

Q ( t ) = T, 2 f(kT,)G(t - kT,) = f(t)Te F b(t ~ kT,).k=-x k=-oo

La formule de Poisson permet d’écrire :

Q ( t ) = F(v) * E S(u - nF,).TX=-00

13. Transformées de Fourier multidimensionnelles

Il n’y a pas de difficultés à traiter des transformées de Fourier à plusieurs dimensions, car lesgrands principes que nous avons évoqués à propos des transformées de Fourier à une dimensiondemeurent. Nous allons nous intéresser aux transformées à deux dimensions dont l’intérêt évidentconcerne le traitement des images, quoique d’autres applications soient également bien utiles.

Dans un espace cartésien à deux dimensions, la transformée directe s’écrit :

f(u, 71) = 71 G(z, y) exp [2-irj(w + ~y)] dn: dy

ainsi que la transformée réciproque sous réserve de son existence :

+CC

G(~,Y) =/II

f(u, II) exp [-~T~(ZU + ~y)] du dv.

-cc

271

Page 262: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Il est possible encore d’Ccrire :

Dans la pratique: le domaine D d’int@ration est, fini et rectangulaire dans un espace c:artt%ien.Il s’ensuit que l’on pourra ut,iliser l’algorithme dc Cooley-Tukey cn effectuant un maillage dudomaine D qui comporte 2” points sur l’axe des 5 et 21r’ points sur l’axe des y.

Ainsi on calculera toutes les transformkcs de Fourier ligne & ligne suivies dc toutes lest,ransformées effectuées colonne à colonne. Cela nécessite un arnenagement dc la t,ransforméede Fourier à une dimension en cc sens que les adresses des éltments a.insi que la t&le descosinus II~ sont à calculer yu’une seule fois pour chacune des deux dimensions.

Sur lc Web (*) , on trouvera le sous-progra.nnne df f t2 . h cpi r6alise la t,ransformée dc Fourierdire& à deux dimensions. La transformCc réciproqnc dfftinv2. c est obtr:nur en modifiant, ceprogramme dc la fapn suivante : on supprime la normalisation, puis on cha.ngr converiablemcntles signes exac’tcmerit de la même manière que C:C qui a étC: fait & propos des transform&s à imcdimension.

14. Éléments de bibliographie

J. ARSAC (1961) Trunsformntion dr Fourier et th,éorie des distributions, Éditions Dunod.J. BASS (1971) Cours de rnuthémat~gurs, Tome III, Éditions Masson.0. BRIGIIAM (1988) Tht: fast Fo717+r transform an,d its upplications, Prcmtice Hall.H. DELOUIS (1973) Exploitation des spectres obtenus par‘ transformation dc Fo~urier. Thèse de

Doctowt d’Etat, Paris.H. LEBESGUE (1903) Leçons SALT 1 ‘intégration et la rcchwrche des fonctions prirrtitiws. Gauthier-

Villars, réédité aux Éditions Jacques Gabay.L. SCHWARTZ (1965) Méthodes mathérnutaques pour les sciences ph~ys~ques, Hermann.

*http://www.edpsciences.com/guilpin/

272

Page 263: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17 Initiation aux problèmes malposés : équations intégrales,systèmes linéaires malconditionnés et équationsde convolution

La r&olution mlmérique de certains probltimcs mathématiques peut amcncr 1111 type particu-lier d’ennuis lié à l’instabilité des solutions vis-à-vis de faibles variations des donnbr~s initiales.En d’autres termes, des variations des donnkes aussi Petit)es que l’on vcwt peuvent amener desvariat,ions aussi grandes que l’on veut de la solution. C’est bien cc type de problPme qui est bvoqubpar les météorologistes quand ils disent qu’un battement d’aile de papillon peut provoquer micyclone n’importe oa..

Grosso modo, la solution approchée dc ce type de problème n’est pas unique dans 1~s lirnitesdc prkcision que l’on s’est fixé et devient difficile à interpréter.

C’est Hadamard (1865-1963) qui le premier a mis en Cvidcncc ce type de problèmes, dits malposés aujourd’hui, ct l’on trouvera en bibliographie ses art,icles originaux. On peut a.jouter queces problèmes ont fait l’objet d’une récente actualité au cours du développement de la thkoricdu chaos.

Ce chapitre doit énorrnérnent à l’ouvrage de réf&ence écrit par Tikhonov (1906 1993) et,Ar&nine aux Éditions dc Moscou (c,f. bibliographie). La lecture de ce livre demande une solideconnaissance en mathematique, et nous avons sculcment cherché dans ce chapit,rc à r&umcr laphilosophie sous-jacente. Cependant, dans une première approche dc ces problèmes, la lecturedes exemples et l’usage des programmes sont amplement suffisants.

1. Un exemple de problème mal posé : le calcul des séries de Fourierà coefhcients approchés dans L*

Considérons II~I~ série de Fourier convergente que nous écrivons :

f(x) = F arr cos(nz)

et supposons que chaque coefficient ~~~~ soit entaché d’une erreur E/T~ (à l’cxccption dc ~0évidemment) ; nous écrivons donc :

c -n - a,,, + &I?l e t cg = a,().

La fonction f(z) est donc remplacée par la fonction y(z) :00

273

Page 264: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Dans la métrique de L2, les coefficients diffèrent de :

par conséquent, Er est aussi petit que l’on veut. D’autre part, si la distance entre les fonctionsf(x) et g(z) est donnée par la norme de la convergence uniforme, nous avons :

cette quantité est aussi grande que l’on veut.

Remarque : Si l’on choisit la norme de la convergence en moyenne quadratique, le problèmedevient bien posé. En effet :

2. L’équation intégrale de Fredholm (1866-1927) de première espèce

L’équation de Fredholm de première espèce const,itue un problème mal posé. Considéronsl’équation fonctionnelle suivante :

J K(z, t)z(t) dt = U(X) pour z appartenant à (c, d),

expression dans laquelle z(t) tes une fonction inconnue de l’espace F des fonctions continuessur (a, b) et U(X) une fonction connue de l’espace U. Mentionnons au passage que l’équation deconvolution est un cas particulier de cette équation fonctionnelle, K(z, t) devenant K(z, -t).

Ajoutons une hypothèse supplémentaire sur le noyau K(z, t) qui est connu : c’est une fonctioncontinue en IC qui possède une dérivée partielle dK(z, t)/ax également continue.

Si la solution n’est qu’une solution approchée, la mesure de l’écart du second membres’effectue, par exemple, dans une métrique quadratique pu. que nous écrivons (U est l’espace desfonctions de carré sommable L2) :

d 1/2

PcL,(.Q,U2) = J [~I(X) - t&)]” dz .c

L’écart de la solution z(t) peut être mesuré, par exemple, dans la métrique ,u~ de la convergenceuniforme (F est l’espace des fonctions Lm) :

p,(zr, 3) = sup jzr(t) - z2(t)j pour t appartenant à (a, b).

274

Page 265: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17. INITIATION.~~~ PROBLEMES MAL POSÉS : ÉQUATIONS INTÉGRALES,

À présent, montrons que le problème est un problème mal posé. Supposons que pour un secondmembre ~~(5) nous connaissions une solution exacte zl(t) ; on peut alors écrire :

b

sK(z; t)q(t) dt = ~L~(Z).

Maintenant, supposons que l’on connaisse un second membre approché peu différent de ui (x)dans la métrique L2, et l’on se propose de rechercher une solution voisine de zi(t).

Considérons la fonction za(t) = z1 (t) + IT sin(wt), elle est solution de l’équation :

rs

K(z, t) sin(wt) dt + ~I(Z) = Ut

Cette expression permet de calculer la distance de [~I(X) ~ us(z)] :

ILu(u1, u2) = Irl {l [iK(z,t)sin(tit) dt] 2 d;)o>

cette expression peut être rendue aussi petite que l’on veut pourvu que w soit suffisammentélevé. Calculons maintenant la distance des solutions correspondantes :

p,(zl, z2) = suplzl(t) - z2(t)l = suplFsin(wt)I = lrl pour t appartenant à (a, b).

et cet écart pourra être arbitrairement grand.

Remarque : Rien n’est changé si la norme pz (zi , ~2) est remplacée par l’autre norme pu. (zi ,~a) ;on calcule alors :

= Irl [q - L, sin[w(b - u)] COS[~(~ - a)]] 1’2.

Cette dernière expression montre que I et w peuvent être choisis de telle façon que la distancep,(,(zi, 22) puisse être arbitrairement grande. Ici le problème n’a pas été modifié par le choix dela norme, mais ce n’est pas une loi générale.

La conclusion peut s’énoncer de la manière suivante : la recherche d’une solution dc l’équationintégrale ne peut pas être déterminée par la condition :

expression dans laquelle :

a. l’operateur intégral est désigné par A, ce qui permet d’écrire formellement AZ = u à la placede l’équation intégrale.

b. S est un infiniment petit positif.

275

Page 266: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQ~JEAPPLIQUÉ

3. Notion de problèmes bien et mal posés

Résoudre le probl?mc linéaire AZ = U, c’est trouver sa solution z = ?Y?(U) à partir des donnéesinitiales U(X). Il va dc soi que l’on travaille dans des espaces m6triqucs ct que la distance est,suggérée par le type de problème trait&

Supposons que la « solution » soit dkfinie: et qu’à tout u appartenant à U corresponde lulesolution unique z = V?(U) appartenant à F.

Par définition, on dit que le problème de la recherche d’une solution est stable vis-à-vis desdonnées initiales si VJE > 0, il existe C?(E) > 0 tel que :

p,, (uI,u~) < C?(E) entraîne Kz(~1,~2) i 6

HVCC z1 = X(74) e t ZJ = !R(ua),

IL~ ct ~2 appartenant à U et z1 ct .zz appartena.nt à F.Par définition, le problème est bien posé sur les espaces U et F si l’on varific les conditions

suivantes :

1. VU appartenant à U, il existe une solution z appartenant à F.2. La solution est définit de faCon unique.3. Le problème est stable sur les espaces U ct F.

Dans lc cas contraire, on dit que lc problème est mal posé.

Quelques remarques

1. Le rôle de la troisième condition est fondamental pour l’exploitation des méthodes numériques.2. La recherche d’une solution approchée d’un problème mal posé est g6néralement non uni-

voque. Supposons que l’équation AZ = u soit mal posée dans l’espace des fonctions F, mêmesi A est un opérateur absolument continu, AP1 ne sera pas en génPra1 1111 opérateur contimlsur U et la solution ne sera pas stable. De plus on suppose que le second membre u,~> estconnu à S près tel que ~L,,,(u,,:~, uCL1)) < S, (u,, étant, la solution exacte et uarl 6tant la solutionapprochée). Naturellement on rechrrchc la solution approchée dans la classe QJ de z pourlaquelle la distance p,,(Az, u,~) < 6; rnalhe~lrellsement, la classe QJ est en g6n6ral tropvaste ct il faut introduire une contrainte c’est-à-dire un principe de sélection sur les solutionspossibles. Pour cc faire, on exploite une information supplérnentairr sur la solut,ion qui peutêtIre par exemple la régularité des solutions.

4. Méthode de régularisation

À prC:sent IIOUS envisageons le cas où F la classe des solutions possibles n’est, plus compacte, ainsiles variations du second rnembre de l’équation AZ = u sont susceptibles dc sortir des frontièresde AF ; on dit alors qu’il s’agit de problèmes essentiellement mal posés, et A. Tikhonov a proposémie mbthodc de résolution fondee sur la notion d’opérateur régularisant.

4.1. Notion d’opérateur régularisant

L’opérateurA-’ n’est plus continu sur AF et l’ensemble des solutions dc F n’est plus compact.Même dans le cas où l’on est en préscncc d’lm second rnembre approché 7~,~~ appartenant à I:te1 WC Pu(%.z, ,Uap) < ~5, on sait que la solution :

276

Page 267: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17. INITIATION AUX PROBLE~~E~ MAL ~0sÉs : ÉQUATIONS INTÉGRALES,

n’approche pas la solution z,:, Pour pallier cet inconvénient, on définit un opérateur rkgularisantqui dépend de S, de telle sorte que, si uap t,end vers u,, c’est-à-dire que S tend vers zéro celadoit entraîner que z,[, tend vers z,, dans les métriques appropriks.

Définition - On dit que l’opérateur R(u, 6) est rkgularisant dans le voisinage dc u = u,:.~ pourl’équation AZ = U, s’il possède les propriétés suivantes :

1. Il existe 61 > 0 tel que R(u, d) soit, Mini quel que soit 6 t (O,Sl) ct pour tout ug tel que

2. Quel que soit E > 0, il existe &(E, u,:,) < S1 tel que l’inégalité :

On note que nous ne faisons pas l’hypothèse d’un opérateur univoque, il peut cxistcr unensemble {R(us, 6)) et ~6 est un de ces éléments.

À la place de 6, on peut substituer un paramètre de régularisation notk (v ((Y > 0), qui permetd’apporter une définition plus commode.

a. R(u, a!) est défini quel que soit (1 > 0 et pour tout YJ E U tel que :

b. Il existe d’une part Q fonction dc S tel que, quel que soit, E > 0, et il existe d’autre partS(E) 5 61 tel que si us E U et p,(u,,,,ug) < b(E), cela entraîne :

On choisit comme solution approchée la solution ZJ obtenue au moyen de l’équation ~6 =R[U~; o!(6)], équation dans laquelle le paramètre rkgularisant est lik à l’erreur entachant lesdonnées initiales ‘ut.

Il nous reste donc à chercher des opérateurs régularisants et à définir le paramètre aconnaissant l’erreur 6 entachant le deuxième rnernbre.

Nous n’allons pas rentrer dans les détails de l’obtention d’opkrateurs régularisants dont nousdonnerons quelques exemples en nous lirnitant aux idées générales. La construction d’opérateursrégularisants est fondée sur le principe variationnel qui minimise une fonctionnelle stabilisatriceO(Z) non négative continue et définie sur un sous-ensemble FI dense partout sur F. En outre:cette fonctionnelle est telle que l’ensemble des éléments z de FI pour lesquels C?(Z) < 6 quel quesoit, 0,~ > 0 est un compact sur FI. On cherche la solution approchée dans l’ensemble M de Fte1 q11e :

comme la solution n’est pas continue en 6, on ne peut pas retenir un élément arbitraire dc M. Engénéral, M est très grand ct c’est notre principe de sélection variationnel qui va nous permettrede choisir un ou plusieurs éléments de M qui dépendent continûment de 6.

Revenons à notre fonctionnelle stabilisatrice O(Z) définie sur l’ensemble FI de F et désignonspar F~A l’ensernblc des éléments de M sur lequel C!(Z) est défini ; nous pouvons écrire : F~A =M n Fl. L’exploitation du principe de sélection consiste à rechercher les klérnents dc FIS quiminimisent la fonctionnelle 0( 2).

277

Page 268: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Dans le cas général, il est possible de montrer que, plutôt que de chercher à minimiser lafonctionnelle stabilisatrice n(z) sur F~J, il est équivalent de chercher à minimiser R(z) sur FIavec la contrainte :

Ce problème se traite au moyen de la méthode des multiplicateurs de Lagrange (1736-1813).Autrement dit, nous minimisons la fonctionnelle suivante :

cependant, il faut qu’il existe un paramètre Q et un élément z, tels que non seulement Ma(~, ug)atteigne sa borne inférieure, mais encore qui assurent la condition :

On peut introduire formellement la fonctionnelle Ma(z) ug) et chercher l’élément z, suscep-tiblc de constituer le minimum sur FI et alors, le parametrc cy qu’il convient de déterminerse présente comme une fonction de 6. D’une façon générale, McX( z, ~6) s’appelle fonctionnellelissante.

Il est tout à fait équivalent de considérer que z,, est domk par l’application dkm certainopérateur R[us, a(S)] dkpcndant de tel que :

où Q se détermine au moyen du résidu comme on lc verra dans le paragraphe 4.4 qui suit.Le choix de la fonctionnelle stabilisatrice est guidé par la nature du problème à traiter et cela

sera mis en évidence sur les exemples que nous présenterons.

4.2. Théorème important (sans démonstration)

Si un sous-ensemble 4 de F admet une métrique P+(~I, ~2) qui majore la métrique PF(z~,z~): ilest possible de montrer que, sous réserve que la sphère p+(z, 20) 5 p (de centre 20) soit compactedans F, il existe alors un élément z, appartenant à 4 qui minimise la fonctionnelle :

a - Exemple 1 - Si F est muni de la métrique :

pour ~1: appartenant à (a, b), il est possible de choisir l’ensemble 4 des fonctions continûmentdérivables sur (a, b) muni de la métrique :

pour Ic appartenant à (a, b).

2 7 8

Page 269: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17. INITIATION.~~~ PROBLÈMES MAL POSÉS : ÉQUATIONS INTÉGRALES,

b - Exemple 2 - Si F, espace des fonctions continues sur (a, b), est muni de la métrique :

PF(Zl,&) = SUP 121(x) - z2(.x)I

on peut choisir l’ensemble 4 des fonctions de carré sommable qui admettent des dérivées jusqu’àl’ordre p sur (a, b) ( e sp ace de Sobolev (1908&1989) IV.) muni de la rnétrique :

expression dans laquelle les qk:(z) sont des fonctions continues connues > 0, avec toutefoisqp(z) > 0. On aura donc :

et comme la solution régularisée z, minimise la fonctionnelle Aabilisante 0(z) avec la contraintep,(Az,, ug) = 6, alors, la solution sera approchée par les fonctions les plus lisses jusqu’k l’ordre p.

Les stabilisateurs s’appellent dans ce cas stabilisateurs d’ordre p, et si les fonctions sk(zr) sontdes coefficients constants 2 0, on parle alors de stabilisateurs d’ordre p à cocfficicnts constants.

4.3. Recherche de la solution régularisée sous forme d’une série

On suppose ici que A est un opérateur complètement continu de F dans U, et que U et F sontdes espaces hilbertiens. En outre, on suppose que le sous-ensemble 4 de F est aussi un espacehilberticn qui est muni de la métrique majorantc 11~11 p our laquelle l’ensemble des éléments .zde 4, tels que Ilzl1 5 d, est compact dans F. On peut alors prendre comme stabilisateur lafonctionnelle :

Q(Z) = 1142~Puisqu’il s’agit d’un problème variationnel, on écrit l’équation d’Euler associée à la fonction-

nelle lissante Me (z, u). On montre qu’elle se met sous la forme :

A*Az + az = A*u,

où A*A est un opérateur auto-adjoint.Si l’on désigne par {fk} un système complet de l’opérateur A*A (vecteurs propres) et par

{Xk} les valeurs propres associées, on peut mettre A*u sous la forme d’une série :

et z sous la forme :

expression dans laquelle les {bk} sont donnés par les expressions :

Page 270: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUI?

4.4. Choix du paramètre de régularisation

Il n’est pas évident de connaître la fonction a(S) pour laquelle l’opérateur R[u(s, Q(C?)] soiteffectivement régularisant, cependant, on connaît 1me valeur de 6 caractkkmt l’imprécisiongénérale et il nous faut trouver une valeur correspondante de (Y choisie parmi les valeurs possibles.On connaît la valeur 6 d’après la relation :

Alors, on peut estimer cv d’après le résidu, c’est-à-dire au moyen dc la condition :

D’un point de vue pratique, on va opérer dc la façon suivante :

1. On estime 6 l’erreur sur le second membre.2. On va choisir une suite de valeur de cy qui sont en progression gkométriquc, soit :

Qk = @q”

et pour chaque cyk on calcule la valeur de la fonction z,+ q ui minimise la fonctionnelle lissankwq. (6 w).

3. On calcule le résidu T-I, au moyen de la relation :

rk = /A&&~, ucs)

4. Pour valeur de CC, on choisit celle pour laquelle on vérifie l’égalité :

5. La méthode donne l’idée concernant la façon dont il faut choisir Q~. En programmation1 ilest commode de procéder par tâtonnements de faCon conversationnelle, afin de déceler plusrapidement les ordres dc grandeur.

5. Application à la résolution approchée des équations intégralesde Fredholm de première espèce

R.evenons à l’équation de Fredholm de première espèce :

b

JK(x, t)z(t) dt = u(x)

pour x appartenant à (c, d), et à appartenant à l’espace L” des fonctions de carré sommable.Pour obtenir la solution, nous allons utiliser 1111 stabilisateur du premier ordre dans l’espace deSobolev W2. Nous cherchons la solution z,, qui minimise la fonctionnelle :

d b

Ada(z) u) = JiJ K(x, t)z(t) dt - à q&)z”(t) + ql(t) dt

< a

280

Page 271: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17 . INITIATION Aux PROBLÈMES MAL POSÉS : ÉQUATIONS INTÉGRALES,

Il est possible de montrer que la solution régularisée est dom& par la résolution de l’équationintégra-diffkrentielle :

b

sH(z, t)z(t) dt - N

a

avec :

dH(x,t) =

J K(Y, X)K(Y, t) dZ/,

db(x) =

.I K(Y, xM/) d’y>

expressions auxquelles il faut ajouter la condition :

y1(x)z’(x)u(x)~~ = 0,

où Y(X) est une variation arbitraire dc Z(X) telle que Z(X) + U(X) p uisse appartenir à la classedes fonctions admissibles.

On peut satisfaire cette condition de deux manières :

a. on connaît les valeurs dc la solution aux bornes de l’intervalle (a, h) et il faut que la fonctionU(X) s’anrmle à ces cxtrémitCs;

b. si ces valeurs ne sont pas connues, on peut, alors poser ~‘(a) = z’(b) = 0. cc qui constituedeux contraintes à imposer A la solution approchkc.

5.1. Résolution numérique

Comme chaque fois en pareil cas, on procède à un rnaillage du domaine sur lequel on dksirceffectuer la résolution dc l’équation intégro-différentielle. Généralement on adopte ur1 maillageuniforrnc dc pas h sur l’intervalle (n, b), ainsi la solution Z(X) est calculée pour les valeursen progression arithmétique .~k. = a + kh avec k = 0, 1,2, . . , n. et nous notons zk la valeurinconnue z(x~). Nous pouvons également écrire quelques expressions utiles pour la formulationdu problèrne transposi: sur le plan nurnérique :

bJ’ K(xk, t)z(t) dt = hk Kk,,,zl,,

a u=o

l’cxprcssion du second membre représentant formellement une technique d’intégration usuelle(t,rapeze, rectangle, Simpson...).

Puis, cn utilisant les opérateurs de différences première et deuxième :

2 8 1

Page 272: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Ainsi, nous pouvons écrire un système d’équations aux différences finies :

pour k = 1,2, . , n - 1. On obtient donc un système dc n - 1 équations à n - 1 inconnues àpartir du moment OU l’on connaît ~0 et, z,,

Si l’on ne connaît pas zo et z,, on pose ~‘(a) = z’(b) = 0: et ces conditions seront irnposéesen écrivant le système pour k = 0, 1,2,. . , n, et l’on posera z-1 = ~0 et z,,,+l = z,,. Ceci assureque les dérivées nurnériques en a ct b sont nulles.

Ici encore, il faut résoudre chaque fois un système linéaire pour urle valeur dc o. Pourdéterminer la solution, on peut utiliser la méthode du résidu.

5.2. Exemple numérique

On se propose de résoudre num&iquement l’équation de Fredholm de première espèce suivante :

+1

.i’ K(x, Y)~Y) dz/ = 4x1-1

avec K(z, y) = (1.0 ~ x)~ s i O<y<x

K(x,Y) = (1.0 ~ Y)X s i x<y<l

e t u(x) = [sin(7rx)]” sur l’intervalle (a, b) = (-1,l).

La solution est connue analytiquement, et l’on la comparera aux résultats numériques :

u(y) = zii’[sin(nx) ~ 3 sin(3Tx)].

On trouvera sur le Web (*) le programme f redh-1 . c qui résout ce problème dans lequel lesintkgrales sont évaluées au moyen de la méthode dc Simpson.

6. Résolution d’un système linéaire mal conditionné

Soit AX = B un système linéaire le plus général. Nous considérons ici les systemes d’équationsalgébriques pour lcsqucls dc petites perturbations du second rnernbre peuvent induire desvariations inacceptables de la solution. Il se peut également que la matrice A ait un déterminanttrès proche de zéro, dans ce cas, comme les calculs sont effcctu6s avec une précision finie, nousne serons pas en mesure de savoir si le systknc est rkllcment dégénéré ou non. Quoi qu’il ensoit, il existe une classe de systèmes linéaires qui sont indiscernables cntrc eux pour un niveaud’erreur connu.

On va rechercher la solution, appelée solution normale, parmi les vcctcurs X qui vérifientl’inégalité :

i i

1/2

avec : [Z] = 2 2;j=l

*http://www.edpsciences.com/guilpin/

282

Page 273: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17. INITIATION AUX PR~BI~MES MAL rosés : ÉQUATIONS INTÉGRALE~,

L’application de la méthode des régularisants nous conduit à minimiser la fonctionnellelissante :

~cx(X> ~cbp, A) = [AX - u,$ + a[X]“,

Q se déterminant par la condition :

[AX, ~ u& = 6.

Sans entrer dans les détails, on obtient le système linéaire :

(ATA + cd) = ATuap

expression dans laquelle AT est la matrice transposée de A, et 1 la matrice unité d’ordre identiqueà celui de A. Généralement, ici encore, n se trouve déterrniné par le résidu.

Remarque : On peut traiter d’un système linéaire surdétermine mais dont les équationsnormales sont mal conditionnées. Nous avons rencontré un tel problèrne lors du lissage dediagrarnrnes de phase binaires dont les données sont expérimentales.

On trouvera sur le Web (*) 1 e programme regul. c qui résout les systcrnes linéaires malconditionnés par la méthode des régularisants.

7. Résolution des équations de convolution

C’est une équation de toute première importance en physique dans la mesure ou le signalobservé u(t) est le produit de convolution du signal émis z(t) et de la fonction d’appareil K(t).Ce sont des problèmes classiques rencontrés en spectroscopie, cn astronornie etc. Nous nousproposons de résoudre l’équation :

+C=.I’ K(CE - t)z(t) dt = U(Z),

c’est-à-dire de calculer z(t) connaissant K(t) et U(z). On peut encore écrire :

AZ = u.

Le problème se résout très facilement en termes de transformées de Fourier sous réserve queles fonctions appartiennent à l’espace L1 ou L’. Le produit de convolution devient un produitsimple dans l’espace de Fourier :

lT(t)*z(t) = u(t) 3 K(w) ç(w) = w(w)

d’où

+mavec : (a(w) =

.If(t) exp(2?rjwt) dt.

-cc

*http://www.edpsciences.com/guilpin/

283

Page 274: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Sur le plan formel, pourvu que les fonctions appartiennent aux bons espaces; il n’y a rien àreprocher à une telle facon de faire ; en revanche. si l’on doit s’attaquer à la rkolution numériqued’un tel probkmc, on va se heurter à un problème mal posé.

Il est facile de s’en convaincre en choisissant deux fonctions arbitraires, une fonction gaussiennrg(t) et imc fonction triangle tri(t) p ar exemple: dont on réalise lc produit dc convolution SU(~),le sup de chacune des fonctions étant égal à un. Si l’on utilise d’une part une machine dont laprkision est de 10 chiffres significatifs et d’autre part Ja transforrnation de Fourier portant sur128 points, la résolution de l’équation de convi)lution est p;trfaitcmcnt rkaliséc. En revanche.si l’on introduit dans le second mcmbrc une crrcur relative gaussierme de l’ordre de un pourmille ~ il s’agit d’un bruit très faible note à ~ ~ 1rl ors les rkultats deviennent complètementaberrants : au lieu de trouver des résultats cntrc 0 ct 1 approxirnativernent, on obtient desvaleurs oscillantes entre -26 et +34 et une quinzaine d’oscillations...

Ceci montre que la résolution numérique des équations de convolution ne peut pas donner derésultats corrects si l’on ne prend pas la bonne méthode d’analyse car les donmks cxpCrimentalessont toujours entachkes d’erreur.

L’origine des ennuis est, relativernent sirnple à identifier : elle est duc aux «hautes fréquences )).Désignons par O(U) la transformée de Fourier de à, la transformation invcrsc de Q(w)/K(w)peut nc pas exister, c’est-à-dire que cette intkgrale peut diverger, ceci étant essentiellement dûau rôle des hautes fréquences. Cependant, quand bien mknc la transformation inverse existeraitnotee w(t), l’écart de w(t) par rapport à zéro peut être aussi grand que l’on veut, dans la métriqueLZ 011 L”.

7.1. Présentation d’un opérateur régularisant

Pour neutraliser l’influcncc des hautes fréquences, on peut multiplier la fonction à inverser~(w)/K(w) par un facteur stabilisant f(w, 0). Ainsi, on adrnettra sans dérnonstration quel’opérateur suivant est rkgularisant :

I”OJ(w a)w(w)R[u,,(t), a(S)] = .I’ iiU) cxp(-27rjwt) d w .

-30

pourvu que la fonction f(w, a) obéisse aux conditions suivantes :

1. P(U, a) est définie quel que soit <y > 0 et quel que soit w t (-00, +co).2. 0 < f(w,a) 5 1 quels que soient Q > 0 et w E (-oo,+oo).3. f(w,O) = 1.4. f(w, a) appartient à l’espace L2, et quel que soit u: > 0, f(w. QI) est une fonction paire de d.5. f(w. cy) tend vers zéro quand /w/ + 00, quel que soit Q: > 0.6, f(W) QMW)

K(w)appartient à l’espace L2, quel que soit Q! > 0.

7. f(w, Q) tend vers zkro quand Q + 00. pour tout w différent de zéro.

7.2. Un exemple de fonction f(w, a)

K( -w)K(w 1 K2 (WIf(w’ a) = K”(w) + ~M(W) = K”(w) + ~M(W)

2 8 4

Page 275: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

17. INITIATION AUX PROBLÈMES MAL POSÉS : ÉQUATIONS INTÉGRALES;

où cy 2 0 et où hf(w) est une fonction paire, contjimleT strictement positive pour w # 0 ct positiveou nulle si w = 0.

Il est possible de montrer que le résidu de la fonct,ion régularisée est une fonction strictementcroissante de la variable Q, ce qui entraîne qu’il existe un nombre unique Q tel que :

à condition toutefois que 6 < /-I,~(T+).On peut choisir pour M( w une forme polynomialc que l’on krit :)

M(w) = -&w2j,./=0

expression dans laquelle les yJ sont, des constantcs positives (kvcntucllcmcnt nulles sauf Tu).Cette forme introduit des stabilisateurs d’ordre p. En dkfinitivc, la solution rkgulariséc s’krit :

&Y(t) =J’+CC K(-w)“(w) exp( -&jwf) dw,

1(2(w) + cYM(w) ’

ici encore, Q pouvant être dktermini: par le résidu.On trouvera sur le Web (*) le programme dconvol. c qui réalise cet algorithme.

8. Bibliographie

H. ENGL et C.W. GROETSCH (1987) In*verse and %Il-p»sed proOlerns, Acadernic Press.J. HADAMARD (1902) Suf les prohlèm,es ~162 dérivée,s partielles et leur ,si,qnification physique,

Princeton University Bulletin, p. 49-52..J. HADAMARD (1932) Le problème de Cuuchy et les tiqmtions aux déri~uées pu&ielles linéaires

hyperboliques, Hermann.A. TIKHONOV et V. ARSÉNINE (1976) Méthodes d e résolution des problèmes mal posés CLU sens

de Ho,dumard, Éditions MIR, Moscou.

*http://www.edpsciences.com/guilpin/

285

Page 276: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

18 Introduction aux méthodesde Monte-Carlo

Les mt%hodes de Monte-Carlo sont apparues comme moyen de recherche durant la SecondeGuerre Mondiale afin de simuler le comportement des neutrons dans les matériaux fissiles. Lapaternité de cette idée revient à J.E. Mayer qui l’utilisa pour la première fois cn physiquestatistique.

Avec le développement des calculateurs arithrnétiques, il est très facile de réaliser quelquessimulations de ce type à l’aide de générateurs de nombres pseudo-aléatoires. Après avoirprésenté lc célèbre problème de Buffon (1707- 1788) comme illustration historique d’une méthodede Monte-Carlo, nous donnerons deux générateurs de nombres pseudo-aléatoires que nousutiliserons dans quelques applications classiques à savoir :

Calcul d’une intégrale définie.- Rksolution locale de l’équation dc Laplace.~- Inversion d’une matrice carrée.~ Recuit simuk (minirnum dkme fonction).

1. Le problème de Buffon

Sur une feuille de papier nous traçons des paralléles équidistantes séparées par la distance 2~.Nous plaçons cette feuille sur un plan parfaitement horizontal, et nous jetons dessus une aiguillede longueur 21 telle que 1 < (L. Le problème consiste à calculer la probabilité que l’aiguillerencontre une des parallèles (cf. Fig. 18.1, page suivante). Ce problème s’appelle aussi probkmedu drapeau américain, car durant la guerre de Sécession (1861-1865) un officier américain, lorsde sa convalescence après blessure, s’était posi: le même problèrne, la feuille de papier étantrernplacéc par le drapeau américain qui comporte des bandes équidistantes.

Désignons par M le milieu de l’aiguille et par EF la perpendiculaire aux parallèles passantpar U. Soit 1 le milieu de EF. On pose EM = 2 que l’on suppose inférieure à FM (A1 comprisentre E et I).

Pour que l’aiguille coupe la parallèle AB, il faut premierement que :x: < 1. Alors, la probabilitépour que M sur El soit compris entre 5 ct II: + dz est :

287

Page 277: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Figure 18.1. Le probl~rne de BlL,flon.

Il faut deuxièmement que l’angle aigu EMQ soit plus pet,it que l’a~qzr,k: aigu EMQ’ où Q’ estle point dc AB tel que Q’M = I, soit :

zE M Q ’ = arccos -0 1

La probabilité pour que EMQ soit plus petit que EMQ’ est alors :

2 zp“ = - arccos t7l 02- est le coefficient de normalisatjion car EMQ’ est compris entre 0 et 5. Comme (1~~ et p2 sontTdes probabilités indkpendantes, la probabilitC dp de réaliser l’kkncment recherchk est dom&par lc produit des probabilités. Il reste à intbgrer le long de EI c’est-à-dire de 0 à 1: pour obtenirla probabilité p. Nous pouvons écrire :

Dans le cas où l’on choisit 1 = CL/~, la rclat,ion précédente se simplifie :

Lc nom de Buffon est, resté attaché à cc problème car ce fut lc premier à en donner la solutioncorrecte. Au Palais de la Découverte ü Paris, ccttc expérience c,st cflktivernent mont,ée et.comme on mesure p qui est lc rapport du nombre n dc cas où l’aiguille coupe urle droite et dunombre total dc lancements, 011 cn déduit une dktermination expérimentale de T. La prcrnièredktermination selon cc procédé remonte & 1850 et fut réalisk par Wolff qui; avec 5 000 lancersde l’aiguille, obtint la valeur 3,159 6.

Il est très simple dc sirnuler ce genre dc problème avec une machine arithmétique à conditionde pouvoir disposer de nombres aléatoires obéissant à une distribution donnée.

2. Générateurs de nombres pseudo aléatoires à distribution uniforme

On peut obtenir dc bonnes tables dc nombres aléatoires 5 distribution rectangulaire (appeléeaussi distribution uniforme) en prélevant dans le numéro de tekphonc des abonnés pris dans

288

Page 278: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

18. INTRODUCTION AUX MÉTHODES TIF: MONTE-CARLO

l’ordre alphabétique la suite des chiffres à condition toutefois d’en ôter lc prtfixe. Ces chiffrescompris entre 0 et 9 sont apI>roxirnativcmcnt akatoires & distribution rectangulaire.

On peut obtenir des rksultats semblables en prélevant les chiffres successifs figurant sur lesplaques mineralogiques des automobiles immatriculées en France pourvu que l’on nc s’intéressequ’à ceux précédant les lcttrcs.

On peut kgalcment obtenir des suites intkressantes en choisissant, les chiffres de nombrest,ranscendants tels que e et T. Le prockdk est coûteux car lc calcul d’un grand nombre de chiffresdemande un énorme travail prsalable, y compris la transcription qui doit gtre sans faille. Il est,important de noter que les chiffres des nombres transcendants tels que e ct T n’ont aucunepériodicitk, mais: de plus, ils sont répartis aléatoirernent selon la loi rectangulaire. Par ailleurs;on sait parfaitement calculer de trCs longues suites de chiffres exacts de ces nombres. En quoices suites générées sont-elles aléatoires? Elles le sont, dans la mesure où connaissant, uniquementles y premiers chiffres dc la suitc7 il n’est pas possible de dbterminer lc Q + le quel que soit y.

Avec l’apparition des calculateurs modernes, la nkessit@ de pouvoir gkkrer des suites dcnombres pseudo-aléatoires s’est, tr& vite manifcstk. Il s’agit alors dc cri:cr une suite de nombrestelle que la periodicité générée soit très grande devant la taille dc l’khantillon à prtlever.

Une très bonne mPthode duc à L<:hmer-Greerlhergcr (1951 et 1961)consiste à former la suiteà partir dc la rclat,ion de récurrence :

k Z+I = ak; + b modulo m

avec les contraintes suivantes :

1. b et m sont premiers entre eux,2. u E 1 r~~odulo p pour chaque facteur premier p de m,

3. n = 1 modula 4 si m est un multiple dc 4.

Ainsi la période de la suite générée est m.Ces conditions sont très faciles à réaliser sur un calculateur binaire en arithmétique entière.Prenons le cas classique de la représentation sur quatre octets. Alors on sait que l’arithmétique

entière est effectuée rnodulo m = 2”l. Attention en machine cc nombre est négatif, car lc premierbit contient un 1. Ainsi lc seul facteur premier dc m est 2. Maintenant,, pour satisfaire les autresconditions, il suffit de choisir b impair et a = 4k + 1, k entier quelconque. Pour que le modula ‘rn

fonct,ionnc dès les premkkes récurrences, il faut choisir des nombres ko, a et b de taille convenable.Nous avons retenu :

k. = 223

a = 125 661

b = 95 783.

Remarque 1 : Il y a deux fa.Cons d’utiliser le générateur : en arithmétique flottante, on diviseles k, gi‘nérks par (-2”l) et l’on obtient des nombres compris entre -1 et +l. On peut aussi neformer que des nombres positifs compris cntrc 0 et 1, ainsi quand on rencontre un k, négat,if. ilsuffit alors dc lui ajouter (-2”l) pour le ramener dans les entiers positifs. Ensuite chaque k, c,st,divisé par ( -2’i1).

Remarque 2 : Nous avons vérifié expérimentalement que la période etait bien 2’i’.

Remarque 3 : En utilisant le test du x”, nous avons vkrifié que l’hypothkc de la distributionuniforme n’etait pas contrcditc par les donnkcs gknérées.

289

Page 279: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Une autre technique pour obtenir une suite de nombres pseudo-aléatoires consiste à générerla suite suivante :

xi+1 = 2i + xi-1 modulo 4

avec x0 = e = 2,718 281828 459 045 235.. .

x1 = T = 3,141592 653 589 793 238.. .

Elle donne des résultats tout à fait semblables a ceux fournis par le générateur de Lehmer-Greenberger. On obtient des nombres pseudo-aléatoires à distribution uniforme sur l’intervalle(0,l) en multipliant zi par 0,25.

3. Calcul de 7-r

Il est très facile d’obtenir une valeur approchée de T en effectuant une simulat,ion analogue à celleliée au problème de Buffon. Pour cela, il suffit de tirer deux nombres aléatoires indépendants àdistribution rectangulaire sur (-1, +l) que l’on note ci et &. Dans le plan, le point aléatoire Ade coordonnées <i ct & obéit à une distribution uniforme dans le carré de sommets (-1, 1) et,(1, -l), elle vaut 0,25. Il est tout à fait simple de dénombrer les points A qui tombent dans lecercle de centre 0 et rayon unité. Si N est le nombre de tirages de couples Ei et & ct si Q estle nombre de points A situés à l’intérieur du cercle unité, on voit que la probabilité de tomberdans le cercle est donnée par :

surface du cercleP= T-Q----.

surface du carré 4 N

Comme pour N donné on sait dénombrer Q, on obtient aisknent urle valeur approximativede T au moyen de la relation :

Il ne faut pas se méprendre sur la portée d’une telle méthode, seul son intérêt pédagogique està prendre en considération car la précision relative varie en l/fi. On trouvera sur le Web (*) leprogramme calculpi. c qui effectue le calcul de T selon cet algorithme. Pour N = 1000 000, ontrouve T = 3,140 2, pour N = 100 000 000, on trouve T = 3,141507, et pour N = 1000 000 000.on trouve T = 3,141603 5. On vérifie bien que pour diminuer l’erreur d’un ordre de grandeur, ilfaut multiplier le nombre d’épreuves par lOO... autrement dit, on vérifie bien sur cet exemple quela précision varie comme l/fi et que le générateur dc nombres pseudo-aléatoires se comportebien.

4. Calcul d’une intégrale définie

On désire calculer l’intégrale d’une fonction f(z) entre les bornes finies u, et b. On suppose quef(z) est une fonction continue par morceaux.

*http://www.edpsciences.com/guilpin/

290

Page 280: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

18. INTRODUCTIONAUXMÉTHODES DE MONTE-CARLO

4.1. Première approche : simulation géométrique (intérêt strictement pédagogique)

On note X,,,,, et Xmin les extrcmums de f(x) sur (a, b). On désigne par a et p deux nombrestels qlle Ck 2 X,,,, et ,0 < Xmin.

On tire deux nombres aléatoires indépendants à distribution uniforme l’un sur l’intervalle(a,b), l’autre sur l’intervalle (cr,p). 0 n note < et q ces deux nombres. Le point figuratif A decoordonnées (<, ~1) est uniformément réparti dans le rectangle de sommets (a, o) et (b, ,!?). N estlc nombre de tirages de couples < et q, et Q est le nombre de points A situés entre le graphede f(x) et l’axe des 2. Attention, il s’agit d’effectuer la somme algébrique des aires, et si 17 estnégatif et qu’il figure entre le graphe de f(x) et l’axe des 5, il convient ôter une unité à Q. Sil’on ne réalise pas cette opération, on effectue le calcul de l’intégrale de If(z)l. Si ,6 est positifaucun problème ne se pose.

Remarque : Pour tirer des nombres pseudo-aléatoires entre a et b, on part d’un nombre <compris entre 0 et 1. Ensuite, on effectue la transformation :

7j = a + (b - a)<.

Si l’on part d’un nombre < compris entre -1 et 1, on effectue la transformation :

q = a + (b - a)(< + 1)/2,0.

On voit que la probabilité de tomber dans la surface algébrique de la fonction f(x) est donnéepar :

h

aire algébrique f f (xl dxP= surface du rectangle = (b a a)(/3 - o) = $

On aboutit en définitive à l’expression :

b

Jf(x) dz = $(h - a)(/3 - û),

#qui constitue une approximation de l’intégrale.

4.2. Deuxième approche

La méthode que nous venons de présenter est très sommaire. À présent nous allons présenterun autre estimateur de l’intégrale qui exploite des connaissances plus fines. Soit < une variablealéatoire distribuée uniformément sur (a, b). Nous effectuons N tirages que nous notons [i aveci = 1,. . , N. Si N est un nombre grand devant l’unité, la grandeur :

est un estimateur de la moyenne de la fonction f(x) sur l’intervalle (u, b), ce qui a pourconséquence que l’intégrale est estimée par la quantité (b - a)fa. On peut donc écrire :

b

Jn

291

Page 281: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

cet,te technique est beaucoup plus efficace que la précédente dans la mesure où elle fait appel àbeaucoup moins d’opérations.

Sur le Web (*), on trouvera le programme intmonte. c qui rkalisc ces divers calculs sur descxcmplcs simples.

5. Intégration de l’équation de Laplace en un point

On souhaite intkgrcr dans le dornaine D l’équation de Laplace :

#V + d”V + d2Vdx2 dy2 dz2

o

dans un repi‘re cartésien orthonormé tridimensionnel dans le cadre des conditions de Dirichlet(on connaît, V sur la frontke de D). Comme nous l’avons dkjrt fait au cours du chapitre 14.on superpose au domaine D un maillage cubique dont les nccuds des mailles sont notés par lestriplets (i, j, k). Une méthode de Monte-Carlo pour calculer le potentiel V au point particulier(1, JT K) consiste à décrire une suite de N chemins tous issus du point, (1, J, K) chacun de ceschemins se terminant tôt ou tard sur la frontière du domaine. Dès lors que l’on a atteint unpoint de la frontière, on note le potentiel V; de cc point, et l’on recommence un nouveau cheminissu de (1, J, K). Il est possible de montrer que le potentiel en (1, J, K) est la moyenne des V;.soit encore :

V(I, J, K) zzi=l

À présent, il reste à déterrrrirrer la façon dont on décrit un chemin dans le maillage. On doitpouvoir atteindre chacun des plus proches voisins d’un point donné quelconque hors la frontike.Avec le maillage que nous avons retenu il existe six plus proches voisins. Pour réaliser un chemin.il suffit de procéder a un tirage au sort de six nombres indépendants 1, 2, 3, 4, 5 et 6 qui sontkquirkpartis, et à chaque nombre on affecte arbitrairement un déplacement dans une des sixdirections. Par exemple, orr peut convenir que :

1 déplacement vers la gauche,

2 deplacement vers la droite,

3 déplacement vers le bas,

4 déplacement vers le haut,

5 déplacement vers l’avant,

6 dkplacernent vers l’arrière.

Il est ai& de fabriquer ces nornbres pseudo-aléatoiws. Soit < un nombre pseudo-aléat,oireobtenu par l’algorithme de Lchmcr-Grccnbcrger. Il est compris entre 0 et 1. Si on lc multipliepar 6, il appartiendra à une répartition uniforme entre 0 et 6, 6 étant exclu. Il suffira donc d’enprendre la partie entik-c et d’y ajouter 1 pour obtenir la suite des points du chcrnin.

17 = entier {6<} + 1.

Nécessairement au bout d’un nombre fini d’opk-ations, on parviendra à la limite du domaine.

*http://www.edpsciences.com/guilpin/

292

Page 282: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

28. INTRODUCTION AUX MÉTHODESDEMONTE-CARLO

6. Inversion d’une matrice carrée d’ordre n

À y regarder de près, la r&olution de l’équation de Laplace par les techniques du maillage estéquivalente à la résolution d’un syst@me linéaire. En effet, il suffit d’écrire la loi des mailles surun ensemble convenablement choisi de points pour obtenir un syst,ème linkaire de rz Cquations àn, inconnues, n étant lc nombre de nœuds du maillage. Puisque l’on sait résoudre l’équation deLaplace par une méthode de Monte-Carlo, on est en droit de penser qu’il est possible d’inverserune matrice également par une mét)hode de Monte-Carlo.

Nous allons simplement donner la technique de résolution dans 1111 cas particulier de matricesA d’ordre n. qui sont telles que les Pléments de la matrice B = 1~ A (où 1 est la matrice unité)obéissent aux inégalités suivant,es :

b,i, 2 0 e t c bLj < 1.j=l

c’est-à-dire que les bii peuvent être interprétés comme des probabilités.Sans entrer dans 1;: détail, 110~1s allons voir qu’il y a moyen dc décrire des chemins (selon un

processus markovien) dans les lignes et les colonnes de la matrice B qui nous permet de calculersuccessivement les lignes de A- l. Pour cela nous allons modifier toutes les lignes en remplac;antchaque élément par la somrne des précédents sur chacune des lignes, soit, pour la ligne j :

b .lo b,o + b,l bjo+b,,l+b,a ... b.70 + bj I + b,,2 e + bi ,<

Dorénavant, on désignera par /?lk ces nouveaux éléments. À prescrit, on peut dkcrire le processusqui va conduire à l’inversion de la matrice.

a. Souhaitant trouver l’inverse dc la ligne j de A, on commence par tirer ~111 nombre aléatoire &à distribut,ion rectangulaire sur (0, 1). De ~CLIX choses l’une : ou bien ce nombre est inf&icurou égal à l’élément fl,j,, ou bien il lui est supérieur.

b. S’il lui est supérieur on ajoute une unit6 au compteur de la ligne j.c. S’il lui est infkrieur ou 6gal on cherche la première colonne où l’élément lui est strictement

supérieur ou égal, soit m cette colonne.d. On tire 1111 autre nombre aléatoire <1 indépendant du premier, et l’on opère avec la ligne m

de la même façon que précédemment. On répète ces opérations jusqu’à ce que l’on trouve unnombre & correspondant à la ligne T tel que &, > &,, auquel cas on ajoutera 1 au compteurde la ligne T.

On effectue les opCrations de (a) à (d) N fois. Désignons par p, les compteurs dc lignescorrespondant donc à l’inversion de la ligne j. Il est possible de montrer que l’on a :

Pour terminer, on traite toutes les lignes selon cette proc6dure ce qui nous fournit l’inverse(approchée) dc la matrice A.

Dans le cas général, la rnatricc A ne se présente pas sous la forme indiqu& Alors on choisitdes coefficients Yij tels que :

bij = ~2,7~Lj avec 7rij>O c t c 7r,i3 < 1..j=l

293

Page 283: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On trouvera dans l’ouvrage de Yu.A. Shreider cité en bibliographie le développement de cettetechnique.

Sur le Wcb(*), 1 e programme matmonte. c réalise l’inversion des matrices du type A particulierselon la technique développée dans ce paragraphe.

7. Méthode du recuit simulé : recherche du minimum absolud’une fonction

On recherche le minimum minimorum d’une fonction f(z, y, z, . ) dans un certain domaine D.Pour des raisons de commodité d’écriture, on représente par 2, le vecteur de composantes 2%:yi, zi...

L’algorithme se présente sous la forme suivante :

a. On tire un premier vecteur (initial) aléatoire 20 au moyen du générateur de Lehmer-Greenberger tel que 2, E D.

b. On tire un vecteur 23 par le même procedé puis 011 calcule la probabilité de transition :

P = exp(-PdF) avec LIF = f(z.7) - f(~J-l).

Si p > Seuili, 011 conserve le dernier état, et l’on poursuit les opérations N fois (boucle sur

b).c. Ensuite, on augmente /3 qui suit une loi du genre : pn = /?InPl/3c, et l’on effectue N calculs

identiques à b.

d. L’arrêt des calculs s’effectue lorsque afl laP

< Seuilz.

Cette procédure appelle quelques remarques :

Remarque 1 : Au départ, il faut choisir ,6’u « petit »

Remarque 2 : Pour passer de *J à zj+r, on a intérêt à ne changer d’état que sur une seulecomposante à la fois. On opère alors successivement sur les variables dans l’ordre 2, y, z, .

Remarque 3 : N et pu dépendent, pour ce qui concerne leur choix, des erreurs propagées dansles calculs, aussi bien lors de la génération des nombres pseudo-aléatoires que dans le calcul de

df et f(X).Remarque 4 : Il faut veiller à ne pas « descendre trop vite », sinon, nous risquons de resterdans un minimum local dont on ne peut plus sortir (p < Seuilr). Toutefois, une «descente troplente » est source d’instabilité. Il convient de choisir un compromis pour choisir pa et N selonla fonction à minimiser.

On trouvera sur le Web (*) le programme recuit. c qui réalise cet algorithme sur une fonctionprésentant un minimum absolu. Ici, il s’agit de la résolution d’un système de deux équations nonlinéaires à deux inconnues f(z, y) = 0 et g(z, y) = 0. Notons qu’il revient au même de minimiserune forme quadratique :

F(T Y) = f%> YY) + g2b, YY).

*http://www.edpsciences.com/guilpin/

294

Page 284: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

18. INTRODUCTIONAUXMÉTHODES DE MONTE-CARLO

8. Simulation d’autres lois de distribution

Il est assez simple d’obtenir d’autres lois de distribution à partir de la distribution uniforme.Supposons que la variable aléatoire < admette la loi de répartition F(z). La variable TI = F(J) estuniformément répartie, donc pour obtenir 5 il suffit d’inverser la relation précédente à conditiontoutefois que cela soit possible. Si tel est le cas, on écrit :

8.1. Distribution sinusoïdale

Par exemple, on peut générer une suite de nombres pseudo-aléatoires à distribution sinusoïdaleen utilisant la relation :

< = arcsin(

[ est évidemment entre -1 et +l.

8.2. Distribution exponentielle

De la même façon, on peut générer des nombres pseudo-aléatoires à distribution exponentiellequi peuvent alors permettre la simulation du comportement des neutrons dans une réactionnucléaire (distance entre deux chocs successifs). La loi de répartition est :

F(z) = 1 - exp(-X2x) pour z > 0

F(x) = 0 pour x < 0.

D’après ce qui précède, on écrit alors : log,(l - <) = -X27 soit encore :

77 = -$log,(l - 5).

Si l’on remarque que la distribution de 1 - 5 est la même que celle de < puisque < appartient à(0, l), alors l’expression se réduit à :

rj = -$ log,(<) [ appartenant à (0,l).

Il est donc très facile d’obtenir des nombres pseudo-aléatoires à distribution exponentielle.

8.3. Distribution normale

Eu égard à l’importance de cette distribution, nous allons étudier diverses techniques permettantde la générer.

Somme de n nombres à répartition uniforme sur (-0,5,0,5) : 77 = C; & - Pour obtenir ladistribution de 7, nous utilisons la notion de fonction caractéristique (voir le chapitre 21 consacréà cet effet). Soit Q(t) 1 a fonction caractéristique de chaque &, elle s’écrit :

0,5

(a(t) =sin(7rt)

exp(2njtz) dz = ~ .lrt

2 9 5

Page 285: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

La fonction caractéristique de q est donc a(t)“, elle s’écrit :

en passant aux logarithmes, on obtient :

1% [f(t)1 = 72 logesin(7rt)[ 17

sin(x)comme ~ est une fonction qui tend vers zéro quand x croitprécédente se comporte comme :

indefiniment , expression

log[f(t)] log 1

7r2t2[ 1 7r2t2n

= n - ~ = -~6 6 ’

de là on tire :

1 2avec a2 = ~ .

27rn

La transformation inverse donne la fonction densité de probabilité, à savoir :

g(x) = Bexp (-i7x2a2) = Bexp

soit encore :

g ( x ) = B e x p -&( 1

avec f12 = n .1 2

En définitive, on obtient :

g(x) = & exp -2( 1

avec g2 = 2 .1 2

On voit aisément que si l’on effectue la somme de 12 nombres aléatoires on obtient la loinormale réduite. Soit 70 un nombre aléatoire généré par ce procédé donc obéissant à la loinormale reduite. Il est aisé de voir que le nombre Ç = ~a + rn obéit à la loi de distribution :

g(x) = &exp [-(x2J)2],

par conséquent, il est facile de générer des nombres à distribution gaussicnne avec une moyenneet un écart type choisis à l’avance.

Si les nombres pseudo-aléatoires < appartiennent à l’intervalle (0, l), il suffit d’effectuer lechangement 7 = < - 0,5 pour se ramener au problème précédent.

Au cas où les queues de distribution de la gaussienne jouent un rôle préponderant dans lasimulation, on doit adopter un autre procédé pour générer notre suite de nombres gaussiens.

296

Page 286: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

18. INTRODVCTIONAUXMÉTHODES DE MONTE-CARLO

8.4. Distribution gaussienne à queues soignées

On part de l’idée suivante : soient deux nombres aléatoires indépendants ~1 et 72 obéissantchacun à la loi normale réduite. La somme des carrés de ces variables, soit Ç = $ + 72, n’estrien d’autre que la variable x2 à deux degrés dc liberté (chapitre 22) dont la loi dc distributions’écrit :

P(c < z) = 1~ exp (-g)

c’est la loi exponentielle de coefficient X2 = 0,5 dont nous venons de simuler la rcpartition (voiraussi la loi du &).

Par ailleurs, 71 et 772 peuvent être considérés comme les coordonnées, dans le plan, d’unpoint M d’argument 4 = (OX, OM). Cet argument 4 suit une loi uniforme indépendante de lalongueur de OM.

Nous allons exploiter ces deux remarques pour calculer les nombres indcpendants Q et vaà partir des deux nombres indépendants distribués uniformément <i et <a. En se référant auxpropos de l’alinéa b du paragraphe 8.2 (concernant la distribution exponenticllc), il suffit alorsde poser :

avec Ii appartenant à (0,l)

- = tari(4) = tan(27r&)72

soit encore : $ Cos2 (27r&) = 7; sin2 (27r&),

avec & appartenant à (0, 1), d’où l’on tire :

m = JJGiX2W2742)

72 = ~~CO~(2~l2).

Il suffit de tirer deux nombres aléatoires à distribution rectangulaire <i et (2 sur l’intervalle(0,l) indépendants pour obtenir deux nombres aléatoires à distribution gaussiennc v1 et Qindépendants (distribution normale réduite).

9. Éléments de bibliographie

E. DURAND (1961) Solutions numériques des équations algébriques, Tome II, Éditions Masson.G. FISHMAN (1996) Monte-Carlo : concepts, algorithms and upplications, Springer-Verlag.J.M. HAMMERSLEY et D.C. HANDSCOMB (1967) Les méthodes de Monte-Carlo, Éditions Dunod.A. SCHREIDER (1966) The Monte-Carlo Method, The method of the statistical trials, Pergamon

Press.

297

Page 287: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 9 ÉIéments de calculdes probabilités

Même au niveau très élémentaire, le calcul des probabilités est toujours truffé de pièges et decolles qui font que cette discipline est souvent redoutée. La lecture de l’ouvrage de J. Bertrand(182221900) cité en bibliographie est fortement recommandée tant elle est agréable. Il s’agit dufac-similé de la seconde édition française de 1907. C’est un ouvrage de référence, particulièrementconnu à l’étranger, connu aussi pour sa rigueur epistémologique. Il est d’une lecture très aiséeet ne nécessite en mathématiques que les connaissances correspondant au niveau du DEUGpremière année.

1. Introduction et notions fondamentales

Nous nous proposons d’examiner de quelle manière on peut étudier les phénomènes présentantun certain caractère dû au hasard (mot d’origine arabe ayant trait au jeu de dé). Une faconclassique de présenter les problèmes consiste à examiner les fluctuations d’une grandeur autourd’une moyenne, en voici des exemples : la masse d’un corps au moyen de n mesures, la recettejournalière d’un parcmètre, la trajectoire d’un navire entre deux ports, la trajectoire d’un avionentre deux aéroports.

Dans notre présentation, il n’est pas utile de rechercher une définition très subtile du hasard,et il nous suffira de dire qu’il s’agit d’une causalité fictive, laquelle pourra évoluer en fonction desconnaissances supplémentaires que nous acquerrons sur le système étudié (cf. les probabilitésconditionnelles, les ensembles canoniques en mécanique statistique).

Il faut bien insister sur le fait que l’étude des phénomènes aléatoires (mot latin ayant traitau jeu de dé) ne présuppose pas l’abandon du déterminisme. Certains problèmes, examinéssous l’angle de la physique traditionnelle, exigent une modélisation très complexe qui, dansles meilleurs des cas, peut conduire à un ensemble d’équations. Ces équations ne sont jamaisjusticiables d’un traitement analytique et seul l’aspect calcul numérique pourrait être envisagé ;on doit se rendre à l’évidence : le temps de calcul est prohibitif, l’espace mémoire démentiel...bref, le problème est bel et bien irréaliste. C’est ainsi que l’on préfère envisager l’usage d’unautre procédé d’analyse qui sera sans doute beaucoup moins fin mais qui fournira les résultatsglobaux que nous attendons. Pour se convaincre de cette réalité, il suffit de considérer le simplejeu de pile ou face.

Si l’on fait abstraction de l’hypothèse selon laquelle la pièce pourrait rester en équilibre surla tranche, ce qui nous intéresse c’est savoir quelle est la face présentée par la pièce à la fin del’expérience. A priori, cette face peut être déterminée à partir du moment où l’on connaît la

299

Page 288: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUti

position initiale de la pike, sa forme, sa dcnsitk, les forces mises en jeu pour la larlrer. plus uncertain nombre dc renseignements 1iCs à l‘a,tmosphère dans laquelle elle sc déplace. c’est-à-dire ladensité dc l’air, la resistancc de l’air, etc. et d’autres renscignemcnts lik à la surface sur laquelleest censk s’immobiliser la pike par exemple nature du matériau. rugositb etc. Ainsi, le problèmeprkcnte toutes les qualités pour etre modPlisé selon les r+glcs classiques et donc de constituer unproblème déterministe ordinaire. Point besoin d’être un grand clerc pour se rendre compte quecette conception conduit incxorablemcnt à une impasse, car le problème ainsi envisagé devientimmkdiatemcnt inextricable. Par conskquent, force est d’abandonner cette mkthode ct d’utiliserles voies offertes par la théorie des probabilitk. Peu importe la facon dont la piRcc est parvenuesur l’une des faces. seul le rtsultat nous intéresse, et cela constitue un événement. Da.ns lc casprésent. deux 6vénemcnts sont, possibles : la pièce peut prkscnter face ou pile.

À l’événement; est associée la probabilité de cet événement. Sans entrer dans les querellesde définition, on peut dire que la. probabilitit est la mesure numérique de la possibilité de la

raalisation cffectivc de 1‘évi:ncment. C&e notion va s’kclairer dans les paragraphes suivants.Lc problème essentiel de la théorie des probabilitk repose sur la mesure cffectivc de la

probabilité, et il y a essentiellement deux façons de traiter le probkme :

a. on est en mesure d‘effectuer a priori une évaluation directe des probabilités (calcul direct) :b. on effectue une mesure de la probabilitk au moyen d’expCriences sur un(‘ population. on

parlera a,lors de probabilité empirique d’un événement (ou probabiliti: statistique).

2. Évaluation de la probabilité

2.1. Calcul direct des probabilités

C’est le cas que l’on rencontre lors de l’ktude de systèmes qui peuvent etrc décrits a priori etqui possèdent les propriétés suivantes :

1. Un évkncment et un seul se manifeste à la fois. Il s’agit par exemple du tirage d’une cartedans un jeu de trente-deux cartes.

2. Les évtncments sont incompatibles entre eux : ils ne peuvent, pas apparaître rnsemblc. Celasignifie qu’un as de coeur ne peut pas Ctre un roi de pique.

3. Les événements sont équiprobables a priori, ou encore les probabilites de chaque événementsont a priori égales. Cela veut dire que, pour des raisons de symétrie, aucun des événementsne se manifeste plus que les autres : il n’y a aucune raison pour que les ~vk~emrnts aient despoids différents.

Lorsque la propriété 1 est vérifik, on dit, que le système est complet. lorsque les trois propriétéssont vérifikes, on dit que lc système est exhaustif.

L’intkêt de définir un système exhaustif repose sur la possibilité d’ktudier tous les problèmesclassiques de jeu de hasard où l”équiprobabilit,é des événements est assurke d’avance.

Par définition, on dit qu’un cas est favorable si son apparition entraîne la réalikion del’~v6nement en question. 11 s’ensuit que la probabilité dc l’événement A que nous notons P(A)est alors le ra.pport du nomhrc de cas favorables rn et du nombre dc cas possibles n; soit :

P ( A ) = F (19.1)

On voit, a.pparaître la propriéti: « évidrntc ) b que P(A) est, 1111 nornhrc compris entre 0 et, 1

300

Page 289: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

19. ÉLÉMENTS DE c.4~~~1, ne.7 PROR.~RII,IT&

2.2. Probabilité empirique d’un événement ou mesure de la fréquence relative

Plus simplement il s’a.git d’envisager l’étude des cas où la propriété de symétrie a disparu : c’estle cas, par exemple, du dé pipé. C’est l’cxp&ience qui révèle l’absence de sym@trie, ou plutôtune série de n expériences. On appcllc fréquence de A le nombre d’cxpbicnccs oi~ l’tvanementA est apparu divisi: par lc nombre total d’expériences effcctu&s. On réalise ainsi une mesurecxp6rimentale de la probabilité, et lion parle dans cc cas dc probabilité empirique ou statistique.

À présent apparaît 1111 sérieux problème : la probabilité statistique change d’une séried’cxp&icnces 2 l’autre. Cette difficulté se trouve réglitc par l’intermédiaire du théorème deBernoulli :

Soit un nombre 7 > 0 aussi petit que l’on veut,; la probabilitk pour que la diff&ence entrela fréquence d’apparition dc l’Cv&cment et la probabilité de cet Mmcment soit infbrieure à q>tend vers un lorsque lc nombre n des épreuves augmente indéfiniment.

Cc thi:orème que nous dérnontrerons plus loin est l’cxprcssion de ce qui est appel@ la loi desgrands nombres.

À l’occasion de l’énoncé du théorème dc Bcrnoulli, nous venons d’introduire une notionnouvelle de la convergence : la convergence en probabilité :

On dit que X,, tend vers X0 en probabilit6 si, quel que soit E > 0 aussi petit que l’on veut. laprobabilité de vérifier l’inégalité

tend vers 1 quand n tend vers l’infini.Notons qu’un écart import~ant peu cxistcr mais il est peu probable, et d’autant, plus improbable

que n le nombre d’épreuves est grand.

3. Notion de variable aléatoire

Par dkfinition, toute variable dont la valeur est fixée par la réalisat,ion d’une Bprcuvt appartenantà. une catégorie déterminée est appelée variable aléatoire.

Il nc faut pas confondre la variable aléatoire avec les valeurs effectives que ccttc variable est,susceptible de prendre.

Par exemple, la variable aléatoire X désigne lc nombre présent@ par la face d’un dé nor-malement numéroté. Ainsi, les valeurs possibles de la variable alCatoire X sont 1: 2> 3, 4: 5ct, 6.

Nous venons de définir une variable aléatoire X qui est discrète. Il est tout à fait possiblede définir une variable aleatoire continue en disant qu’elle peut prcndrc toutes les valeurs àl‘intérieur d’un intervalle D fini ou infini. Par cxcmple, il suffit de penser à la longueur de latrajectoire suivie par un avion entre Paris ct New-York : toutes les valeurs sont possibles àlïntéricur du domaine D.

4. Somme et produit d’événements. Théorèmes fondamentaux

Ces notions ct théorèmes vont nous permettre de réduire une cxpkrience relativement complexeen sommes et produits d’événements $ partir desquels il sera aisé d’effectuer des ca,lculs. Il s’agitdc mettre en œuvre une méthode indirecte qui peut s’appliquer à. tout un ensemble de problCmcsque la probabilité soit connut directement ou empiriquement. que les variables aléat,oires soientdiscrètes ou contimIes.

301

Page 290: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

4.1. Définitions

a. La somme de deux événements A et B notée (A + B) est un événement C tel que l’événementA se réalise, ou bien l’événement B ou encore les événements A et B.Il s’agit du OU inclusif. Par exemple, le tirage d’un as en deux coups dans un jeu de trente-deux cartes : on peut tirer un as le premier coup, ou bien un as lc second coup, ou encoretirer un as le premier coup et un as le second coup.

b. Le produit de deux événements A et B noté (A . B) es un événement C consistant en latréalisation simultanée des événements A et B.Il s’agit du ET. Par exemple, le tirage de deux boules blanches dans une urne contenantn1 boules blanches et n2 boules noires (avec nl > 2 et n2 # 0), en effectuant deux tiragesconsécutifs en remettant la première boule tirée dans l’urne. (Rien n’est changé si on ne remet,pas la boule dans l’urne.)

4.2. Exemples d’application

Nous allons utiliser ces deux notions pour décomposer en « éléments simples » quelquesproblèmes de probabilité relativement complexes.

On considère le problème suivant : on joue trois fois de suite au jeu de pile ou face et l’on notele résultat P ou F selon que l’on a obtenu pile ou face. On numérote les résultats en donnantun indice à P et F. On peut tout de suite remarquer que, dans ce jeu, l’événement contraire àP que l’on note P est F, et cela peut aider l’écriture des événements.

a - Problème no 1 - Sur les trois lancements de la pièce, 011 désire obtenir exactement uneseule fois pile.

L’événement qui nous intéresse est l’événement E ainsi défini :

b - Problème no 2 - Sur les trois lancements de la pièce, on désire obtenir au moins deuxfois pile.

L’événement se note :

À partir de cette décomposition, il sera facile de calculer les probabilités correspondant àla réalisation des événements étudiés dans la mesure où, toutefois, nous savons calculer lesprobabilités correspondant à la somme et au produit de deux événements. Avant d’aborder cetaspect du problème, il convient de rappeler deux définitions :

c - Événements incompatibles - Ils ne peuvent se réaliser simultanément, par exemple, sil’on tire une carte dans un jeu traditionnel, cette carte ne peut être à la fois un cceur et un pique.en revanche, l’extraction et d’un carreau et d’un roi constitue deux évknements compatibles.

d - Événements indépendants - La réalisation de A ne dépend pas de la réalisation de B oude sa non-réalisation. On dit que deux événements sont indépendants si la réalisation de l’un nechange pas la probabilité de réalisation de l’autre.

302

Page 291: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

19. ÉLÉMENTS DE CALCUL DES PROBABILITÉS

4.3. Théorème des probabilités totales

La probabilité de réaliser l’événement E constitué par la somme des événements incompatiblesA et B est égale à la somme des probabilités de ces événements; on notera :

P(E) = P(A + B) = P(A) + P(B) ;

s’ensuivent deux corollaires pratiquement évidents :

a - Corollaire 1 - Si les événements Al, AL, . . , A, forment un système complet d’événementsincompatibles, la somme de leurs probabilités est égale à l’unité, soit :

c P(AZ) = 1.i=l

b - Corollaire 2 - La somme des probabilités d’un événement et de son contraire est égale àu n .

4.4. Théorème des probabilités composées

La probabilité du produit E de deux événements est égale au produit de la probabilité de l’und’eux et de la probabilité conditionnelle du second, calculée sous la condition que le premier aitlieu :

P(E) = P(A . B) = P(A). P(B/A).

Commentons cette proposition. Rappelons que deux événements sont indépendants, si laprobabilité de A ne dépend pas de la réalisation de B, sinon, ils sont dépendants. Prenons unexemple : une urne contient deux boules blanches et une boule noire. On considère les événementssuivants :

L’événement A : la première boule tirée est blanche.L’événement B : la deuxième boule tirée est blanche.On réalise l’expérience suivante : on tire une première boule que l’on place dans la boîte no 1

sans en prendre connaissance, puis on tire la seconde boule que l’on place dans la boîte no 2 sansen prendre connaissance. À présent, on peut prendre éventuellement connaissance de la boulecontenue dans la boîte no 2, en ignorant le contenu de la boîte no 1.

La probabilité de tirer une boule blanche, dans le cas de l’événement A, ne connaissant pasl’événement B, est P(A) = 2/3. En revanche, si l’on sait que l’événement B s’est réalisé, alorsla probabilité est P(A) = 1/2.

On appelle probabilité conditionnelle de A relative à B, et l’on note P(A/B) la probabilitéde A calculée sachant que B s’est réalisé. On rencontre aussi d’autres façons d’écrire : P(AIB)et P(A si B). La notation devient alors :

P(A) = 2/3 e t P(A/B) = 1/2.

Dans le cas où A est indépendant de B, on a : P(A/B) = P(A) Il s’ensuit les corollairessuivants :

a - Théorème - La probabilité de deux événements indépendants est égale au produit desprobabilités de ces deux événements.

b - Théorème - Si A est indépendant de B, alors B est indépendant de A.

303

Page 292: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

.bfANUEL DE CALCUL NUMÉRIQUE APPLIQUlt

4.5. Formule des probabilités totales

Il s’agit dc calculer la probabilitc d’un évcnement A pouvant avoir lieu simultanément avec l’undes evénemcnts Hi ~ Hz, . , H,, lesquels forment un système complet d’evénements incompa-t,ihles, on obtient :

P ( A ) = 2 P(H;)P(A,HJ.7=1

4.6. Formule de Bayes (1702-1761) (théorème des causes ou des antécédents)Envisageons à prcsrnt que l’événement A se produise obligatoirement, avec l’un des événementsHI, Hz, . . . H, qui sont antérieurs à l’tvcnemrnt A et qui constituent 1111 @@me completd’évencments incompatibles. L’ensemble des événements {Hk} peut être considéri: comme la«cause » de A. Le mot cause tient tt la formulation historique ct non 5, sa nature philosophique,et J. Bertrand dit à cc su.jet : « Les causes sont pour nous des accidents qui ont accompagné ouprécédé un événement observi: ». C’est pourquoi. il serait plus raisonnable de parler d’antécédentque de cause, cependant; par respect dc la tradition nous utilisons le mot cause.

Le problème que l’on pose alors est le suivant, : sachant que A s’est produit,, quelle estla probahilit,é pour que ce soit précisement la cause Hi qui 1”ait produit ? On suppose quel’on connaît les probabilités d’intervention de chaque cause Hk. A priori ces probabilités sontconmies. et on cherche a posteriori la probabilité sachant que l’événement A s’est effectivementréalisé.

Donnons un exemple d’après .J. Bertrand. Un joueur prend le pari d’amener avec deux dés unpoint supérieur à 10. L’événement A est : il a gagné. Ceci peut, être réalisc en amenant le 11 etlc 12 : telles sont les causes de succès.

Avant l’expérience, les probabilités des causes sont P(H,); P(Hz), . . , P(H,). Comment cesprobabilités se trouvent-elles rnodifiées par la réalisation de l’événement A? Il nous faut donctrouver P(Hk/A) pour chaque cause.

La démonstration est sirnplc. nous pouvons ccrire :

~(HI, A) = P(A HE;) = P(A)P(Hk/A) = P(Hk)P(A/Hk) pour k = 1: 2,. . , n,

soit encore en tenant compte dc la derniere @alit@ :

P(Hk/A) = P(H.A-P(A/H~) ;P(A)

enfin. en utilisant la formule des probabilités totales, on obtient :

P(Hk)P(A/Hk)

P(HdA) = n

Exemple - Deux étudiants passent l’examen de MPA. Le premier a la Probabilit>é pi = O:7d’obtenir l’examen, le second la probabilité ~2 = 0,6. Un étudiant a été reçu. Trouver laprobabilité que ce soit le premier.

A priori, on retient les causes (antccédents) suivantes :

Hi : aucun étudiant n’est reçu ;

Hz : les deux Cttudiants sont recus ;

HC3 : seul le premier Ctudiant est reçu;

H4 : seul le second étudiant est rec;u.

304

Page 293: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

19. ÉLhENTS DE CALCUL DES PROBABILITÉS

Il n’y a pas de difficulté à calculer les probabilitts attachées à ces causes :

P(HI) = (1 ~ Pi)(1 ~ p2) = 0:3 x 0,4 = 0,12

P(H2) = plp2 = 0,7 x 0,6 = 0,42

P(I&) = pl(l - p2) = 0,7 x 0,4 = 0,28

P(i&) = (1 - pr)pz = 0,3 x 0.6 = 0,18

Remarque : On verifie bien que la somme des probabilités est égale à 1.

Les probabilités conditionncllcs dc l’événcmcnt observé A (ml étudiant, est rccu) lices auxcauses Hk s’ecrivent :

P(A/H1) = 0,O

P(A/Hz) = 0,O

P(A/‘&) = 14P(A/H/i) = 1,O

Une fois l’événement A réalisé, les deux premières causes deviennent impossibles, et lesprobabilités des causes deviennent :

P(H’3’A) = P(H3)P(A/H:<) + P(H4)P(A/H4) =

0,28

0,28 + 0,18= 0,61,

J’(fW’(A/&)P(H4’A) = P(H:3)P(A/H3) + P(H4)P(A/H4) -

0,180,28 + 0,18

= 0.39.

Il faut bien comprendre cc que signifient ces calculs, et ils peuvent Ctrc obtenus par une autrevoie. Seules les deux hypothèses H3 et H4 sont compatibles avec la réalisation de l’evenernentA P(H31 + P(H41 n’est plus égal à 1 puisqu’on Cent ml renseigncmcnt dc plus : l’événementA s’est réalisé. Les probabilités conditionnelles restent proportionnelles entre elles, il suffit doncde calculer Q tel que o[P( H:i) + P(&)I = l! donc :

1

a = P(Hx) + P(H4)’

puis P(Hx/A) = C@(H~) e t P(Hd/A) = C#(H~).

5. Lois de répartition des variables aléatoires

La description complète d’une variable aléatoire, qu’elle soit discrète ou continues impose laconnaissance de l’ensemble des valeurs susceptibles d’être prises par la variable akatoirc maisaussi du poids attaché à chacurle des valeurs (ou probabilité).

On se trouve alors dans le cadre d’un système complet d’cvenements incompatibles.

305

Page 294: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5.1. Cas de la variable discrète

La somme des probabilités attachées à tous les événements est égal à 1. La variable aléatoirediscrète X prend ses valeurs sur l’ensemble fini ou infini (~1, z~,Q, . . . , 2,) - TZ fini ou non ~chaque valeur zk ayant la probabilité pk de se réaliser. On a alors :

pli = 1.k=l

La connaissance de la loi entre le poids attaché à chacune des valeurs possibles de la variablealéatoire et ces mêmes valeurs possibles constitue toute l’information nécessaire à la descriptionde la variable aléatoire. Souvent, il est commode d’employer une autre description en utilisantla fonction de répartition ou répartition.

5.2. Définition

La fonction de répartition est la probabilité de l’événement X < 2. On note :

P(X < x) = F(x) .

c’est une caractéristique universelle de la loi entre les {zk} et les {pk} que les variables soientdiscrètes ou continues. Ses propriétés essentielles sont :

a. F(z) est une fonction non décroissante de xb. F(+~I) = 0.c. F(+co) = 1.

La répartition permet de connaître la probabilité pour qu’une variable aléatoire tombe dansun intervalle donné.

5.3. Cas de la variable continue

La répartition demeure une approche classique, mais on utilise aussi la densité de probabilitéou distribution, laquelle en première approximation est la dérivée de la fonction de répartition.

La rigueur voudrait que la répartition soit introduite au moyen de l’intégrale de Stieltjes(1856&1894), mais cela n’est point nécessaire pour le propos qui nous préoccupe. Par conséquentle lien entre la répartition F(x) et la densité de probabilité f(y) est réalisé par l’intégrale deRiemann :

z

F(x) =s

f(y) dy.-00

Dans les cas ordinaires, la connaissance de F(x) ou de f(y) suffit à caractériser la variablealéatoire étudiée.

En pratique, on aime bien utiliser un certain nombre de grandeurs associées à la variablealéatoire telles que les caractéristiques de position et les moments.

306

Page 295: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

19. ÉLÉMENTS DE CALCUL DES PR~B.~BILITÉS

5.4. Les caractéristiques de position

a - La valeur moyenne - Encore appelée espérance mathématique d’une variable aléatoire.Elle est définie ainsi :

M(X) = CPkXk+nO

ou M(X) = s X~(X) dxk=l -cc

selon que la variable est discrète ou continue. Comme on le verra plus loin c’est aussi le momentnon centré du premier ordre.

b - Le mode - C’est la valeur la plus probable de la variable aléatoire, soit encore le maximumde la densité de probabilité dans le cas l’une répartition unimodale d’une variable aléatoirecontinue.

c - La médiane - C’est la valeur m, de la variable aléatoire telle que :

P(X < m , ) = P(X > m , ) = 0,5.

5.5. Les moments

Par définition, on appelle moments non centrés d’ordre k l’espérance mathématique de la variableX”. On écrit alors :

mk(X) = M[X”] = Cpi~: O U

+cO

= ./' X”~(X) dz.i=l -03

Il s’agit de moments tout a fait semblables à ceux de la mécanique, en assimilant pi à unpoids ou f(x) a une densité massique (volumique, surfacique, linéique).

Il est plus utile de définir les moments centrés d’ordre k de la variable aléatoire centrée X*.Par définition, la variable aléatoire centrée X* est la variable aléatoire X qui a subi un décalage

3 d’origine égal à son espérance mathématique ml :

X” =X-ml.

Les moments centrés s’écrivent :

pk = mk(X*) = M[X*k] = cp,(Xi - ml)” OU

2=1

= s(x - ml)kf(x) dz.

-02

On vérifie sans peine que le moment centré d’ordre 1 est nul : ,UI = 0. Le moment centréd’ordre deux s’appelle variante D(X) = ~2, c’est l’espérance mathématique du carré de lavariable centrée. Cette grandeur est attachée à la mesure de la dispersion, et l’on appelle écartquadratique moyen ou écart type la quantité g(X) = Jo(x).

Le moment d’ordre 3, ~3, caractérise l’asymétrie tandis que p4 caractérise l’aplatissement.Ces deux dernières grandeurs permettent de comparer une loi de distribution donnée à la loinormale (Gauss-Laplace).

307

Page 296: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

6. L’inégalité de Bienaymé (1796-1878) - Tchebycheff

On considère une variable aléatoire X de moyenne m et d’kart type g. Par ailleurs, on se donneune valeur t > 0 arbitraire et l’on se propose de calculer la probabilité P que le module de lavariable (X ~ ni) soit supérieur à t fois la grandeur 0. On recherche donc P( iX - m > to).

Sur la droite 0x, on porte le point M d’abscisse m, lc point A d’abscisse (m -ta) et le pointB d’abscisse (VI + ta). Sur Oy on porte la densité de probabilité (cf. Fig. 19.1).

En d’autres terrnes, la probabilité cherchec est celle pour laquelle X n’appartient pas ausegment Al?. Écrivons D(X) = o2 :

On peut encore écrire la décomposition suivante :

02 ZZZC+C+C

XE(W,B) Xt(A,W XE(A-oc)

ou encore

i= j+f+T;

-00 A B

quelle que soit l’expression, on peut écrire :

~T~=A+L?+C d’où CT’ > A + C.

Par ailleurs. hors lc segrnent AB :

(xz ~ rn)2 > t”a”

et l’on peut écrire que :

4 + c > t2a2 c’pi:

avec C’p7 signifiant que la sommation porte sur les valeurs extericures au segment AB. blaiac’est, aussi la probabilité recherchée que l’on désigne par P. En définitive, on obtient :

u2 2 pt2a2 soit PL&

En conclusion; on voit que la probabiliti: d’un écart supkrieur à ta décroît comme lit*. etcela quelle que soit la loi de distribution. Cette inégalité de Bicnaymé-Tchebychcff trouve unebelle application dans la demonstration du théorème de Bernoulli.

308

Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Page 297: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

19. ÉLÉMENTS DE CALCUL DES PR~B.~BII,ITÉS

7. Le théorème de Bernoulli

On se propose donc d’étudier la convergence en probabilite de la moyenne empirique u/n, versla moycnnc théorique p. On verra au chapitre 20 que des considérations sur la loi binomialedonnent les résultats suivants :

D ! xi!!!0

avec ~+y= 1.n n

On utilise l’inégalité de Bienaymé-Tchebycheff en posant :tz& Y?c avec E > 0 arbitraire.P9

D’où

Soit S un nombre positif tel que n > &. n croissant autant que l’on veut, fi sera aussi petitque l’on veut, et l’on aura :

En définitive, la probabilité pour que la fréquence v/n diffère de sa valeur moyenne d’unequantiti: dont le module est au moins égal à E, tend vers zéro quand n tend vers l’infini quel quesoit E > 0. Il s’agit, rappelons-le, dc la convergence en probabilité.

8. Éléments de bibliographie

J. BERTRAND, Calcul des probabilités, Chelsea, New-York fac-similé de l’édition francaise de1907.

E. B~REL, R. DELTEIL et R. HURON (1962) Probabilités, Erreurs, Armand Colin, Paris, 12eédition.

P. JAFFARD (1996) Initiation aux méthodes de la statistique et du calcul des probabilités, Masson.H. VENTSEL (1973) Théorie des probabilités, Éditions MIR, Moscou.

309

Page 298: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20 La loi binomiale,: . L .-,Y I-_: ” /:>. -~:;t~.::=-:~ct.:=/:/.-xi”-,’ “J ‘,Si: i // .i- 1 a 10 i d e po i s SO n

et la loi de Gauss-Laplace

Les fondements de la statistique reposent sur la connaissance fine de quelques lois de distributiondont la principale est la loi de Gauss-Laplace. Cette dernière découle directement de l’étude de laloi binomiale : elle en exprime alors le comportement asymptotique lorsque le nombre d’épreuvesdevient extrêmement grand (supérieur à 100 pour fixer les idées), autrement dit, on effectue unpassage de la variable discrète à la variable continue.

Dans le cas où la probabilité dans la loi binomiale est très petite devant l’unité, sans pourautant que le nombre d’épreuves soit très grand ~ le produit X de ces deux nombres est proche del’unité - on débouche sur la loi de Poisson. Celle-ci admet naturellement la loi de Gauss-Laplacecomme loi asymptotique dans le cas où le nombre d’épreuves devient très grand, X étant trèsnettement plus grand que l’unité. Cette loi est utilisée lors de l’étude des «événements rares »qui sont, par exemple, les phénomènes observés par les compagnies d’assurance (sinistres) ; elleentre aussi pour une part active dans l’étude des files d’attente et de la fiabilité.

1. La loi binomiale, schéma de Bernoulli

On effectue une série d’épreuves qui donnent lieu chacune à une éventualité parmi deuxéventualités, chacune des éventualités ayant une probabilité constante.

Par exemple, on considère une urne qui contient P boules blanches et Q boules noires. Ontire une boule, on note sa couleur, puis on la remet dans l’urne et ainsi de suite. Nous avonsalors effectué des tirages non exhaustifs dans une urne à deux catégories, on dit aussi tiragesavec remise dans une urne à deux catégories, c’est ce qu’on désigne par schéma de Bernoulli.

Choisissons comme éventualité favorable le tirage d’une boule blanche dont la probabilité estp. On réalise n épreuves consécutives. On note d’abord que les tirages sont indépendants lesuns des autres. La probabilité pour que k d’entre eux soient favorables, donc (n - k) soientdéfavorables est donc :

1. pkqn-” si l’on spécifie l’ordre dans lequel les cas favorables et défavorables doivent se succéder ;2. CLpkq”-” si l’ordre n’a pas d’importance.

C’est cette seconde forme qui va faire l’objet de notre attention. Ainsi la probabilité est donnéepar l’expression :

n ! k n - kpk = k!(n - k)!P ’ ’

3 1 1

Page 299: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANIJEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c’est aussi le terme de rang k du dheloppernent du binôme de Newton :

(p + y)” = $1 + npp + . + cp-kpk + .p”,

Calcul des moments

On écrit lc binôrne sous la forme légkrement modifiée :

a(t) = (y +pt)n = CPkP.k=O

on Q(t) s’appelle la fonction génératrice des moments ; elle constihe un art,ific:c commode poureffectuer le calcul des caractCrist,iques de position. Le moment d’ordre zéro s’écrit en fonctionde Q(t) de la manière suivante :

Q(1) = 2 Pk.k=O

Si l’on dérive les deux membres donnant a(t) par rapport à t, on obtient :

a’(t) = np(q + pty = 2 kP&‘.k=O

En faisant t = 1, on trouve :

CD’(l) = n p = CkPk = M ( X ) = ml,

k=O

c’est-à-dire le mornent d’ordre un.Les dérivations successives dorment des expressions fournissant tous les moments successifs

après avoir fait t = 1. Seul le deuxième moment va retenir notre attention :

Faisons t = 1 :

Q”(l) = n(n ~ l)p2 = n7,2 - rjXl.

De là ou déduit :

m2 = n(n - l)p2 + np = npq + n2p2

Or le moment centré d’ordre deux s’écrit :

~2 = m2 ~ mf = npq,

l’écart type a pour expression : (T = m.Il s’agit là des deux résultats essentiels de la loi binomiale ; et comme on va lc voir. seuls ces

deux premiers moments figurent dans la loi de Gauss-Laplace. Avant d’entreprendre l’étude decette loi, étudions la loi dc Poisson qui, elle aussi, est une loi asymptotique de la loi binomialeavant d’admettre elle-même la loi de Gauss-Laplace pour asymptote.

312

Page 300: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA LOI BINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE

2. Loi de Poisson

Nous envisageons lc cas où p (ou 4) est très petit, devant l’unité et où n est très grand sanstoutefois l’?tre suffisamment pour que l’on retrouve directement la loi normale, le produit p

doit être de l’ordre de grandeur de l’unité. Reprenons l’expression dc Pk :

n,!pk = /qn - k)!P

kqn-k = n(n ~ l)(n - 2). . (n - k + 1) l &

k!(l -p)” P (1 -PI”>

soit encore :

p, = w(,w - P) (n,p ~ 223) . (~LP ~ kp + P)k

k!(l ~ p)"(1 ~ PlrL,

ou bien :

p,x np(n,p~p)(np-2p)...(np-~p+1ï)k k!(l - p)k

(l- !Tfy .

Posons X = np, il vient :

P = X(X-p)(L2p)...(X--kp+p)k

/C!(l - p)" ( 11-x rr,

7-L

Comme X = n,p est de l’ordre de l’unité, il est grand devant p qui lui-même est, petit devantl’unité ; ainsi le numérateur du second membre tend vers Xk et (1 - p) k tend vers un. Il s’ensuitque, puisque n est grand devant k, nous pouvons écrire :

Or (1 ~ i) ” t,cnd vers exp(-X) quand n tend vers l’infini (résultat classique d’analyse). D’oùl’expression de la loi de Poisson :

Pk = ; cxp(-A).

La loi de Poisson dorme la distribution d’une variable aléatoire discrète qui peut prendre lesvaleurs entières non négatives (0, 1,2,. ,n, . ).

On dit que la variable X est répartie selon la loi de Poisson si sa probabilité est donnée parl’expression de Pk, quel que soit le paramètre X.

2.1. Propriétés essentielles de la loi de Poisson

Ayant effectué un certain nombre d’opérations sur la loi binomiale, il est indispensable de vhifierque la loi de dist,ribution proposke est bien normalis~c, c’est-à-dire : xr=, Pk = 1. En effet :

exp(-X) = exp(-X) 2 4T = exp(-X) exp(+X) = 1.k=O ‘!

313

Page 301: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

a - Moment du premier ordre

ml = M ( X ) = CkPk =Fk-exp(-A) =exp(-A)Ek-k=O k=O '! k=O Ic!

cc Ah-1

ml = X exp( -A) C ~ =x.

La moyenne de la variable aléatoire X qui prend les valeurs entières non négatives et qui suitune loi de Poisson est égale au paramètre A.

b - Moment du deuxième ordre

m2 = 2 k2Pk = Xexp(-A)k=O

Par le même procédé que celui que nous venons d’utiliser pour calculer le moment du premierordre, après avoir posé K = k - 1, nous obtenons :

O3 ( K + l)XKm2 = Xexp(-A) 1 K, =Xexp(-X)

K=O

Les deux sommes dans la dernière expression ont été calculées, il suffit donc de reporter leursvaleurs :

m2 = Xexp(-X)(l + A) exp(+X) = X2 + A.

Comme la variante D(X) = m2 - m:, on en déduit que :

D(X) = o2 = x

Donc le moment centré du deuxième ordre est égal à la moyenne, tous deux étant égaux auparamètre A.

Remarque 1 : On dit souvent que la loi de Poisson est la loi qui régit les événements rares, etl’on trouve une application importante dans l’étude des séries chronologiques, l’étude des filesd’attente ainsi que l’étude de la fiabilité.Remarque 2 : Soit & la probabilité pour que X > k, elle s’écrit simplement :

&= -&,&&.m=k j=o

c - Processus de Poisson - On considère une suite d’événements {E3} qui se succèdent dansle temps. Durant un intervalle fini de temps 7, le nombre k d’événements est aléatoire, et l’ondésigne par ?rk(r) la probabilité d’observer k événements pendant l’intervalle de temps 7.

La variable aléatoire discrète X attachée aux événements {Ej} est construite de la façonsuivante :

a. À t = 0, X = 0.b. X augmente d’une unité lors de l’apparition d’un événement.c. X conserve sa valeur tant qu’aucun événement ne se manifeste.

3 1 4

Page 302: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA LOI BINOMIALE. LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE

On définit alors un processus de Poisson de la manière suivante :

1. nk (7) ne dépend que de 7 et non de l’origine des temps 70.2. Durant un intervalle de temps infiniment petit dr, la probabilité d’apparition d’un événement

E est proportionnelle à d-r, et l’on désigne par dri(d-r) = T dr cette probabilité.3. La probabilité de voir apparaître deux événements ou plus dans l’intervalle de temps

infiniment petit dr est infiniment petite par rapport à dr.4. Si 71 et r2 sont des intervalles de temps sans intersection commune, alors les probabilités

Tu et Tu sont indépendantes.

Compte tenu de ces conditions, la probabilité de n’observer aucun événement durant le tempsinfiniment petit dr est :

d7ro( dr) = 1 - T dr.

À présent, on se propose de trouver la loi de distribution rk(r) de la variable aléatoire X,c’est-à-dire la probabilité d’obtenir exactement k événements durant l’intervalle de temps fini T.

Découpons l’intervalle de temps T en n sous-intervalles égaux de telle sorte que Ar = $ soitde l’ordre de dr.

La probabilité d’observer un événement dans chaque intervalle est donc rAr et la probabilitéde n’en observer aucun est 1 -rAr. Comme les événements sont indépendants dans les intervallesde temps disjoints de longueur AT, on peut considérer les n intervalles élémentaires comme nexpériences indépendantes pour chacune desquelles un intervalle élémentaire a la probabilité rArde voir apparaître effectivement un événement. La probabilité pour que k des n sous-intervallesaient vu se réaliser un événement est par conséquent donnée par la loi binomiale :

7rk(T) = c; (;)k ( 1 - z>“ç

On pose a = TT-, on obtient alors :

KiTI, = ci (!t)” (l- yk.

Il nous reste à étudier le comportement de Tk(r) quand n tend vers l’infini. Pour cela, il suffitde reprendre le calcul déjà effectué lors de l’établissement de la loi de Poisson, et avec la mêmetechnique, on trouve :

akeëa~.nk = )y

Donc, la variable aléatoire X suit une loi de Poisson de paramètre a.

Remarque : Au lieu de considérer le temps T, il est possible de s’intéresser à une distributionde points sur la droite ou dans le plan qui obéiraient aux mêmes propriétés que celles qui ontété définies à propos du temps. Il en est de même des points répartis dans l’espace.

d - Application de la loi de Poisson - Une petite route de campagne est fréquentée par 120voitures par heure en moyenne.

1. Calculer la probabilité RI pour que la route soit fréquentée douze fois en cinq minutes. :2. Calculer la probabilité Rz pour que la route soit fréquentée au moins une fois en cinq minutes.3. Calculer la probabilité R3 pour que la route soit fréquentée au moins sept fois en cinq minutes.

315

Page 303: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Le calcul de X s’effectue sur cinq minutes, on trouve alors :

Il s’ensuit que :

R1

= exp(-10)101212!

= 9,48 10p2 ;

R2 = 1 - P. = 1 ~ exp( -10) = 0,999 954 6 :

R3 = 1 - P. - PI - PJ - pi3 ~ P4 ~ F’, ~ Pc, ;

&=l-exp(-10) lO+~+$+~+$+$ 1 =0,86990.

3. Loi de Gauss-Laplace

Il nous faut rechercher la valeur asymptotiquc dc Pk lorsque n devient infiniment grand. C’estla formule de Stirling qui va nous permettre de développer les factorielles, donc la fonction àlaquelle nous allons nous intéresser est log,(Pk). Il y a alors deux façons de parvenir a nos fins.On développe log,(Pk) au deuxième ordre cc qui conduit à des longs calculs un peu fastidieux.Il est alors ncccssaire d’user de la formule de Stirling très complète :

n! = rP cxp(-n)JG(l + &7L)1

avec n=,, + 12

Un second procédé, moins rigoureux mais plus simple, consiste à choisir le maximum delog,(Pk) comme point autour duquel on effectue le dSveloppcment cn strie de Taylor, cequi a pour but de faire disparaître la dérivk prcmièrc dudit dcvcloppement. Dans cc cas.l’approximation :

log,:(n!) E n!log,(n) ~ n

sera suffisante. C’est cette méthode que nous présentons. On part donc de la relation :

log,(Pk) = nlog,(n) - n - klog,(k) + k - (n - k) log,(n - k)

+ (n - k) + klog,(p) + (n- k)log,(q).

À présent, on cherche le maximum de cette expression, il est donné par :

4 log,(Pk) = 0 = ~ log,(k) - 1 + 1 + 10gr:(n ~ k) + 1 ~ 1 + log,0f ,

on obtient alors :

(n - k)p = kq,

d’ou : lc = np.

C’est la valeur la plus probable, mais on a déjà vu que c’était aussi la rnoyenne ml de la loibinomiale. Calculons maintenant la dérivée deuxième :

316

Page 304: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA ~01 BINOLW~LE, LA LOI DE POISSON ET LA LOI DE CAUSS-L.~PLACE

d’où le développement en série de Taylor :

il s’ensuit que :

ou encore, si k devient une variable akatoire continue, la probabilité élémentaire dP = p(z) dzque la variable zc soit comprise dans l’intervalle (2, z + dz). est donnée par l’expression :

p(x) dz = P,,l,x exp(k - ml)2

~2s

dz.

La probabilité pour que la variable 2 soit plus petite que la valeur X s’écrit :

X

P(x < X) = pmaxJ (

e x p ~(cc ~ m1)2

2s 1dz,t.f

-00

Il reste à normer la distribution :

+oO +m

1= Pk dk = P,,,,

-x -x

(k-m)22s

dk = d%P,,rax.

De là on tire :

En définitive, on obtient :

1Pk = ~

a&G

(k - ml)”202 >

pour lc cas discret, et

pour le cas continu.

Cette loi joue un rôle privilkgié dans la mesure où dc nombreuses distributions admettent ladistribution de Gauss-Laplace comme loi asymptotique.

3.1. Propriétés essentielles de la loi de Gauss-Laplace

La loi est normalisée puisque nous venons de faire en sorte qu’il en soit ainsi.

3 1 7

Page 305: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

a - Moment du premier ordre

ml = & Jxexp (-(xig)2) dx = & T(x+m)exp (-$) dx

= *-Fexp (-$) d z + & /xeiw(-$) dz.

-03 -00

La première intégrale vaut m et la seconde est nulle puisque l’expression sous le signe sommeest impaire. Donc :

ml = m.

b - Calcul de la variante

+CC1

D(x) = ~a&G

J (x - m)‘exp (- (x ioy)2) dx = $ TX2 exp(-x2) dx

-CO 0

Nous allons intégrer par parties cette expression en posant :

u=x du = dx

dw = x exp( -x2) w = -a exp(-x2)

donc :

D(x) = $ [x exp(-x2)]lm + $ / exp(-x2) dz = c2.

0

Remarque : Dans les problèmes d’évaluation de la précision, on définit la grandeur h = &qui est appelée mesure de la précision (cf. sur ce sujet, la théorie des erreurs ou incertitudes).

c - Relation de récurrence entre les moments centrés - On pose :

+CC1

m, = ~ / (x - rn)” exp (- (x iUy)2) dz.afi

-cc

On effectue le changement de variable suivant :

ce qui donne :

tq exp(-t2) dt = Kq J T-~ exp( -t”) dt.

-cc

318

Page 306: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA LOIBINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE

L’intégration par parties permet d’écrire :

+CO

mq = KpJ

tq-‘t exp(-t2) dt

-03

1

+a> +CC

= Kq[{

- ;P exp( -t2) +rl-1~2 J

tqp2 exp(-t2) dt ;-cc -cc 1

donc : mq = (q - wwqq +co

2fi Jtqp2 exp(-t2) dt.

-03

Si l’on remarque que :

mq-2 = (afi)q-2 +mfJ-‘eXp(-t”) &fi J

on trouve en définitive :

mq = (q - 1)02mq-2.

Comme on connaît les deux premiers moments centrés me = 1 et mr = 0, il est aisé de formerla suite des moments centrés :

m2 = a2,m4 = 3c4,m6 = 1506,

tous les moments centrés d’ordre impair étant nuls.

d - La dissymétrie - Elle est donnée par l’expression :

L’étalon étant la courbe de Gauss-Laplace, 6 = 0 pour cette dernière.

e - L ‘aplatissement - Il est donné par une expression qui est telle que la loi de Gauss-Laplaceait un aplatissement nul :

f - Fonction de répartition de la loi normale - Il s’agit de calculer la probabilité de trouverune variable J: dans l’intervalle (a, b), sachant que sa distribution obéit à une loi gaussienne :

P(u < x < b) = Q(b) - @(a) = ~g& ]exp (-‘” iJj2) dt.

a

3 1 9

Page 307: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQTJEAPPLIQUÉ

Comme cette expression dépend de 0 et m, on prkf6rc utiliser la variable cent& rkduite, cequi conduit à la loi normale rkduitc. On pose alors :

.x - n-2.y = - * d,=-c-r (T

on aboutit alors à la relation :

On tabulc la loi réduite (m = 0; 0 = 1). soit :

on peut encore écrire :

De plus on a :

a+co) = 0;@(+co) = 1.

En outre: on vérifie que Q(X) est une fonction non décroissante car la fonction de distributionest définit positive.

On trouvera sur le Web (*) 1 c sous-programme gaussleg . h qui permet dc tabuler la loi normaler6duit)e.

g - Ecart le plus probable - On considère 1111 intervalle de largeur 2E centré sur la valeurmoyenne, tel qu’il y ait la probabilité 0,5 que l’événement étudié tombe dans cet intervalle. Onappcllc écart probable, l’écart ayant la largeur E.

Dans le cas de la loi normale, on trouve :

P(lX-ml <E)=0,5=24> E0

- 1.0

car : @(-y) = 1~ Q(y) ;

donc : Q E = 0,750 CT

ce qui dorme E = 0,674~~.

h - Application numérique - Lorsque p et 4 ne sont pas trop proches de zéro ou de ml, et à lacondition que n, soit grand, on peut utiliser la loi de Gauss-Laplace pour évaluer les probabilitésdes «jeux » relevant du schkma dc Bcrnoulli.

*http://www.edpsciences.com/guilpin/

Page 308: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA LOI BINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE

Exemple no 1 - On joue 800 fois à pile ou face, et l’on demande qucllc est la probabilitk pourque pile sorte moins de 360 fois (10 % inférieur à la moyenne).

n = 800; p = q = 0,s; rn = np = 400: u = Ji@j = 102/2:

soit < la variable réduite :

E=360 -400

1OJz= -2,828427125

il s’ensuit que (attention, ici. < est nkgatif) :

Exemple no 2 - On réalise 1000 parties d’écart{;, quelle est la probabilité de retourner le roiplus de 140 fois?

n=lOOO; p+;: q = i ; m = r~p = 125; (T = m = 10,458 ;

soit < la variable réduite :

E= 140 ~ 125=

10,4581,434 274 3 3 1

il s’ensuit que :i

P(x < <) = &~ jexp(-2) dy=0,076,

grosso modo entre 7 et 8 chances sur cent

i - Une application de la loi des grands nombres - La probabilité d’amener une face biendétermink d’un dé non pipi: est CI priori p = 1/6. On étudie lr rapport entre lc nombre de foisn où sort la face choisie et le nombre d’épreuves N.

Combien faut-il d’épreuves pour que la différence entre ce rapport et la probabilit,é a priorisoit inférieure à E = 1OF” en valeur absolue avec une probabilité supérieure à 7r = 1 ~ IOV”?

La condition à remplir est donc :

Ire approche - L’inégalité de Bicnaymé-Tchebycheff valable quelle que soit la distributionpermet de rkpondre à la question :

soit encore : P(IX - ml < t a ) 2 1~ p

321

Page 309: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Dans le cas précis, p = 1/6, q = 5/6, u = fi, $ = lOC”, puis :

P4&=tu=t - ===+JN

t2 = !!!? = 106Pq

d’où N = ‘3 = 1 4 I()l1&2 ’

épreuves.

L’inégalité de Bienaymé-Tchebycheff donne un nombre d’épreuves obtenu par une majorationexcessive puisque cette relation ne tient pas compte de la distribution effective de la variablealéatoire. Dans le cas où la loi de distribution est connue, le nombre d’épreuves sera très inférieurà cette première détermination.

2e approche - Compte tenu de l’ordre de grandeur du nombre d’épreuves, il est tout à faitlégitime de faire usage de la loi de Gauss-Laplace. On calcule alors l’écart réduit :

on a alors :

P=&rexp(-z) dt=29(P)=l-lO@

-0

d’où Q(p) = 0,4999995 e t p = 4,5.

On obtient : N = 2,8 106 épreuves.

4. Changement de variable aléatoire dans les lois de répartition

Soit y = 4(x) une fonction quelconque à dérivée 4’(x) positive et continue par morceaux sur lesegment (0, L), à valeurs sur (a, b) (cf. Fig. 20.1, page ci-contre).

Soit 77 = 4(E) une variable aléatoire, elle-même fonction d’une autre variable aléatoire <. Onse pose la question de connaître la probabilité de trouver dans l’intervalle (y’, y”) sachant quel’on connaît

5”

P(x’ < < < x”) =s

p<(x) dz.

2’

Soit x = @(y) la fonction inverse de y = 4(x), sur l’intervalle (a, b) avec 0 < 2 < L. On al’identité des événements :

e t

E {Y’ L rl < Y”}

EIVY’) I E L WY”))E {x’ < < 5 x”}

322

Page 310: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

20. LA LOI BINOMIALE, LA LOI DE POISSON ET LA LOI DE GAUSS-LAPLACE

IIIIII

I II’

I II’I

.

Figure 20.1. Changement de variable dans les lois de distribution. 0 X’

La probabilité de l’événement < est donnée par :

x” WY”)

P =J

pc(z) dz =J

pc(x) dz = P(x’ I < < 5”) = P(y’ 277 < y”).

5’ *(Y’)

Avec le changement de variable x = Q(y), on obtient la probabilité attachée à la variable q. Entenant compte du fait que dx = Q’(y) dy, on peut écrire :

IIY

IIY

IIY

P(Y’ 5 ~5 Y”) =J

PC(X) dx = J PEP(Y)IQ’(Y) dy = J Pu dy,

Y’ Y’ Y’

c a r 4’(x) = & e t1 1

Q’(y) = qÏ(q = Jqqy

En définitive, on obtient la distribution désirée :

{=

1

Pr7(Y)= Ps[Q(Y)I~,,~(~~~ si a 5 Y 5 b

0 si y < a et y > b.

Remarque : Pour éviter les omissions lors des changements de variable dans les fonctions dedistribution, il suffit de penser à manipuler non pas la distribution f(x) mais la probabilitéélémentaire dP, c’est-à-dire dP = f(x) dx pour que x soit compris entre x et x + dz, ainsi,en effectuant le changement de variable x = g(y), on obtient :

dP = f(x) dx = fbMl$ dy = fMyY)Idb) @/ = h(y) dl/.

3 2 3

Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Michaël 2 Sévrain
Page 311: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Exemple

On cffcctue le changement dc variable y = x2 dans la loi normale r6duitc :

On a donc : x = fi, et 1’011 note la fonction inverse Q = 4. On écrit, alors :

$ = Q’(y) z 12fi

1il s’ensuit, que : T(y) = ~ x

Y2*txp 2C--J.

Attention, la loi de probabilitt: que nous venons de trouver est deux fois t,rop petite car :

-,I.” II, ‘ Z

P(y’ < r/ 5 y”) = P(-x’ < < < -x”) + P(x’ 5 < < x”) =J

pc(x) dz +/’

p<(x) dz

-1.’ .IzII.x +”

= J [p<(-x) +pc(x)] dz =

.r’ -.d

En dkfinitive, la, densité dc probabilité s’écrit :

et 4Y) = 0 s i y<O.

Cet exemplr nous sera de quclquc utilité lors de l’étude dc la distribution du ,& à rn degrés deliberté.

5. Éléments de bibliographie

S. MVAZIAN (1970) Étude statistique des dépendances, Moscou.D.R. COX ct P.A.W. LEWIS (1969) L’analyse statistique des se’ries d’e’vénements, Éditions

Dunod.V. ROTHSCHILD et N. LOGOTHETIS (1986) Probahility distributions, Wiley.Y. ROZANOV (1975) Processrus uléutoires, Éditions MIR, Moscou.A.W. VAART et J.A. WELLNER (1996) Weak convergence an,d em,piricwl process, Springcr.H. VENTSEL (1973) Thborie des probabilités, Éditions MIR, Moscou.

3 2 4

Page 312: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

21 1 La fonction caractéristique

Certaines opérations mathématiques sont plus commodes à réaliser dans l’espace réciproque deFourier que dans l’espace direct (propriétés des espaces duals). En théorie des probabilités, ilpeut être plus simple de traiter ou bien de la fonction de distribution ou bien de la fonctioncaractéristique. Cela dit, il ne faut pas fonder trop d’espoir sur cette conception, c’est unetechnique parmi d’autres techniques. En effet, on se persuade des limitations pratiques de cetteméthode en consultant une table d’intégrales de Fourier : il y a peu de cas de figures. Quoi qu’ilsoit, la méthode offre un indiscutable intérêt tant théorique que pratique, aussi allons-nous yconsacrer un chapitre.

1. Définition et propriétésSoit < une variable aléatoire, la fonction caractéristique est donnée par l’expression :

Q(t) = M[exp(jtz)]

où M[ ] est l’opérateur moyenne.Si la variable aléatoire est discrète (k entier appartenant (-00; +co)), on écrit :

Q(t) = E p(k) exp(jtk).

Il ne s’agit simplement que du développement en série de Fourier de la probabilite. Q(t) estune fonction périodique de période unité.

Si la variable aléatoire est continue sur un intervalle fini ou infini, et si l’on désigne par p(z)la densité de probabilité, on écrit :

CD(t) = .I p(z) exp(jtz) dz.

Il s’agit de la transformée de Fourier de la densité de probabilité.En général, on peut écrire la transformation inverse :

s Q(t) exp(-jtz) dt.

325

Page 313: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.1. Théorème (sans démonstration)

Une distribution de probabilité est déterminée d’une manière univoque par sa fonction caracté-ristique.

1.2. Calcul des moments

Considérons le développement de exp(jtz) :

k=O

si les moments pk = hf[xk] existent pour k = 0, 1, 2,. . . , n+ 1, alors, compte tenu de la relation :

M[exp(jt<)] = 2 j” vtk + M[&J?+~] &,k=O .

on peut alors écrire :

avec :

Ainsi, on trouve :

po = <f>(O) = 1,

pk=j.-kdk)(O), pour k = 1,2,. . , n.

On peut donc calculer les moments pk = M[zk] à partir des dérivées de la fonction caractéris-tique de la variable aléatoire.

1.3. Propriété de la fonction caractéristique

La somme des variables indépendantes :

t = El+12 + ... +En

a une fonction caractéristique de la forme :

CD(t) = @l(t) . ?Dz(t). . . a?,(t)

qui est le produit des fonctions caractéristiques de chacune des variables aléatoires indépendantesEl, 12, . . . , In. Cela découle de la relation de définition :

M[exp(jtz)] = M[expjt(zl + x2 + . +Ch)]= fihl(eXp(jtxk)].k=l

326

Page 314: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

21. LA FONCTION CARACTÉRISTIQUE

1.4. Cas particulier de la somme de deux variables indépendantes

La fonction caractéristique de la somme de deux variables indépendantes est donc le produit dechacune des deux fonctions caractéristiques, soit :

a(t) = a+(t) . @z(t).

La transformée de Fourier inverse va transformer ce produit simple en un produit de convolution,nous obtenons :

+YP(X) = / rI,cx - t) . n,ct> dt

-cc

expression dans laquelle &(t) est la transformée de Fourier de @k(t), Ic = 1,2.

1.5. Quelques autres propriétés importantes

Soit une variable < de densité de probabilité p(z). La fonction caractéristique de cette variables’écrit donc :

+‘Xa(t) = J p(x) expjzt dz.

-mLa variable [In, ayant la densité de probabilité np(ny), admettra comme fonction caractéristique(après changement de variable) :

+CO +CO

J p(x) expj:t dz = J p(z)expjhzdz=@

-00 -00

ce résultat étant obtenu par application directe de la définition. Dans le même esprit, la moyenne< d’une somme de variables indépendantes de même densité de probabilité p(z) :

2 = I(x1 + x2 +. . + x,)nadmet comme fonction caractéristique :

Dans bien des cas, on s’intéresse aux logarithmes de la fonction caractéristique :

Q(t) = l%P(t)l.En particulier, dans le cas de la dernière variable [, la fonction @(t) s’écrit :

e(t) = nlog, Q i .[ ( )1Si par hasard @ 4

0

t2admet un développement du genre 1 - - lorsque n est grand devantn 2n

t, on aura toutes les chances de montrer que 5 obéit à une loi gaussienne puisque la fonctioncaractéristique sera gaussienne.. .

327

Page 315: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.6. Exercice

a. Soit deux variables aléatoires indépendantes & et &, qui sont toutes les deux normales(gaussiennes) centrées et réduites. Calculer la fonction caractéristique de chacune d’elle, puisla fonction caractéristique de la variable 7 = [i + [2. En déduire la fonction de distributionde q.

b. Les variables indépendantes sont toujours gaussiennes mais ne sont plus centrées réduites.On désigne par ml et m2 les moyennes respectives et par g1 et 02 les écarts quadratiquesmoyens. Donner la fonction de distribution de 7 = <i + <a.

c. Généraliser le calcul précédent du §b en considérant la variable

puis en déduire le théorème d’addition des moyennes et le théorème d’addition des variantes(écart type élevé au carré).

2. La distribution du x2

On se propose de rechercher la fonction caractéristique, puis la distribution, de la variablealéatoire :

xi = l$; + E; + . . + E,2,qui est la somme des carrés de variables aléatoires, indépendantes, gaussiennes centrées réduites.Chacune de ces variables gaussiennes variables à une densité de probabilité de la forme :

T~(X) = &exPX2

c--j2 avec x E (-co;+oo).

Il s’ensuit que les variables (32 ont une densité de probabilité de la forme :

Pj(Y) = & expY

C--l2si y E (0; +co)

&(Y) = 0 si y E (-co;O).

Compte tenu de ce que :

+oO

l?(z) =J

tz-’ exp(-t) dt (fonction gamma),

0

on obtient la fonction caractéristique de la variable <,f :

+CC +03pk(x)exp(jtx) dz =

+oO1 J xp1j2 exp(-x) dz = I’(1/2) 1

y/- &(Fijij= (1 - 2jt)-i’2.

0

328

Page 316: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

21. LA FONCTION CARACTÉRISTIQUE

Il s’ensuit que la fonction caractéristique du xz, à n degrés de liberté :

ca(t) = (1 - 2jt)-“‘2 pour t t (-00; +oo).

Pour obtenir la fonction de distribution, il n’est pas utile de calculer la transformée de Fourierinverse, pour cela il suffit de remarquer que :

+CC

As

$14-1 exp exp(jtz) dx = (1 - 2jt)-1L’2

0

A étant un coefficient de normalisation. Donc la densité de probabilité du xi s’écrit :

pour II: E (0; +co),

avec

1A = 2’W(n/2)

d’où l’expression de la distribution du x2 à n degrés de liberté :

1dx) = 2+r(7+) x

n/2-1 exp -- .( >2

3. Éléments de bibliographie

M. FISZ (1980) Probability theory and Mathematical Statistics, Robert E. Krieger publishingcompany.

E. LUKACS (1964) Fonctions caractéristiques, Dunod.R. PETIT (1995) L ‘outil mathématique, Masson.Y. ROZANOV (1975) Processus aléatoires, Éditions MIR, Moscou.H. VENTSEL (1973) Théorie des probabilités, Éditions MIR, Moscou.

329

Page 317: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

22 La loi du x2:= ::-:- _” .-;,: :_,st _;s: . . . .- ;,;i,,-.- “‘“-. et la loi de Student

L’étude des critères de conformité va nous conduire à étudier la distribution d’une somme descarrés de n variables gaussiennes indépendantes (centrées réduites), il s’agit alors de la loi duxi à n degrés de liberté.

Lorsqu’on aborde l’étude de la corrélation et de la régression, l’évaluation des intervalles deconfiance conduit inévitablement à l’étude de la distribution de Student qui est la distributiond’une variable gaussienne (centrée réduite) divisée par la racine carrée de la moyenne d’un ~2à m degrés de liberté, ces deux variables étant indépendantes.

Ce chapitre est donc destiné à la présentation desdites lois qu’il convient de bien manipulerpour exploiter correctement les données expérimentales.

1. La loi du xiNous avons établi au précédent chapitre la loi de distribution d’une somme de n variablesgaussiennes centrées réduites, indépendantes, élevées au carré et nous nous proposons d’enétudier les principales propriétés. Auparavant, nous allons effectuer quelques rappels concernantla fonction I’(z) (fonction gamma ou fonction eulérienne de deuxième espèce) qui est étroitementliée à la loi du xi :

r(m) = (m - l)!

lY(1/2) = fi

I?(n + 1/2) =1 x 3 x 5 x . . (2n - 1)

2’” fi

+CC

et : ryz) = .I P-l exp(-t) dt.

0

La densité de probabilité de la loi du xt à n degrés de liberté est donnée par l’expression :

1pn(z) = 2n/2r(np)

&2-1 exp -z( >2

pour z E (O,+ca),

tandis que la loi de répartition s’écrit :

1 x n/2-1Ln(z) = 2n/2r(n/2) J y

e x p -y( >2 dy

pour 2 E (0, +co).

0

331

Page 318: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.1. Vérification de la normalité de la loi

Il s’agit de calculer L,(w), on a donc :

e x p -i( 1 dy.

0

Effectuons un changement de variable u = y/2, on obtient :

(2u)1 cc

n’2-1 exp( -u) du = ~r(nP) s

u7’/2p1 exp(-u) du = 1

0 0

1.2. Calcul de la valeur moyenne

Nous voulons calculer la moyenne de la variable xk :

1 m 71/2%1"(x3 = p/2r(n/2) s yy

e x p -; dy,( >

0

le même changement de variable que celui effectué dans le paragraphe précédent permet d’écrire :

d’où :

1.3. Calcul de la variante D (xz)

Au préalable, on calcule le moment d’ordre deux que l’on note m2 :x

m2 (xi) = 2TL,2r(11,2)s y0 0

1= 2+qn/2)

2n/2+2r(n/2+2)= (m+L)m.

Comme on a :

D (X~L) = m2 (xi) ~ M2 [Xi1 ?

on en déduit :

D (xn) = 2n.

On donne sur le Web(*) 1e sous-programme khi2. h qui permet de tabuler la loi du xfT, à mdegrés de liberté.

*http://www.edpsciences.com/guilpin/

Page 319: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

22. LA LOIDUX~ ET LA LOI DE STUDENT

2. Distribution d’une somme de deux variables aléatoires indépendantesobéissant chacune à une distribution du xi

On considère une variable 0 qui est la somme de deux variables aléatoires indépendantesobéissant à une loi du x2 l’une à n degrés de liberté, l’autre à m degrés de liberté :

La fonction caractéristique de 0 est donc :

alors, en faisant n = n + m dans les relations établissant la loi du xi dans le paragrapheprécédent, on en déduit :

+oOA

J’p+"")/2-1

exp exp(jtz) dz = (1 ~ 2jt) P(n+7n)/2

avec

1A = 2(‘r”+“1)/2r[(n + m)/2] .

Il s’ensuit que la fonction de distribution s’écrit :

P(Y) = 2(“+,r4,21.;n + rrl),2] Y(“+“)‘2-1 -4) ((!J j

on en conclut que la distribution d’une somme de deux variables indépendantes obéissantchacune à une distribution du x2 respectivement à n et m degrés de liberté est encore unedistribution du x2 mais à m + n degrés de liberté. Il est aisé de généraliser :

Théorème - Une variable qui est la somme de m variables aléatoires indépendantes obéissantchacune à une distribution du x2 obéit encore une distribution du x2.

3. La loi du xk à m degrés de liberté tend asymptotiquement vers la loide Gauss quand m tend vers l’infini

Exprimons la loi du xz,, à m degrés de liberté en variable centrée reduite, en rappelant queM[x] = m et D[z] = 2m (cr = 6) :

x - m

y= J%i’

on obtient :

Pm(YY) =6

2”12r(m/2)(Gy + m)mj2-1 exp

i

- 66; +m)

3 3 3

Page 320: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Passons aux logarithmes :

log,[p,(y)] = Cste + : log,(m) - F log,(2) - y log,L ( >

y + y

- floge(

m-22

>

m-2 m-2+-2 loge(m) + 2 loge

i

lf1Jm

F2

en remarquant que :

log, 1+* =-jL$+...

( 1

tous calculs faits, quand m tend vers l’infini :

log,[p,(y)] = Cste - f,

d’où :

avec A = &

On reconnaît la loi normale réduite.

4. Distribution d’une variable aléatoire fonction de deux variablesaléatoires indépendantes

On considère la variable aléatoire r qui est une fonction de deux variables aléatoires indépen-dantes x et 7. On désigne par J+(X) et ~+(y) 1 es fonctions de distribution de ces deux variables.A priori et sans nuire à la généralité, on peut convenir que ces fonctions sont définies sur(-ca, +a). Nous avons donc :

et nous voulons obtenir la distribution pT(t) de la variable aléatoire T. Comme les variables sontindépendantes nous avons :

PT(t) =Pc(x) .PTl(Y)

On cherche à expliciter p7(t). P our cela on va rechercher la répartition PT(a) pour quef(z, y) < (Y. Cette répartition ne sera rien d’autre que l’intégrale de pc(z) . ~~(y) étendueau domaine f(z, y) < 0. Soit :

PT(a) =SS

P&$ . PV(Y) dx dy.

f(z,v)<a

334

Page 321: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

22. LA LOIDU x2 ETLA LOIDE STUDENT

4.1. Cas particulier no 1

Dans le cas où l’on peut écrire z = c&(y), alors on effectue un changement de variables trèsintéressant à savoir :

2) = Q(y) et x = UV.

Le jacobien de la transformation s’écrit :

Ainsi, P,(o) devient :

a +CC

P,(Q) =s s

du P~(U. v) .p, [W’(v)] # du = ] pt(u) du.>

-cc -ca -00

Application au rapport de deux variables indépendantes - La variable Q est donc un rapport :

Q = XlY,

et l’on effectue le changement de variables :

y=v et y=u.v

dans ce cas, le jacobien de la transformation devient :

8(Xc,Y) 21 21 =v-=/ /Lqu,v) 0 1

d’où :CY +a

PT(a) = dus s

PE(U . v) P,(V)V du.-CO -00

Remarque importante - Il convient de prendre garde aux signes de la distribution au cas oùla variable q de distribution ~+(y) est définie sur (-oo, +03) :

II&4 = +j%d .P,(+ du - .ï PE(U.~) .P,(v)v du.-cc

En effet une densité de probabilité ne peut pas être négative et, seule, dans ces expressions,la variable u change de signe en franchissant la valeur zéro.

4.2. Cas particulier no 2

Dans le cas où l’on peut écrire z = Q: + Q(y), alors on effectue un changement de variables trèsintéressant à savoir :

v = @(y) e t x=u+w.

3 3 5

Page 322: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Le jacobien de la transformation s’écrit :

1 1

8(X> Y) 1 1

a(? u) =O Tvdv

dy dy

Ainsi, PT(a) devient :

Application à la somme de deux variables indépendantes - Donc la variable cv est une somme,on a alors :

a!=x+y

on effectue alors le changement de variables :

y=u et 2=7l-U

dans ce cas, le jacobicn de la transformation devient :

8(X> Y) 1 -1

-=l lqu, Il) 0 1 = 1

d’où :N +CX

PT(Q) = J Jdv P~(U - ~1 .P~,(v) du.-00 -cc

On retrouve le résultat que nous avions établi à l’aide de la fonction caractéristique,

5. La distribution de Student (W. Gosset) (1876-1937)C’est la distribution de la variable aléatoire :

expression dans laquelle < est une variable gaussienne centrée réduite (indépendante de x2) deloi de distribution :

Pc(Y) = & expY2

(k).2

Il sera aisé d’appliquer les résultats du paragraphe prccédent lorsque nous connaîtrons la

distribution p,(y) de la variable q = Il convient pour ce faire d’effectuer un changementde variable :

x = my2 pour x E (O,+oo).

336

Page 323: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

22. LA LOIDUX~ ETLA LOIDE STUDENT

On peut écrire :

y = !D(z) LG = Q(y) W(y) = 2my.

La distribution devient donc p,(y) = p[Q(y)]V(y) soit :

P,(Y) = 2m,2r(m,2) (my2)7rL/2-1 exp (-$1 2my = 2”L!J~1~m,2)y”“P1 exp (-$1

pour 2 E (O,+m).

La distribution pm(t) de la variable t s’écrit alors :

+CEPm(t) = J’ p<(t . v) P,~,(v)v du =

mm/20 dz+“+T(m/2)

mm/2x exp Tymexp [-“” (I+ ;)] d y ,

&G2m/2-11T(m/2) o

on pose :

soit

2 uY ’

i-m l+c

( )m

on trouve alors :

m7n/2 +CCp7n(t) =

m&G2’n/2-1r(m/2) s0

0

la quantiti: sous le signe s n’est rien d’autre que I’[(m + 1)/2], en définitive, on trouve :

p (t) = r[(m + 1)/2] t 2 p(7n+1)‘2m *l?(m/2) ’ + ii[ 1

pour t t (-cm, +co)

5.1. Vérification de la normalité de la loi

Il s’agit de calculer R,,(co), on a donc :

h,(m) = Y(m + 1)/21 +i>o- J’ [l + ;] -h+l)P dt,

d=wml2) -00

3 3 7

Page 324: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Posons y = et, nous obtenons :

*,(a) = ,rb + 1)/21 +cc&r(m/2) o b+ y J-s

2 (m+1)/2 dy

= 2rKm+ 1)/21 +O” -1Jz(m/2) o y y [l +y 1J

2 -(m+l)l2 dy

maintenant, il suffit de poser u = y2, ainsi du = 2y dy et l’intégrale se transforme :

1 du= r[(m+1)/21B 1 m+lJ;I[l + u](m+l)P 4z(m/2) 2’ 2

expression dans laquelle B(z, y) est la fonction eulérienne de première espèce qui s’écrit :

donc :

*m(m) = mm + l)Pl r(wr(w) = 1.firw) ’ rb + wi

5.2. Calcul du moment du premier ordre

Le résultat est nul car la fonction sous le signe somme est impaire.

5.3. Calcul du moment du deuxième ordre

Il nous faut calculer :

qt, = ,um + 1)/21 +coJ t26rw) o [ 11+g

(m+l)/z dt*

Les mêmes changements de variable utilisés pour vérifier la normalité de la loi conduisent auxrésultats suivants :

Jl(m + 1)/21D(x) = m fir(m/2)

r[(m + 1)/2] r(3/2)r(m/2 - 1)$???) =m fir(m/2) . r[(m+1)/2]

m 1 m

2m=-----’- - 1 m - 22

On en conclut que :

/m(T= -.

m - 2

3 3 %

Page 325: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

22. LA LOIDUX~ ETLA LOIDE STUDENT

On donne sur le Web (*) 1 e sous-programme student . h qui calcule les valeurs de la distributionde Student quel que soit le degré de liberté m.

6. La distribution d’une somme de deux variables aléatoires indépendantesobéissant à une distribution de Student est-elle encore une distributionde Student?

La réponse est non. Soit T = em + qn une variable aléatoire somme de deux variables aléatoiresindépendantes obéissant chacune à une distribution de Student respectivement à m et n degrésde liberté. Soit (a(t) la fonction caractéristique de trn. Nous avons (en prenant la transforméede Fourier réelle car la distribution de Student est symétrique) :

qt) = 2rlKm + 1)/21 +cas cos(ty)&r(m/2) o [l + y2](m+1)/2 dy

qt) = ,wm + 1)/21 1 Xfifir(m/2) ’ Z ’ r m + 1 Km’2(t)’

( 12

expression dans laquelle Km,2(2) est la fonction modifiée de Bessel de troisième espèce. Lafonction caractéristique de 7, s’écrit :

le produit des fonctions caractéristiques donne une fonction que l’on peut écrire d’une façonsimplifiée : A(m, n)K,,2(x)Kn,2(x). Malheureusement, le produit de deux fonctions modifiéesde Bessel n’est ni une fonction modifiée de Bessel ni une somme de deux fonctions modifiées deBessel, il s’ensuit que la transformée de Fourier inverse n’est pas une distribution de Student.

7. La loi de Student à m degrés de liberté tend asymptotiquementvers la loi de Gauss quand m tend vers l’infini

Comme la loi est symétrique, il suffira d’effectuer un développement de MacLaurin (au voisinagede zéro). La densité de probabilité s’écrit :

rb + WI29m(x) = fir(m/2) ’

[ 11 + 2’ (m+l)P ’

mEn passant aux logarithmes, on trouve :

m - l m - l

( >

m - l m - llog,(6,(x)) = Cste + 2 1% 2 - -2+ ;1og, -

( >2- f loge(m)

m - 2 m - 22 ( >

m - 2 m - 2- -log, 2 + 2 - ;1og, 2

( >

m + l- ~ log,

2 ( 11,;

*http://www.edpsciences.com/guilpin/

339

Page 326: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

soit encore :

log,(G,(z)) = Cste + F log, y> - ilO& (Y) +1og, (F)

m-1+ ilog, ~

( >

mflm - 2 ~ ; h%(m) - 2 1%

( >1+;

= Cste + ~log~(~)~~log~~[‘ini-,~)]-~log~(l+~).

Quand m est grand devant l’unité, on peut écrire :

h,(%(~)) = log,(W - $

expression dans laquelle K est une constante numérique que l’on détermine par normalisationde la distribution. On en déduit :

I~~(Z) ===s K e x p -g( )

On reconnaît la loi normale et par conséquent la constante K vaut & Quand le nombre de

degrés de liberté croît, la loi dc Student tend vers la loi normale. On pourra aussi s’en convaincreen consultant directement les tables numériques.

8. Éléments de bibliographie

S. AÏVAZIAN (1970) Étude statistique des dépendances, Éditions MIR, Moscou.E. LUKACS (1964) Fonctions caracté%tiques, Dunod.V. ROTHSCHILD et N. LOGOTHETIS (1986) Probability distributions, Wiley.Y. ROZANOV (1975) P rocessus aléatoires, Éditions MIR, Moscou.H. VENTSEL (1973) Theorie des probabilités, Éditions MIR, Moscou.

340

Page 327: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 23 Systèmes à plusieurs variablesaléatoires

1. Généralités

Il s’agit de gén&aliser un certain nombre de notions afin de les étendre aux systèmes de plusieursvariables aléatoires ct plus spécialement aux systèmes de deux variables aléatoires qui vontretenir notre attention lors de l’étude de l’analyse de corrélation-rCgression.

L’apport essentiel de ce chapitre sera l’étude de la matrice de covariance ct de la matrice dccorrélation.

2. Système de variables aléatoires, fonction de répartition

On considère deux variables aléatoires X et Y qui pourront éventuellement fîgurcr l’abscisseet l’ordonnée d’un point du plan. Il est alors tentant de penser que les proprii:tés du systèmedépendent uniquement de celles de chacune des variables ; il n’en est rien et il convient de tenircompte de leur interdépendance. Bien entendu, ces propos se généralisent au cas de 7 ~ variablesaléatoires X1, X2, . . . , X, dont le point figuratif appartiendra à un espace à T-L dimensions.

2.1. Définition

On appelle fonction de répartition d’un système de deux variables aléatoires X et Y, laprobabilité de vérifier simultanément les deux inégalités :

X<C e t Y < q.

Elle est définie par l’expression :

JqE,q) = P(X < E,Y < rl)

(cf. Fig. 23.1, page suivante) et cela revient à dire que F(I, 7) est la probabilité de se trouverdans le quadrant hachuré de la figure c-contre. Désignons par 4(t) 1 a fonction dc rkpartition dela variable aléatoire X toute seule, ct par $(q) 1 a fonction de répartition de la variable aléatoireY t,oute seule.

3 4 1

Page 328: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Yl

Figure 23.1. Fonction de répartition, à deux dimensions.

2.2. Propriété de F(g, 7)

1. C’est une fonction non décroissante des deux arguments :

s i <>a =+ F(E, 7) 2 F(c-u> VI

si 72 P ==+ F(t, v) 2 F(rl,P).

2. F([, -CO) = F(-CO, r/) = F(-CO, -CO) = 0.3. F(E, +m) = 4(E)4. F(+mrl) = v477)5. F(fc0, +oo) = 1.

2.3. Probabilité pour qu’un point aléatoire (a, p) appartienne à un domaine rectangleparallèle aux axes

Soient A, B, C et D les quatre sommets du rectangle dont les côtés sont parallèles aux axes.

A = (a, d) B = (b,d) c = (b,c) D = (qc).

Il s’agit en fait de trouver a < cy < b et c < 0 < d qui représente la probabilitk de tomber dansle rectangle :

P(cq p) = F(b, d) ~ F(a, d) - F(b, c) + F(a, c).

Cette probabilité peut s’exprimer en fonction de F(z, y) qui à son tour s’écrit comme uneintégrale double :

z ?4

F(?Y) =SJ’

f(w P) da d/J.-00 -00

3 4 2

Page 329: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

23. SYSTÈMES À PLUSIECJR~ VARIABLES .~L&~T~Hw~

3. Variables aléatoires liées et indépendantes

Rcvcnons au cas de deux variables aléatoires X et Y. Le problème fondamental est dc savoirquelle est la dépendance mutuelle des deux variables (ou l’absence de dépendance).

On dit que la variable aléatoire Y est indkpendante de la variable alkatoire X si la loi derkpartition de Y ne dépend pas de la valeur prise par X. Soit :

f(ylx) = ‘$(y) quel que soit 2.

En revanche, si Y dépend de X, on a :

f(~Ix) # $(Y) pour tout 2.

La dépendance de X et de Y est mie propriété mutuelle des deux variables. Autrement dit, si :

f(ylz) = $(y) cela entraîne f(ziy) = d(z).

Dans ce dernier cas, on dit que les variables aléatoires sont indépendantes, car la loi derépartition de chacune des variables ne dépend pas des valeurs prises par l’autre. Dans le cascontraire on dit qu’elles sont dépendantes ou liées.

Quand X et Y sont des variables indépendantes, la fonction de rkpartition f(z, y), est leproduit des fonctions de repartition de chacune des variables X et Y ; soit encore :

f(T Y) = 4(x)+(Y).

Réciproquement, si f(z, y) est le produit de deux fonctions indépendantes C#I(Z) et $(y), alorsles variables aléatoires X et Y sont indépendantes et, cela constitue un critère pour juger del’indépendance des variables.

On peut dire que deux variables sont dependantes quand elles ont une tendance plus ou moinsmarquée à varier simultanément.

4. Caractéristiques numériques, covariance, coefficient de corrélation

Par définition lc moment non centré d’ordre (k, s) du système de deux variables X et, Y estl’espérance mathématique du produit ~?y’, et l’on écrit :

1*1k,,5 = ïbf[x”y”].

Le moment centré s’écrit :

en désignant par x0 et y0 les variables centrées :

xO=x-mlJ

Y0 = Y - mo.1.

On peut encore écrire :

rnk,,s = y ~X~y;r),j

343

Page 330: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

expressions dans lesquelles piy = P(z = zi; cy = yj). S’il s’agit de variables aliktoires continues.110us écrirons :

+C.Z

mk,.? =SJ'

.xky,y(x, y) dz dy

-x

+CL%

et pk,,s =11

(x ~ m,.)“(y ~ mJ,).5,f(:q y) dz dl/.

-M

D’un point de vue strictement pratique, seuls les moments d’ordre 1 ct 2 sont utilisk : soit :

m ~ mi.0 = Af[xlyO] = M[x].î -

m 1/ = rn(j.1 = M[x”y’] = M[:I/]

et

D, = mz,o = M[x$y~] = M[xi] = D[z] = ~7,:

D, = rr~~),~ = M[&;] = M[?/;] = D[y] = 0;.

Pour ce qui concerne les moments mixtes, seul le premier ,joue vraiment un rôle import,ant :

ml.1 = Af[xlyl]

dont la forme centrée s’écrit :

ceci est simplement la moyenne du produit des variables akatoircs cent,rées. Ce moment mixteporte WI nom particulier, il s’agit de la covariance que l’on krit :

K,,., décrit la liaison de X et de Y. Si X et Y sont des variables alCat,oircs indépendantes.alors Krx:.y = 0. Autrement dit, puisque f(x, y) = 4(z)+(y), on a alors :

+CG

K ~X..Y ~ I’ (x ~ m,;)qb(x) dz r(g - q,)$(r/) dy = 0.

4.1. Remarques importantes

a - Non seulement Kc,J,rl caractkrisc la liaison de X et de Y mais aussi la dispersion dc chacunedes variables. Ainsi, si une des variables s’karte peu de sa moyenne (faible variante), il en résultewe Kz.y reste faible même si X et Y sont i%roitcment litcs. Pour pallier cet ennui. c’est-à-direpour caractériser uniyuernent la liaison des variables, on dkfinit le coefficient de corrélat,ion des

344

Page 331: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

23. SYSTÈMES À PLUSIEURS VARIABLES ALÉAT~IR~~S

deux variables X ct Y eu divisant Kz,y par l’kcart t,ype de chacune des variables, soit a,r et og.On définit alors :

&.yr:,:.y = d>

fl:rclJon notera que ce rapport est adimensionnel. Ici encore, si X et Y sont indépendantes, alorsI’.r.,y = 0.

Attention, la proposition réciproque est fausse. Si deux variables aléatoires X et Y ont uncoefficient de corrklation nul (TT,y = 0), cela ne signifie pas que X ct, Y sont des variablesindépendantes.

Lc fait que r’s,l/ soit nul signifie non pas que les variables soient indépendantes mais qu’cGsne sont pas linéairement dépendantes.

Il est, possible de t,rouver IIII exemple sirnple qui moutre que des variables X et Y noncorrélées sont cependant dkpendantes. Considérons deux variables alhtoires X et Y répartiesuniformhnent à l’intérieur d’un cercle dc rayon R centré à l’origine des coordonnées. La densitéde probabilité s’écrit :

f(z; y) = p pour 2’ + y” < R2e t f(:r, y ) = 0 ailleurs.

La normalisation dr la densité dc probabilité donne la valeur dc 11 :+CC +CC

l= JJ j-(x: y) <1:x: dy = JJpdz d y ==+ p=&.-x -00

Les variables sont dépendantes puisque, pour y fixC: dans le cercle, z ne peut pas prendre n’im-porte quelles valeurs: mais seulement celles comprises dans l’intervalle (- Jm; Jm)ou encore si IC = R: y = 0. Exprimons la covariance : elle est, nulle puisque la moyenne de z et,la moyenne de y sont nulles.

Kz,,, = 0.b - Le coefficient de corrélation caractérise non pas une relation quelconque entre deuxvariahlcs, mais une relation linéaire. Quand une des variables croît, l’autre suit une loi linéaireau sens des probabilités ct le coefficient dc corrélation indique le «degré » de cette dépendancelinéaire. Dans le cas dkme relation fonctionnelle linhire exacte, on a :

autrement dit lorsque Y = aX + h. Si la loi de dépendance linéaire est quelconque, alors IIOUSavons :

- 1 I T:z,y < +1.

la corrélation étant positive ou négative. Nous allons démontrer ces résultats au paragraphe 6.

5. Généralisation au cas de plusieurs variables

Il n’y a pas de difficultk à étendre ces résultats au cas de plusiews variables aléatoiresXI, X2, . , X,, ; ainsi, la covariance et la corrélation SC calculent, pour toutes les variables prisesdeux à deux. Si les variables sont au nombre de n, alors il y a n2 coefficients de covariancc et n2coefficients de corrélation. Dans chacun de ces deux cas. les coefficients sont naturellement lesPléments d’une matrice carrée d’ordre n.

345

Page 332: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NU&RIQUE APPLIQUÉ

5.1. Matrice de covariance

Notons ses éléments /CL,. Elle est évidemment syrnétrique puisque le produit est une opérationcornmutativc : kjc,, = kfj.

D’autre part, k,i = D, qui est, la variancc de Xi.

5.2. Matrice de corrélation

Notons ses Ckmcnts T;~. Elle aussi est évidemment symétrique et :

6. Quelques théorèmes importants

Soient X et Y deux variablts al6atoires quelconques; elles prennent respectivement les valeurs~1,.~2,...,.~n,Y1,Y2,... , ? J m . Soit g(z, y) une fonction de deux variables offrant les bonnes qualit&usuelles de régularitk, et pij la probabilité pour que X = zi et Y = Y,~. La moycnnc dc la fonctiong(zi, y-,) est alors donnée par l’expression :

et la forme continue :

M[g(X, Y)] = sJ’g(x, y).f(x, y) dz dy

expression dans laquelle ~(CC, y) est la densité de probabilité des deux variables aléatoires Xet Y.

Nous allons utiliser ces expressions en écrivant :

g(X,Y) = X + Y e t g(X,Y) =X.Y

6.1. Moyenne d’une somme de variables aléatoires

Il 11011s faut calculer MIX A Y] dont, l’expression s’écrit :

Or CyT1pii n’est, rien d’autre que la probabilitk p, que la variable X prenne la valeur 2, etCy=, p,,) la probabilité pj que la variable Y prenne la valeur yj. D’oh les cxprcssions qui suivent :

,S,

Mlx + y] = C(xiPi) + fJ(yiPJ)? 1 1 j=l

M[X + Y] = M[X] + M[Y].

346

Page 333: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

23. SYSTÈMES À PLUSIEURS VARIABLES ALÉATOIRES

On démontrera évidemment le même théorème en ce qui concerne les variables continues.Insistons sur le fait que cette relation est indépendante du fait que les variables aléatoires soientindépendantes ou non. Ce théorème est susceptible d’une genéralisation simple :

M 2xi =CM[X,].I 1i=l ?=l

6.2. Variante d’une somme de variables aléatoires

Nous allons calculer D[X + Y]. Après avoir posé 2 = X + Y, on passe aux variables centréesque l’on indice avec un zéro :

2, = X” + Yo.

On obtient alors les expressions suivantes :

D[X + Y] = D[Z] = M [Z;] = M [Xi] + M [Y;] + 2M [XoJ$] = D[X] + D[Y] + 2Kz.,.

On note alors que la variante de la somrne de deux variables aléatoires est la somme et deleur variante respective augmentée de deux fois la covariance.

Ici encore il est intéressant de généraliser à une somme quelconque :

Li=l J %=lr n i 7L n

Li=l 1 i=l j=l

et l’on remarquera que la variante de la somme de variables est égale à la somme des variantesde chacune des variables si celles-ci sont toutes indépendantes.

6.3. Moyenne d’un produit de variables aléatoires

Il nous faut calculer M[X Y] dont nous obtenons l’expression à partir de la covariance :

Kcz,, = M [X, Y”] = M [(X ~ m,) (Y - m,,)]

m, = M[X] e t m, = M[Y].

Le développement de l’équation donne :

K z,, = M[X . Y] ~ mEM[Y] - m,M[X] + m,m,

ii,,, = M[X . Y] ~ m,m, = M[X Y] ~ M[X]M[Y]

M[X . Y] = M[X]M[Y] + Kz,u.

Si les variables sont indépendantes, Kz,y = 0, et la moyenne du produit est égale au produitdes moyennes. On généralise ce théorème au cas d’un produit de n variables aléatoiresindépendantes : 71,

M nXi = fiM,Xi].I 1i=l i=l

347

Page 334: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NTJMÉRIQUE APPLIQUÉ

6.4. Variante d’un produit de variables aléatoires

Il nous faut calculer D[X . Y]. pour cela posons 2 = X Y :

D[X Y] = D[Z] = M [Z;] = M [(Z - m,Jz]

avcvcc

m, = M[X . Y] = rr~,~rn, + Kz.,

D[X.Y] =M [Z” +m; - 2m,Z] = M [Z”] + mz - 2m,M[Z] = M [Z”] ~ mi

= M [X”Y”] - 2(m,m, + K:,J.y)M[X . Y] + (m,m, + K.1.,7,)2

= M [X”Y”] ~ 2(m,.m,q + K~~.y)(m~.c~r~~y + Kz.,) + (m,m, + Kz,y)2

D[X . Y] = M [X”Y”] ~ (ml.m,y + K,,.,,y)2.

Dans cette dernière expression, on voit apparaître la covariance. Dans lc cas particulier oùles variables sont indépendantes, la dernière expression se simplifie. Puisque X et Y sont desvariables independantes. il en est de même de X2 et Y” ; alors. en tenant compte du fait queKL,II = 0. ou peut écrire :

D[X . Y] = M[X’]M[Y”] - ,,$z;soit : L)[X. Y] = D[X] D[Y] + ml.D[Y] + rniD[X].

Si les variahlcs sont centrées, or1 obtient :

D[~O. 61 = D[&l D[yOl.

7. Propriétés du coefficient de corrélation (démonstrations)

Si les variables aléatoires X et Y sont liks linéairement :

alors le coefficient de corrélation vaut *l. En effet,, à partir de la covariance on peut Ccrire :

K x,?J = MIXo.Yo] = M [(X ~ 7~) (Y ~ m,)]

En remarquant que my = ~TL,~ + b

Kz,, = M [(X - m,) . (nX + b - am, ~ b)] = uM[X”] ~ mn,.M[X] - nm,.M[X] + arn~= uM[X2] - arnz = aD[X].

Reportons cette valeur dans l’expression du coefficient de corrblation :

Il reste à exprimer gy :

On en conclut que T,,~ = +1 si a est positif et -1 si a est nkgatif.

348

Page 335: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

2c‘s. SYSTÈMES À PLUSIEUHS VARIABLES ALÉATOIRES

Maintenant, il s’agit de montrer que ~T~,~I 5 1 quelle que soit la liaison entre les variablesaléatoires X ct Y. À cet,te fin, calculons la variance dc la variahlc 2 = aX + bY. clic s’écrit, :

D[Z] = D[aX + bY] = a”D[X] + b’%[Y] + ZnbK,,;.,.

Faisom à prksent b = CT,,; puis a = CT~ et a = -D~, nous obtenons :

D[Z] = 2a:a; + 2a,ra,&, = 2+;[l h r..r.!,].

Cornptc tenu du fait que D[Z] > 0: nous devons avoir :

,o; * ~:r~yKr,y L 0

ce qui s’krit encore :

et par conskqucnt :

8. Éléments de bibliographie

E. B~REL, R. DELTHEIL et R. HURON (1962) Probabilités, Emxm, Armand Colin, Paris, 12’klition.

A.L. EDWARD~ (1984) A n i n t r o d u c t i o n t o lénear rqression ad çorrelataon, W . H . Frecrnan.M. FISZ (1980) Probability theory and m,athematical statistics, Krieger.H. VENTSEL (1973) Théorie des probchilités, Éditions MIR, Moscou.

349

Page 336: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

24 1 Critères de conformité

1. Généralités

Cc chapitre a pour objet, l’étude de critères permett,ant de tester la validité des hypothèsesformulées lors de l’ktude d’une population parente. Il ~KIL~S faut donc définir cc qu’est unepopulation parente. L’étude du caractère stochastique d’un système réel (physique) conduit àl’étude dc la loi de distribution dc la dispersion aléat,oire touchant aux mesures effectuées surMit système. La loi est propre au système qui est soumis à un ensemble de conditions rkcllcsd’observations. Par exemple, on peut kvoquer la dispersion du tir d’url certain canon alimentépar des munitions d’un cert,ain lot : bien d’autres conditions peuvent influencer la dispersion :l’cxpkience du tireur, la mf%orologie...

Une certaine mesure effectuée sur le système est alors caractériskc par la variable aléatoire <,accompagnée de sa distribution p(t), c’est-à-dire de la loi permettant d’obtenir la probahilittobject,ive dc trouver l’événernent J: dans l’intervalle AZ.On appelle population parcntc l’ensemble de toutes les observations possibles qui pourraient

Ptre réalisées pour un système soumis à 1111 ensemble de conditions. Il faut bien noter quel’ensemble de toutes les observations (réalisations) possibles est, diffkrent de l’ensemble desvaleurs possibles de la variable aléatoire <. À chaque valeur fixée de < correspond plusieursvoire lule infinité d’observations possibles ; par exernple, on jette trois dés dc couleur différentemais par ailleurs parfaitement identiques, et, l’on s’intéresse ri. la somme présentée par les facessupérieures : on compte zéro si la somme est inférieure à 12 et 1 si la somme est supérieure ou@ale à 12. La variable aléatoire < attachée au lancement prend les valeurs zéro et 1111 tandisqu’il y a 216 configurations ou observations possibles, 135 configurations donnent, une sommeinférieures à 12 et 81 configurat,ions une somme supérieure ou égale à 12.

Donc mie population parente est définie par des objets sur lesquels on pratique la mesured’une certaine grandeur. D’une part les objets sont trPs bien définis (ensemble de conditions)et, d’autre part la mesure effectuée est sujette à des fluctuations incontrôlables ; en conséquence,à ccllc-là, il est assoc? une variable aléatoire. Par exemple, on peut s’intkresser à la longueurdes feuilles des arbres d’un parc. Les conditions sont donc constituées par toutes les feuilles detous les arbres du parc. Toutes les feuilles ainsi définies constituent une population parente. Lesvaleurs possibles de la variable aléatoire X seront, d’un point de vue pratique, en nombre fini;elles peuvent être mesurées au millimètre près. Une autre population parente pourra être t,out,esles feuilles de tous les cherles du parc ou encore toutes les feuilles dc tous les peupliers..

351

Page 337: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

h~A,VUli’l, IIE: CALCLIL NTJMÉRIQUE APPLIQUÉ

Gk&ralemr:nt les populations parentes étudiées sont finicy mais on est, tenté d’imaginerdes populations parcntcs infinies qui sont des extrapolations pour ml nombre infini d’obser-vations possibles. Cette notion peut alors SC r@vPler commode dans l’tlahoration d’une théoriematliCmat,iclue.

Un échantillon est un prélèvement fini à l’intk-icur d’une population parente, c,t lc nombre TZd‘observations constituant l’échantillon est appc~l6 la taille dc l’échantillon. Le pri?lèvement, del’khantillon doit être fa,it au hasard ct chaque éléments de l’échantillon doit, etrc intl6pendantdrs autres. c’est cc qu’on appelle l’indépendance stochastique. Au cours de ce cha,pit,re; on verracorriment contrôler la qualit dc 1‘Cchar~tillon prélrv6.

2. Représentation des données numériques. Histogramme

On se trouve cn présence d’un échantillon dc taille N prelevé au hasard dans une certainepopulation parcrite. l’échantillon @tant caract&isé par un ensemble de mwurcs que l’on note{ X i } i = 1,2;.... 71. Il est, fondament,al de connaître la loi dc distribution à laquelle oKitl’échant~illon. Pour ce faire on va procbdcr à une reprtkentation graphique des données groupbesque l’on obtient en comptabilisant le nombre dc donn~cs appartenant à ur1 petit intcrvallc. Defacon pragmat,ique, on op?rc de la manière suivant,c :

1. on rcclierclie la borne infkkurc z,,lf et, la borne sup~ricurc x,,~ dc l‘ensemk~lr des {z, }. ct celanous définit l’intcrvallc de représentation notC 1 ;

2. on divise l’intervalle 1 en k sous-intervalles égaux de telle sorte que k soit, compris cntrc 8 ct25. Pour cr~la~ on peut utiliser la règle approchée :

k = log, r> + 1;

3. on compte dans chaquc~ sous-intervalle le nomhrc~ rn+ d’individus qui y tombent

La courbe représentative des rrl,k cn fonction de k s’appelle ur1 histogramme, elle donne urlcrcprésenta,tion de la densité de probabilité 2 laquelle l’écha.ntjillon ohbit. ou peut obéir.

À partir de cettcl rcpr6sentation, nous allons chcrchrï à déterminer les propriétés réellementstables qui caractérisrntj le phbnornène étudik. Ceci signifie corrblativement que l’on chercheraaussi à. bliminer tout le côt,k al&toirc apparaissant dans la si:ric finie des mesures.

L’aboutisscrnent de la rechcrchc des éléments stables sera donc urlc loi qur l‘on dira stochas-tique par opposition à loi causale. Stochastjique est 1111 mot d’origine grecque ~~ 0 oro~ctor+ ~qui signifie lc dcviq celui qui coqjrcturc.

On retrouve ici une g~ntralisation dc la notion d’incertitude en physique, laquelle accompagneirkvitablement la réalisation de la mesure. La dispersion dc la mesure obtit, 5, une loi stochastique

~~ la plupart du temps gaussienne.Une fois obtenue la rcprésenta.tion de la dcnsit,k tic probabilitb, on rechcrchc III~~ cxprwsion

analytique pouvant, « raisonnahlcrncnt » rendre compte de 1s loi c~xpbrimcntale obtenue.Sur le Weh (*), on trouve le programme histog . c qui réalise 1’histogr~~mnIc d‘une série de

nombres al6atoircs à distribution gaussienne.

*http://www.edpsciences.com/guilpin/

352

Page 338: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

23. CRITÈRES DE CONFORMITÉ

3. Conformité entre une répartition théorique et une répartitionexpérimentale (ou répartition statistique)

Apres avoir soigneuscmcnt, examiné la répartition cxpérimerkalc~ on est en nicww de pres-sentir une loi analytique susceptible de reprksenter théoriqucmrnt l’enscmlk des données ticl’écliantillon.

Inévitahlcment, il existe des karts entre la loi expérimentale et la loi thknique. et lc problèmedc fond consist,c à pouvoir dire si ces fluctuations sont dues au hasard ou non. et surtoutavec quelle probabilité. En effet j la représentation de la loi expi:rimentale est int,imement li& àl‘échantillon bt,udié. Un autre Cchantillon donnera une loi expi:rimentalc plus ou moins diff&cnte,ainsi qu’un suivant. Donc, lc problème concernant la conformité dc la loi expkimcnt,ale etde la loi théorique rcposc uniquernent sur la taille restreinte de 1’~chantillon (nombre rbduitd’observations). Ce prohkmc devient caduque si l’on 6tudic toute la poplllation parcnt,cl. alors.il n’y a plus qu’une sculc loi expériment,alc possible.

La recherche d‘une loi thborique consiste donc à forrnulcr une cert~ainc~ hypothk H c:t) l’or1veut savoir si cette hypothèse est conforme aux donnk:s rxpérimcntalw En fin dc compte, onveut savoir si l’on peut ou non adopter cette hypoth&e H et avec quel degré dc wrtit,ude.

Il s’agit, donc de clkfinir une mesure de la conformité que rien n’empkhc d?s maintenantde désigner par U. Force est de remarquer que U est une variable albatoire dout la loi derkpartition sera u pr%ori lik à la distribution de la variahlc a.léatoirc Ctudiée :I; rt, dc la ta,ille 1)dr: l’échantillon.

Si l’hypothèse est correcte; la loi dc répartit,ion dc U est déttrmink par la loi tic répartitiontic :I: et par le nombre n. Désignons par z: la valeur particulikc prise par la variaMe albatoireU dans une expkicncc bien dét,erminke. Alors notre problème dc conformitk consiste & savoir sila valeur calcul&: ~1 s’explique par lc hasard ou encore si la valeur ‘u est trop grande et, indiquealors urle diff&encr essentielle entre les deux répartitions thkorique ct, statistique. Cc derniercas de figure montrerait alors que l’hypothke H devrait etre rejet&, mais cela n’tst pas aussisimple que les apparences lc montrent.

Après avoir détermini: la valeur numérique ‘II: on calcule la probabilité pour que la variablealkatoire U puisse effectivement dépasser V. Soit P cette prohabilitb. Si P a une valeur « t,roppetite », on doit alors rejeter l’hypothbc H, elle apparaît alors comme peu vraisemblable.

Choix de la mesure de U

La prcmke difficulté rencontrée pour choisir une mesure dc U repose sur le fait que la rkpartit,ionde U dkpend de la rkpartition dc 2. Il se trouve fort heureusement que, dans certains cas: la loide rkpartition de U a des propriktk simples: et, pour n grand devant, l’unité, ccttc loi ne depcndplus de la. loi de répartition des z. Nous allons voir deux mesures de U.

4. Le xi de Pearson (1857-1936)

On désigne par pi la probabilité théorique de t,ornhcr dans l’intervalle i: ct par p, la. prol)al)ilitPr~xpérirncntale de tomber dans le mkne intervalle.

Pour la mesure de U, on choisit la somme des car& des diffkw~crs (p, -$,)” que l’on pondèrepar lc coefficient ci. ci tient compte des valeurs relatives des écarts quaclratiqurs a ap, 6gal.l’importance étant plus grande si api est petit. C’est la raison pour laquelle: on pwnd c, = o/p;.c’est-k-dire proportionnel à l/pi.

3 5 3

Page 339: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCTJL NUMÉRIQUE APPLIQUÉ

Si l’on choisit N = 72, il est possible de montrer que la fonction de répartition de U ne dépendpratiquement pas de la fonction de repartition F(z), ni de n, mais uniquement du nombred’intervalles de regroupement k qui a servi à construire l’histogramme. Dans cc cas, on dit queU obi;it à une loi du x2, et l’on a :

u = r2. & (Pi -PJ”

i=l PL

u est la valeur numérique de la conformité. On trouvera plus loin une démonstration de cesaffirmations (cf. 5 14.1 Annexe H, p. 443).

Remarque 1 : La loi thkorique dépend dc 1-1 parametres inconnus que l’on va chercher àdéterminer.

Remarque 2 : 71 est le nombre d’observations indépendantes de la variable alCat,oire 2; et kle nornbre d’intervalles de regroupement. Il est nécessaire d’obtenir un nombre minimum deplusieurs unités ~ voire une dizaine ~ dans chacun des intervalles de regroupement. Si tel n’estpas le cas, il faut regrouper certains intervalles pour qu’il en soit ainsi.

Remarque S : La variable U obCit à une loi du x2 à rn degrés de liberté lequel est déterminépar le nombre d’intervalles de regroupement k moins le nombre de contraintes auxquelles estsoumise la loi. Ces contraintes sont constituks par le nombre de paramètres inconnus p figurantdans la loi théorique auquel il convient d’ajouter la valeur 1 car il y a une contrainte implicitequi est la normalisation de la loi de distribution. D’où :

m=k-p-1.

Remarque 4 : Il n’y a pas de difficulté à calculer la probabiliti: 0 de dépasser la valeur numériqueU, soit en ayant programrné la loi du x2 à m degrés de liberté, soit CII consultant une table figurantà la fin de tous les manuels. Si cette probabilitt: B est très petite, on rejette l’hypothèse H avec 0chances de la rejeter à tort. Dans le cas contraire, l’hypothèse H est vraisemblable c’est-à-direqu’elle n’est pas en contradiction avec les données exp&imentales.

Remarque 5 : Parler de probabilité très petite n’a pas grand sens si l’on ne SC fixe un seuilde signification cti. Dkm point de vue pratique, si 0 est infkricur à 0,05, il y a lieu de vérifier sipossible l’expérience, et si les écarts persistent, il y a lieu de chercher une autre loi. Cela signifieque l’on prend le risque de rejeter à tort l’hypothèse H avec 5 charms sur cent...Remarque 6 : Le test du x2 est à rapprocher de la preuve par neuf. La preuve par neuf ne ditpas quand l’opkration est juste, elle dit seulement quand elle est fausse. Autrement dit, si lapreuve par neuf ne donne pas, lors du processus de calcul, les deux derniers nombres identiques,on est certain que l’opération est fausse. En revanche, si les deux dernieres opérations sontidentiques cela signifie que l’opération peut être correcte ou encore que, s’il y a une erreur:l’erreur est modulo 9. Il en est de même du x2. On peut aisément trouver plusieurs lois toutà fait acceptables qui peuvent rendre compte correctement de la statistique d’un échantillondonnk. Le critère du x2 ne permet pas de dire qu’une loi est meilleure ou pire qu’une autre.Simplement, nous savons que les données expérimentales ne sont pas en contradiction avec lesdifférentes hypothèses formulées.

4.1. Un exemple - Vérification d’un générateur de nombres aléatoires gaussiens

À partir d’un générateur de nombres aléatoires à distribution uniforme, on se propose defabriquer un générateur de nombres aléatoires gaussiens. Notre hypothèse H est donc la loide Gauss-Laplace. Nous avons généré 4 096 nornbres aléatoires gaussiens en choisissant la

354

Page 340: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

24. CRITÈRES DE CONFORMITÉ

valeur moyenne 6,0 et l’écart type 2,0 (nous avons ajouté chaque fois 12 nombres aléatoiresà distribution rectangulaire donnCs par la technique de Lehmer). Les résultats obtenus sontprésentés dans le tableau 24.1.

Tableau 24.1.

k=Ok=lk=2k=3k=4k=5k=6k=7k=8k=9k = 10k= 11k= 12k = 13k = 14

m=4

m = 1 8ri-1 = 48m = 130m = 294m = 481m = 667m = 765m = 7247-n = 4 9 8m = 267m = 1 4 1m = 41m = 1 3m=4

x = -3,096x = -2,620x = -2,144x = -1,6682 = -1,1912 = -0,71535 = -0,239lx = 0,237Ox = 0,7132x = 1,189x = 1,665x = 2,142x = 2,618x = 3,094x = 3,570

p=8,037e-4p=3,417e-3p=1,169e-2p = 3,167e - 2p=6,904e-2p=1,205e-1p=1,683e-1p=1,882e-1p = 1,684e - 1p = 1,207e - 1p=6,925e-2p = 3,180 e - 2p=1,169e-2p=3,438e-3p=8,092e-4

p” = 9,766 e - 4p’=4,395e-3p* = l,172e-2p* = 3,174e ~ 2p* = 7,178e ~ 2p* = 1,174e ~ 1p* = 1,628e ~ 1p* = 1,868e ~ 1p* = 1,768e ~ 1p* = 1,216e - 1p* =6,519e-2p* =3,442e-2p* = 1,001 e - 2p* =3,174e-3p* =9,766e-4

Dans ce tableau, k est le numéro de l’intervalle de regroupement, rn le nombre d’occurrences, xest l’abscisse du début de chaque intervalle, p la probabilité théorique de tomber dans l’intervalle,et p* la probabilité empirique.

Expérimentalement, on trouve que les nombres pseudo-aléatoires gaussiens ont une moyennede 6,05 et un écart type de 1,98. Comme le montre le tableau, nous avons effectué lesregroupements sur 15 sous-intervalles. Nous avons alors obtenu la valeur de u = 7,601, commel’hypothèse à tester est la loi normale, le nombre de degrés de liberté est 12. Ainsi, la probabilitédc dépasser la valeur u est, 0,815. Il n’y a aucune raison de rejeter la loi dc Gauss commehypothèse H, les données expérimentales ne la contredisant pas. On dit aussi que l’hypothèseH est tout à fait vraisemblable.

4.2. Remarques sur le seuil de signification

Le choix du seuil de signification cy est guidé par les conséquences qui pourraient découler durejet à tort ou de la conservation à tort de l’hypothèse H. En l’absence de toute considérationsur les risques encourus, le seuil de signification le plus répandu est 0,05. Cela signifie que l’onchoisit de rejeter la loi avec 5 chances sur cent de la rejeter à tort.

D’un point de vue pratique, après avoir calculé U, on opérera selon l’un des cas de figuresuivants :

a. la valeur de u peut se situer dans deux domaines : le domaine des valeurs possibles u < xl-,et le domaine des valeurs improbables u > xf-,, expressions dans lesquelles <y est le seuil designification. Alors dans cette dernière éventualité, on rejettera l’hypothèse H avec Q chancessur cent de la rejeter à tort ;

355

Page 341: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b. on peut avoir des raisons particulières dc SC méfier des valeurs de u trop petites et le domainedes valeurs possibles devient u > xi et le domaine des valeurs improbables u 5 ~2. Dans ladernière cvcntualité, on rejettera l’hypothèse H avec Q chances sur cent dc la rcjctcr à tort, :

c. on peut aussi avoir des raisons de se mefier à la fois des valeurs trop petit,cs ct trop grandesde U, autrement dit on se méfie des valeurs de u qui se situent dans les queues dc distribution.Le domaine des valeurs probables dcvicnt x:>,~ 5 u < XT& et les domaines des valeursimprobables u < ,J$,~ ct IL > x~~,,,~. Dans la dernière éventualité, on rejettera l’hypothescH avec o chances sur cent de la rejeter à tort.

5. Critère de Kolmogorov (1903-1987)Il s’agit d’un critcrc de mesure de la conformité (ou de la non-conformitc) qui présente un grandinti:rct dans la mesure où il est très simple d’emploi. Ici la mcsurc de la conformité ‘U est le supdu module dc la différence entre les répartitions theoriquc F(z) et cxperimentale F* (CE). Donc :

tu = sup IF(z) -F*(z)/.

Bien entendu, 71 est une variable aléatoire. Là encore, il est possible de montrer que la répartitionde v ne dépend pas de F(z) à condition toutefois que la taille de l’échantillon n soit trèsgrand devant, l’unité (71 est le nombre d’cxpcricnces indépendantes). La probabilit,e dc l’incgalitéTJ~ > X est donnfe par l’expression :

30 !Ix2p(X) = l- C (-1)‘exp (-2k2X2) = 2x3l)“:+‘exp (-2k”X”).

l,.-m hz1

Voici quelques valeurs dc p(X) :

x 0,o 0,5 1,o 1,5 2,0p(X) 1,O 0 , 9 6 4 0,27 0 , 0 2 2 0 , 0 0 1

Pour utiliser le critère de Kolmogorov, il suffit de :

a. calculer 21 puis TI&,b. chercher dans la table de p(X) la probabilité correspondante.

C’est la probabilité que l’ecart, maximal entre les deux répartitions soit non inférieur à la valeurobscrvi‘c, à condition toutefois que les écarts soient dus uniquernern a des facteurs aléatoires.

Remarque : On notera l’abscncc de degré de liberté dans l’expression dc cc critère. Il s’ensuitqu’il est plus «optimiste » que le précédent critère.

Le programme kolmogor . c sur le Web (*) calcule les valeurs dc ccttc distribution.

6. Estimation des paramètres d’une loi inconnue. Estimateurs

La formulation d’une hypothesc H conduit à exprirner une certaine loi dont on rechercheral’éventuelle conformité. Les paramètres intcrvcnant dans la loi devront être estimés à partirde l’échantillon. Il faut bien préciser que ces estimations sont des variables aléatoires et nous

*http://www.edpsciences.com/guilpin/

356

Page 342: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

24. CRITÈRES DE CONFORMITÉ

n’avons pas accès à la valeur exacte de chacun des paramètres et nous devrons nous contenterde l’estimation du paramètre considéré.

Pour obtenir une estimation, il faut employer un estimateur, la notion d’estimateur va seprkiser dans les lignes qui suivent, toutefois on peut d’ores et déjà dire qu’il s’agit dc la formulemathématique utilisée pour effectuer le calcul de l’estimation. Bien sur, on ne choisit pas lesestimateurs n’importe comment et il est souhaitable que quelques contraintes judicieusementchoisies nous aident à déterminer des estimatcurs les plus «performants » possibles. Par exemple,on peut souhaiter avoir les estimateurs pour lesquels les erreurs sont les plus petites possibles ;à cc slljet on se souvient que si n est élevé, nous avons une très grande chance de trouver lamoyenne expérimentale proche de la moyenne théorique (thkorème de Bernoulli).

D’une façon générale: on peut considkrer une variable aléatoire X qui prend les valeurs.x1 i x2, Q, . . , z,, , puis un estimateur Ü du paramètre n qui est une grandeur associée à la variableX. Toutes les estimations possibles de a le sont à partir des valeurs {zk}. Il s’ensuit, que fi, est urlefonction des {zk}. Par conséquent, a est une variable aléatoire dont la loi de répart,ition dépendde celle dc X ; elle dépend aussi du paramètre inconnu a ainsi que du nombre n d’cxpkriences.

Ces remarques nc suffisent pas à concevoir des estimatcurs intéressants et utiles, on leurirnpose donc certaines contraintes dont les trois plus importantes sont les suivantes :

1. l’cstimateur ü doit converger vers a en probabilité. On dit alors que l’estimation est consis-tante ;

2. on souhaite que M[a] = a; lorsque cette condition est remplie, on dit que l’estimateur estnon biaisé. Le plus souvent le biais dépend de n, et l’on parvient à corriger l’estimateur afinque sa nouvelle expression ne soit plus biaisée ; mais il convient alors dc le vkifier ;

3. souvent, on désire que l’estimation centrée possède la variante la plus petite possible, c’est-à-dire que o(a) soit rninimum.

La plupart du temps, il n’est pas possible de satisfaire simultanément ces trois contraintes, etl’on SC contente seulement des deux premières.

6.1. Application à l’estimation de la moyenne et de la variante

Rcvcnons à notre variable aléatoire X à valeurs 51,~~ ~3, , z,,, et désignons par ‘rn et Drespectivement la moyenne et la variante, toutes deux inconnues.

a - Cas de la moyenne - Nous définissons la rnoycnnc au moyen dc l’expression :

IC=I

En vertu de la loi des grands nombres (théorème de Bernoulli), l’estimation ?71, converge enprobabilité vers m.

À présent, supposons que l’on réalise n’ expériences ayant fourni chacune une moyenne m, , j =1, 2, . , n’. On peut écrire :

on voit alors que l’estimateur n’est pas biaisé, et que la moyenne de la moyenne est encore larnoycnne. En ce qui concerne la variante de rn :

357

Page 343: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

il faut connaître la loi de répartition de X pour pouvoir conclure. Notamment, il est possiblede montrer que si X obéit à une distribution gaussienne, la variante de ti est alors minimum.Cela n’est généralement pas vrai avec d’autres lois de répartition.

b - Cas de la variance - L’estimation naturelle de la variante est la variante statistique :

1 nD = ; -y(Xk - vii)2k=l

avec fi=-i, cxk.

k=l

Comme D est égal au moment du deuxième ordre non centré moins le carré de la moyenne, onpeut encore écrire :

i xk=, xi converge en probabilité vers M[X2] tandis que m2 converge en probabilité vers m2.Donc D converge en probabilité vers M[X2] - fi2 et par conséquent l’estimation converge cor-rectement en probabilité (estimation consistante). Maintenant, nous allons voir que l’estimationest biaisée, pour cela nous allons transformer D :

soit encore :

À présent, étudions la moyenne de D au travers de cette dernière expression dans laquelle onnumérote les expériences (on fait K expériences dans lesquelles chaque échantillon contient n

individus, les Kn individus sont tirés au hasard indépendamment les uns des autres) :

Comme la variante est indépendante du choix de l’origine, alors on peut choisir l’origine desabscisses pour chacune des expériences en mk. En posant y& = xki - fik, on obtient alors :

la dernière somme affectée d’un signe moins est nulle car les y& sont des variables aléatoirescentrées indépendantes pour lesquelles j est différent de i (il n’y a pas de termes au carré).D’où :

3 5 8

Page 344: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

24. CRITÈRES DE CONFORMITÉ

Donc, la moyenne de D n’est pas égale à 0, et l’on dira que D est un estimateur biaisé puisquel’on commgt une erreur systématique en l’utilisant. On corrige aisément en prenant l’opératgurD*=O-n _ 1. On démontre sans peine que ce nouvel estimateur est consistant puisque ~

n - ltend vers 1 quand n tend vers l’infini et qu’il n’est pas biaisé. En revanche, dans le cas général,l’estimation ne donne pas un D minimum.

Remarque : Ceci justifie le fait que de nombreux ouvrages donnent :

0xk=l

comme estimateur de la variante.

7. Éléments de bibliographie

S. AïVAZIAN (1970) Étude statistique des dépendances, Moscou.E. B~REL, R. DELTHEIL et R. HURON (1962) Probabilités, Erreurs, Armand Colin, Paris, 12”

édition.P. DAGNELIE (1973) Théorie et Méthodes Statistiques, Tomes 1 et 2, Les Presses Agronomiques

de Gembloux.P. DAGNELIE (1998) Statistique théorique et appliquée, de Boeck.M. FISZ (1980) Probability theory and mathematical statistics, Krieger.R. RISSER et C.E. TRAYNARD (1969) Les principes de la statistique mathématique, Gauthier-

Villars.G. SAPORTA (1978) Théories et méthodes de la statistique, Publications de l’Institut Français

des Pétroles.H. VENTSEL (1973) T héorie des probabilités, Éditions MIR, Moscou.

359

Page 345: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

25 Étude des dépendancesdans le cas linéaire

Notre étude se limite au cas de deux variables aléatoires dont la dépendance est linéaire. Iciencore il n’y a pas de difficultes à généraliser les résultats au cas d’un système dépendantlinéairement de n variables puisqu’il suffit d’en effectuer l’étude en combinant deux à deux lesvariables.

Si par rnalheur la liaison entre deux variables est de type curviligne, on peut chercher alorsà se ramener au cas lineaire par un changement de variables adéquat. Quoi qu’il en soit, le butultime est l’usage de la méthode des moindres carrés appliquée au calcul des paramètres dela « droite de régression » quel que soit le schéma de dépendance lineaire que l’on ctudie. Lerisque principal se fonde sur l’utilisation d’estimateurs qui peuvent devenir biaisés lorsque lesconditions requises d’applicabilité de la méthode des moindres carrés ne sont pas toutes vérifiées.

1. Les types de schémas de dépendance linéaire

1.1. Les deux variables X et Y ne sont pas aléatoires

Y est complètement déterminé par la connaissance de X. À première vue cela peut paraîtreen désaccord avec la théorie des incertitudes mais ce schéma se rencontre chaque fois que l’onaborde un problème de dénombrernent, à ce moment aucun élément aléatoire ne rentre en jeu.Il s’agit alors d’une dépendance fonctionnelle classique qui prend la forme :

Y=aX+b.

Voici 1111 exemple simple : l’âge d’un arbre en fonction du nombre de ses anneaux.

1.2. Dépendance de la variable aléatoire q et de la variable non aléatoire x(schéma de régression)

Ici, on étudie le comportement de la variable aléatoire dépendante 7 en fonction de la variablenon aléatoire 2. Par exemple, la variable aléatoire rl est une mesure entachée d’incertitude;elle prend des valeurs qui sont influencées par .2: mais aussi par des facteurs incontrôlables. Ladépendance linéaire s’écrira sous la forme :

7 = (az + b) + 6.

3 6 1

Page 346: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

expression dans laquelle les termes entre parenthèses expriment la dépendance non aléatoire etS exprime le résidu, c’est l’expression aléatoire de q. Dans ce schéma, 6 doit vérifier un certainnombre de conditions :

M[S] = 0

e t D[6] = g2,

alors, on ne recherche qu’un schéma en moyenne pour x, c’est-à-dire une loi de variation de lamoyenne conditionnelle M[qj ]x en fonction de x. Il s’ensuit que la valeur moyenne de 17 est unefonction linéaire de x :

y = as + b,

cela signifie que y(x) est la moyenne de 7 pour une valeur donnée de x. La droite ainsi définieporte le nom de droite de régression; cette dénomination doit être prise comme un simple nomgénérique, elle est historiquement liée aux travaux de Galton (1822-1911) ~ considéré commeun des fondateurs de la méthode statistique ~ qui avait constaté que, durant ses premierstravaux, la pente de la droite en question était négative d’où l’idée de régression.

Le coefficient de la pente ü s’appelle coefficient de régression de y en x.

Tableau 25.1.

J’ xi = J’( J’ + 1)

5 30 4,1961 1 132 3,471 2 156 3,3713 182 3,33314 210 3,17615 240 3,19616 272 2,98017 306 2,94118 342 2,823

yj = l o g , $( )3

Exemple - L’analyse de la structure fine des bandes d’émission d’une molécule diatomique -ici H Al - permet la détermination de la température du plasma émetteur. Pour cela on mesurela surface relative Ij de chaque raie à laquelle un produit de nombres quantiques J’(J’ + 1) estassocié. La théorie permet d’établir que :

lot& 2( >3= -gJ(J’ + l),

expression dans laquelle Sj est calculé pour chaque raie j, A est un coefficient connu attaché àla molécule ktudiée. Sur un graphique, on porte en abscisse J’(J’ + 1) et en ordonnée la valeur

y.j = log, - .( 1s,

La mesure de la pente de la droite permet de calculer T. Sur le tableau 25.1

on a porté les résultats.

362

Page 347: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

25. ÉTUDE DES DÉPENDANCES DANS LE CAS LINÉAIRE

La variable xj n’est pas du tout entachée d’erreur tandis que la variable y.7 est sujette àcertaines fluctuations incontrôlables qui confère à cette variable un caractère aléatoire.

Ce type de schéma s’applique encore même si la variable x3 fait l’objet de très faiblesfluctuations comparées à celles qui affectent la variable yj.

1.3. Dépendance de la variable aléatoire q et de la variable aléatoire [ (schéma de corrélation)

Les deux variables étudiées dépendent d’un ensemble de facteurs incontrôlables qui rendentfondamentalement aléatoires les variables étudiées 77 et <.

Si l’on fait l’hypothèse d’une liaison linéaire entre 77 et <, la grandeur 17 se décompose en deuxparties :

77 = (üf + 6) + s.

expression dans laquelle 6 exprime le résidu avec comme caractéristiques :

M[S] = 0

et D[b] = a’.

Il y a une contrainte supplémentaire : cette décomposition doit être effectuée de telle sorteque les variables S et 5 soient non corrélées. Cela impose que M[@l = 0, en effet S est centrée,il n’est donc pas nécessaire que < le soit. Si la distribution de ces deux variables 6 et < estgaussienne, alors on est assuré de l’indépendance.

Ici encore on s’intéressera à la loi en moyenne et l’on écrira :

Y(x) = ax + 6, soit encore Y(x) = n/r[q][ = x].

Remarque : Le cas où les variables 17 et [ sont simplement entachées d’erreur ne rentre pas toutà fait dans ce type de schéma bien que ce soit celui-ci qui soit appliqué. En effet désignons par6, et S, les erreurs qui entachent les variables x et y. On peut écrire :

et l’on ajoute :

Ad[&.] = 0 e t M[i?,] = 0.

Remplaçons z et y dans l’équation de la régression :

qui se transforme :

7 = a< + 6 + (6, - as,) .

Dans cc schéma, on voit que le résidu est corrélé avec [ puisqu’il dépend du paramètre ü àestimer. Cela peut entraîner des ennuis dans le calcul des estimateurs qui risquent de perdreleurs bonnes propriétés évoquées au chapitre 24.

3 6 3

Page 348: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANIJELUE CALCUL NUMÉRIQUE APPLIQUÉ

2. Fondements de l’analyse de corrélation-régression

La détermination des coefficients ü et b s’cffcctue selon la méthode des moindres carrés.Pour s’assurer que les estirnateurs issus de l’analyse de corrélation-régression sont tout à faitconvenables, on doit, vkifier que trois conditions suivantes sont, remplies :

1. indkpcndance stochastique des résultats d’observation (l’échantillon a bien étk tire au hasard) :2. homogénéité des varianccs conditionnelles ;3. les distributions des variables sont gaussiennes.

Nous a.llons reprendre en dktail ces trois points.

2.1. Indépendance stochastique des résultats d’observation

Il s’agit de vérifier que les échantillons ont bien Cte prélevés au hasard. On doit s’assurer quel’observation de l’expérience no i est bicn indépendante de celles qui ont, été effectuées auparavantet qu’elle n’influence pas non plus les observations suivantcs.

L’étude de 1’indCpcndance stochastique des exp@ricnces évoquks dans les schémas t,ypiqucs del’analyw dc corrklation-régression peut se rarnener à l’étude de l’ind~pcndan<:e sto&astique desséries dc rkidus (~5~). Il importe de vkrifier que l’échantillonnage n’a pas été dirigé. Désignonspar x1, x2, x3; . , CC,, l’échantillon extrait de la population parcntc ktudiCc dans l’ordre où ilsapparaissent. On propose plusieurs méthodes de vérification de l’indépendance stochastique destirages.

a - Test de la suite formée à partir de la médiane de l’échantillon - À partir de la suite desx3, on forme une autre suite yj constituk par l’ensemble des x.7 ordonné par valeurs croissantes.Cette nouvelle suite s’appelle suite variationnelle, et yj s’appcllc l’ordre statistique de rang j.La valeur empirique dc la médiane Tjrr,,f:Ci est l’élément central de la Suit)e des yj, c’est-à-dire :

YTL+l si n, est irnpair.2

(y: + y;,,) /2 si n est pair.

À partir de l’échantillon initial des xj, on va forrner une suite de deux caractères arbitraires,disons 0 rt 1. Si la valeur dc zk. est inférieure 5 z ,rrrCi on place mi 0, si, clic est supérieure onplace un 1. On abandonne les éléments qui sont @aux à IC,,,~.

L’idCc du test, repose sur les remarques suivantes :la suite dc 0 et de 1 est constituCe de sous-suites formkcs soit ur~iquemrnt, de 0 soit uniquernent

de 1. On désigne par p le nombre total de sous-suites. Il apparaît comme IIIIC question de bonsens que /L doit avoir une valeur «pas trop faible cornparéc à n, »; car les sous-suites ne peuventpas Ckre trop 101~gucs si le tirage est dû au hasard. Il s’ensuit que la longueur X de la plus grandesous-suite doit avoir une valeur « pas trop grande comparée à n ». Il est clair que I-L et X sontdes grandeurs qui dépendent de ?z ct on les notera : pu(n) et X(~L).

Si l’hypothèse d’indépendance statistique est vraie, on peut montrer que /L(T~,) obéit à IUIC loinormale dont la rnoyenne ct l’kart type sont donnés par les expressions :

M[p(n,)] = y

D[p(n)] = y

3 6 4

Page 349: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

25. ÉTUDE DES DÉPENDANCES DANS 13 CAS LINÉ.~IRE

La distribution de A(*n) est, quelque peu plus cornpliquéc, aussi prbfère-t-on utiliser les rkultatssuivants (d’aprks S. Aiivazian) :

p(n) > PE ;(n + 1) - 1,9Sj/m[ 1

X(~L) < PE [3,3 (logd~) + 111

où PE définit l’opération troncature (partie entière). On rejettera l’hypothèse tl’intl~p~~rldarlccstochastique si l’une des inégalités n’est pas vtrifiée avec rnoins de 10 chances sur cent de rejeterla loi d’indi:pendance à tort.

b - Application à une suite de nombres pseudo-aléatoires - Le tableau 25.2 donne lahauteur d’un échantillon de 100 personnes prélcwks au hasard parmi des conscrits.

Tableau 25.2.

1,725 1,69 1,73 1,663 1,727 1,705 1,717 1,72 1,716 1,6921,713 1,741 1,706 1,693 1>688 1.74 1,705 1,683 1,776 1,7231,706 1,715 1,746 1,714 1,727 1,678 1,724 1,708 1,701 1.7111,702 1,685 1,698 1,734 1,729 1,719 1,701 1,713 1,702 1,7081,716 1,733 1,71 1,703 1,719 1,711 1,693 1,721 1,728 13681,711 1,704 1,696 1,744 1,694 1,723 1,748 1,704 1,781 1,6761,696 1,722 1,728 1,68 1,746 1,722 1,723 1,721 1,665 1,691,735 1,724 177 1,686 1,722 1,723 1,682 1,736 1,708 1,6921,721 1,698 1,706 1,692 1,712 1,715 1,709 1,724 1.765 1.7421,663 1,736 1,719 1,701 1,716 1;679 1,707 1,726 1,687 1,709

La lecture des dormécs s’effectue ligne par ligne. On trouvera sur le Wcb (*) lc programmeteststat . c qui rFalise ces simulations ct ces calculs. Il s’agit donc de s’assurer du bicn-fondéde l’indkpendance stochastique du tirage. Nous avons trouvé x,,,,.,] = 1,712, le nombre de sous-chaînes est 56 et la sous-chaîne la plus longue a la taille 6. Par ailleurs, OII calcule :

p(n) = 40 e t X(B) = 9.

On peut donc conclure qu’il n’y a aucune raison de repousser l%ypoth&c d’un tirage auhasard.

c - Test des suites ascendante et descendante - Ce test permet, de dkceler une tcndancc dedkviation progressive de la moyenne dc la distribution.

Comrne dans le cas précédent, on forme une suite de 0 ct, de 1 à partir de la suite donnkpar l’échantillon initial. On compare chaque ékment au suivant immédiat: s’il est plus grand onplace 1111 0 et s’il est plus petit on place un 1. Le cas d’égalitk est kart@.

Ici encore la philosophie demeure la même et l’on comptera le nombre de sous-chaînes PL(~)ainsi que la longueur de la sous-chaîne la plus grande X(n). D’un point de vue pra.tiquc on devra

*http://www.edpsciences.com/guilpin/

365

Page 350: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

vérifier les inégalités suivantes :

327~ - 1) - 1,96

X0(n) étant donné par le tableau :

n n 5 26 26 <n < 153 153 < n < 1170

X0(n) 5 6 7

Si l’une des deux inégalités n’est pas vérifiée, on rejettera l’hypothèse d’indépendancestochastique avec moins de 10 chances sur cent de rejeter la loi d’indépendance à tort.

d - Application à une suite de nombres pseudo-aléatoires - On analyse le même échantillon(Tab. 25.2, page précédente) à la lueur de ce nouveau test. On obtient pour le nombre de sous-chaînes la valeur 67 et pour la sous-chaîne la plus longue la valeur 3. Le calcul donne p(n) = 58et le tableau A(n) = 6. Ici encore rien ne permet, de repousser l’hypothèse d’un tirage au hasard.

e - Test des carrés des différences successives - Ce test ne concerne que les données quiobéissent à une distribution normale. Toujours à partir de la suite initiale, on forme la demi-somme de la moyenne des carrés des différences entre chacun des éléments et son suivantimmédiat, soit :

q2(n) = ~2(n’ 1) z( 2k+l-Q)2

on calcule également la variante empirique de l’échantillon :

a2(n) = (n: 1) Ic=i xk-k( -xo)2

où x0 est la moyenne de x3. On mesure la «déviation éventuelle B au moyen de la grandeur :

r(n) = $fjil s’agit en fait de la demi-moyenne des carrés des écarts ramenée à l’écart type.

Pour un échantillon de taille supérieure à 20, on rejettera l’hypothèse de l’indépendancestochastique des tirages si r(n) < ycy(n). Ta(n) est d’ irec ementt relié à la loi normale et l’onmontre que l’on a :

x(n) = 1+% Y

Jn+ 0,5(1+u:)

où U, est le quantile d’ordre (Y de la loi normale réduite. On rappelle la définition du quantiled’ordre (u :

P(x < 21,) = a,

366

Page 351: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

25. ÉTUDE DES DÉPENDANCES DANSLE CAS LINÉAIRE

soit si a = 0,05 , on trouve dans les tables :

& / exp(-$) dJ:=0,05

-00

le quantile d’ordre 0,05 est -1,65.

Remarque : Il ne faut pas confondre le quantile d’ordre a avec le point de pourcentage 100 Q.Le point de pourcentage 100 Q de la variable aléatoire < est la valeur wq telle que P(z > wp) =1 - F(wq) = Q où F(z) est la répartition de la variable aléatoire <.

f - Application à une suite de nombres pseudo-aléatoires - Toujours sur le même exemple,on examine ce que donne le test. On obtient q2(n) = 0,00059 et cr”(n) = 0,00048 puis :

y(n) = 1 , 2 2 8 e t ~o,os(n) = 0,837.

Encore une fois il n’y a pas de raison d’abandonner l’hypothèse d’un tirage au hasard.

2.2. Homogénéité des variantes conditionnelles

La variante conditionnelle D[~]Z] d e 1 a variable dépendante doit rester inchangée, au sensstatistique, quand II: varie. Autrement dit, D[~]Z] doit être une constante :

D[~IX] = a2 = cte.

Si tel n’est pas le cas, elle doit être proportionnelle à une fonction connue de 2, notée h2(z)(car D est une forme quadratique), qui sera déterminée empiriquement :

Le problème qui nous préoccupe maintenant, c’est de connaître un test qui nous permette dejuger de l’homogénéité ou non de la série des variantes.

On suppose que les variables ont été regroupées dans k intervalles. Soit ICO~ le milieu de chacundes intervalles, la variante empirique de chaque intervalle est donnée par l’expression :

s. = 5 -gyii - y,)22?

1i=l

où mi est le nombre d’éléments tombant dans l’intervalle de regroupement i et & la moyennede y dans le même intervalle.

Il s’agit de vérifier que les différences entre les k valeurs obtenues pour les sf sont dues auhasard ou, dans le cas contraire, si l’on doit envisager une tendance systématique à varier enfonction de z. Quand D[~]Z] est une constante, alors :

~[Yl~Ol] = D[ylzoz] = . = D[ylz& = 02,

et la variable aléatoire :

A= -t&milog, ($)i=l

367

Page 352: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUER

suit approxirriativcmcnt pour ru,, > 2 une loi du x2 à k ~ 1 degrés dc liberté ; dans expression.on a noti: :

n ktant la taille dc l’khantillon.On rejettera l’hypothèse de l’indépendance dc la suite des variantes si la valeur empirique

dc A tombe dans le domaine des valeurs peu probables dc la variable aléatoire,. Il faudra alorstrouver une fonction hz (22).

Exemples

1. Lc tableau 25.3 donne les résultats d’une prcmik expérience qui a i:tk rkalisée 10 fois pourcinq valeurs de la variable :L: qui sont : 5; 10, 17, 22 ct 27. La onzième ligne donne la moyenneobt,enue pour chaque valeur de Z, la douzième la variante et, la treizième les valeurs de CC.

Tous calculs faits, on trouve la valeur h = 5,12. Le nombre de degrés dc lib&é est 5 - 1 = 4.et la probabilité de dépasser la valeur A est 0,275. On peut affirmer qu’il n’y a aucm~c raisonpour repousser l’hypothkc dc l’homogénéitk des varianccs corlditionnc:llcs.

Tableau 25.3.

0 125,8 148,71 182,53 211,92 239.611 134,19 151,39 177,44 217,Ol 229,lO2 123,87 160,73 181,26 210,08 241;023 119,82 151,21 192,15 207,93 220,774 118,46 155,23 190,81 212,80 240,195 133,87 140,27 187,63 210,39 233,526 123,51 154,06 182,36 205,OO 237,157 116,95 149,36 185,76 213,24 238,ll8 144,81 147,22 182,49 215.28 236,939 128,99 150,36 184,29 201,03 229,74

Moyenne 127,03 150,86 184,67 210,47 234,61Variancc 74,31 28,87 20,26 22,98 40,89

Valeur de X 5 1 0 1 7 2 2 27

Ylj Y2j Y 3 . i Y4i Y5j

Remarque : Les calculs ont, été exécutés avec 16 chiffres significatifs. mais nous n’en avonsreport& que 5. les nornbres ayant été arrondis.

Sur le Web (*), on trouvera lc programme varian-1 . c qui rkalise cette simnlat,ion.2. Le tableau 25.4, page ci-contre, donne les résultats d’une deuxiCme expkricnce qui a ét,F

réalisée 10 fois pour cinq valeurs de la variable J: qui sont : 70, 80, 115. 176 et 212.

*http://www.edpsciences.com/guilpin/

368

Page 353: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

25. ÉTUDE DES DÉPENDANCES DANS LE CAS LINEAIRE

Tableau 25.4.-

0123456789

M o y e n n eVariante

Valeur d e X

Ylj Yzj Y3j Y4j Ysj

148,2 138,7 109,5 75,91 72,77155,8 141,5 100,7 96,89 0,33146,5 151,2 107,3 68,32 82,47142,8 141,3 126,l 59,47 -57,Ol141.6 145,5 123,8 79,55 76:75155,5 129,8 118,3 69,59 30.85146,l 144,2 109,2 47,4 55,81140>2 139,3 115,l 81,36 62;44165,4 137,l 109,4 89,73 54,27151,l 140,4 112,5 31,05 4.76149,3 140,9 113,2 69,93 38.3461,Ol 31,54 60,18 389,9 10941,o70,o 80,O 115,O 176.0 212,o

Le calcul de A donne 50,57. Il y a environ deux chances sur 1 0 ‘” dc pouvoir dépasser cettevaleur. On renonce donc à l’hypothbe de l’homogknéité des varianccs conditionnelles c+, l’on vachercher 1me loi h”(z) qui rende les variantes homogènes. On essaye la loi h”(z) = exp(z/39,0)et l’on recommence les calculs. On trouve alors : A = 4,516 et la probabilit,k de dépassercette valeur est P = 0,211. R.appelons que l’on a perdu un de@ de liberté en choisissant)h”(z) = exp(z/39,0) et dOIIC il convient de calculer UI~C valeur du x2 a k - 2 dcgrk de libertk.À prbsent, il n’y a aucune raison de rejeter l’hypothèse dkmc variation cxponenticllc desvariances, les données expbrimentalcs ne la contredisant pas.

Sur le Web(*) , on donne le programme varian-2. c qui réalise cette simulation.

2.3. Les distributions sont gaussiennes

Il faut vérifier le caractère gaussien des yyij pour chaque valeur fixk de 1:. C’est le critère du xLqui sera le plus souvent utile, quoique l’aplatissement et la dissymktrie rendent kgalcment dcgrands services.

3. Conclusions

Nous ~O~IS évoquk les conditions idéales d’applicat,ion dc la méthode des moindres carrés quenous avons déjà présentée au chapitre 4 à propos de l’interpolation. En pratique les trois critCresne sont pas toujours vérifiés sirnultankment, mais ce n’est pas pour cela que l’on va renonceraux mtthodcs d’analyse de corrélatiorl-régression et, cn particulier à la méthode des moindrescarrés.

Il a bté montré notarnmcnt que l’estimat,ion des coefficirnts de corrélation par la mbthode desmoindres car& conserve toutes les bonnes propriétks à condition que n, soit grand devant, 1.

*http://www.edpsciences.com/guilpin/

369

Page 354: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

même si la variable dépendante n’est pas distribuée normalement à condition toutefois que leserreurs de mesure soient indépendantes. On dit alors que la méthode des moindres carrés estrobuste.

4. Éléments de bibliographie

s. AÏVAZIAN (1970) Étude statistique des dépendances, Moscou.H. CRAMER (1945) MathematicaZ methods of statistic, Princeton.P. DAGNELIE (1998) Statistique théorique et appliquée, de Boeck.R. RISSER et C.E. TRAYNARD (1969) Les principes de la statistique mathématique, Gauthier-

Villars.H. VENTSEL (1973) Théorie des probabilités, Éditions MIR, Moscou.

3 7 0

Page 355: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

26 Analyse de cordationet de régression

1. La corrélation

Dans le chapitre précédent, nous avons vu que deux variables aléatoires pouvaient avoir unecertaine tendance à varier simultanément. La visualisation des données sur un graphique aidefortement à caractériser une éventuelle dépendance ; c’est la dépendance linéaire qui donne toutesa puissance à l’analyse de corrélation. Avant de s’attaquer à la détermination des paramètres dela liaison de corrélation, il convient de s’assurer de l’existence effective d’une telle dépendance,et c’est l’étude du coefficient de corrélation qui permet de répondre à la question.

1.1. Calcul du coefficient de corrélation dans le cas où les variantes conditionnellessont homogènes

Le calcul du coefficient de corrélation et son interprétation ne fonctionnent correctement quedans le cas d’une dépendance linéaire entre les variables aléatoires. Si une telle dépendance nepeut être envisagée, c’est au rapport de corrélation que nous aurons affaire. Pour l’instant, onsuppose, que l’on a établi le caractère linéaire de la dépendance entre les deux variables aléatoires77 et [. Ainsi le coefficient de corrélation est défini par l’expression :

r zy = M {CE - M[E11 (7 - ~M)I .llmm

La valeur empirique ou estimateur est donnée par les expressions :

soit encore :

3 7 1

Page 356: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

expressions dans lesquelles mi est le nombre d’tlkments dans l’intervalle a, et + est le milieu(centre) de l’intervalle i.

Nous verrons en appendice de quelle manière ces expressions sont transformées lorsque lesvariantes conditionnelles ne sont pas homogènes. Quoi qu’il en soit, T,~, est un coefficientcalculable pour 1111 systkne quelconque de deux variables akatoircs ct sa valeur est, compriseentre -1 et +l.

Dans le cas où les distributions des variables rl et < sont gaussiennes, le coefficient decorrelation admet une signification concrète en tant que caractéristique de l’intensit,i: de liaisonentre les variables. Ainsi :

1. lF,,I = 1 confirme une dépendance fonctionnelle linéaire, il n’y a pas d’aspect statistique.2. F,., = 0 rnontrc la complète indkpendancc des variables.3. Les deux moyennes, les deux variantes et le coefficient de corrélation dorment une inforrnation

exhaustive sur la dépendance stochastique des variables étudiks.

Dans le cas où les distributions des variables ‘1 et < ne sont pas gaussiennes, le coefficient decorrélation ne peut être adoptk que comme l’une des caractéristiques possibles dt l’intensité dela liaison. Il s’ensuit que 1’iutcrprPtation n’est pas sûre, et notamment :

1. v.rv = 0 ne signifie plus l’indépendance,2. lïzyl = 1 ne signifie pas nkcessairement la dépendance linéaire.

Remarque : Une dépendance 6troite entre deux variables aléatoires ne signifie en aucunesorte une interdkpendance causale. Il y a une corrélation ktroite entre l’arrêt des voitures etl’apparition d’un feu rouge. Si l’on SC place du point de vue du physicien le feu rouge n‘estpas une cause qui arrête véritablement les automobiles. Si 1’011 se place du point de vue dujurist,e la corrélation entre. non plus l’arrêt du véhicule mais le comportcmrnt du chauffeur. tt,l’apparition du feu rouge est une causalité à caractère juridique. Autrement dit la corrélationentre le véhicule et le feu rouge est factice, tandis qu’tllc ne l’est pas entre le chauffeur ct le feurouge.

1.2. Distribution empirique du coefficient de corrélation

Le but de ce paragraphe est d’établir le bien-fondt: d’une liaison de corrélation. Dans le cas oùles distributions des variables sont normales et où la taille n dc l’khantillon est grande devantl’unité, on peut alors montrer que la distribution de FCzcu est normale en première approximation.sa moyenne étant T et sa variancc donnke par l’expression :

(g = (1~ ?-“YT n, - 1

372

Page 357: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

26. ANALYSE DE CORRÉLATIONETDE RÉGRESSION

Il faut noter que cette approximation devient très grossière pour n prenant des valeurs dequelques unités ou pour T voisin de 1 en valeur absolue.

Cette approximation par une distribution normale nous permet de tester l’hypothèse d’uneabsence de liaison de corrélation, soit T = 0. Si T = 0, la grandeur

suit une loi de Student à (n - 2) degrés de liberté.On cherche dans la table de la loi de Studcnt la valeur tcY(n ~ 2) du point de pourcentage Q:

qui est le seuil de signification que l’on choisit usuellement égal à 0,05.Si w < ta(n - 2), on rejette alors l’hypothèse d’une liaison de corrélation avec la probabilité

û: de la rejeter à tort.

Intervalle de confiance pour la vraie valeur du coefficient de corrélation - On utilise le faitque la distribution de T est normale. On évalue les limites du domaine au moyen des relations :

u,/2 est le point de pourcentage lOOa/2 de la distribution normale réduite. Il en résulte que Tappartient à cet intervalle avec un niveau de confiance (1 - cr) à condition toutefois que T nesoit pas trop près de 1 et que n soit suffisamment grand (plusieurs dizaines).

1.3. Cas d’une dépendance non linéaire, rapport de corrélation dans le cas où les variantesconditionnelles sont homogènes

Dans le cas où la dépendance s’écarte notablement de la forme linéaire, le coefficient decorrélation perd son sens en tant que caractéristique de l’intensité de liaison entre les deuxvariables aléatoires. On utilise alors le rapport de corrélation pT,/c qui est beaucoup plus sûrparce que son interprétation ne dépend pas de la forme de la dépendance de la régressionétudiée. Le rapport de corrélation est donné par l’expression :

avec

a=1

si exprime la dispersion des moyennes partielles & autour de la moyenne globale y, et si mesurela dispersion des résultats individuels autour de la moyenne globale y.

Contrairement au coefficient de corrélation, les rapports de corrélation pslc et pc/,,) ne sontpas symétriques, en revanche, les propriétés de T et de p sont très semblables :

1. p est compris entre -1 et +l.2. Si jpl = 1, il existe une dependance fonctionnelle univoque entre 17 et < et réciproquement.

373

Page 358: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

3. L’absence d’une liaison de correlation entre 7 et [ signifie que p71c = 0. Réciproquement,si pv/( = 0, alors & = ?j. Les moyennes vi ne dépendent pas de x, autrement dit la droitecorrespondante de régression est parallèle à l’axe horizontal.

Remarque : Il n’y a pas de dépendance simple entre pslE et P</~,, et la non-corrélation de q et< ne signifie pas nécessairement la non-corrélation de < et 77.

Absence d’une liaison de corrélation - Tout comme le coefficient de corrélation, $,C suit uneloi normale pourvu que n soit au moins de l’ordre de quelques dizaines.

Ici encore, dans le cas où :

on cherche dans la table de la loi de Student la valeur t,(n - 2) du point de pourcentage CY quiest le seuil de signification.

Si l’on est amené à rejeter l’hypothèse d’une liaison de corrélation, on le fait avec laprobabilité cz de la rejeter à tort. Dans le cas contraire, cela veut dire que la liaison étudiée eststatistiquement significative.

Remarque : Il est possible de montrer que le rapport de corrélation ne peut être inférieur à lavaleur absolue du coefficient de corrélation r. Dans le cas d’une dépendance linéaire, les deuxcaractéristiques coïncident et, par conséquent, la différence $,< - F& est une mesure de l’écartde la dépendance de régression par rapport à la forme linéaire.

1.4. Cas où les variantes conditionnelles ne sont pas homogènes

On suppose alors que l’on a trouvé les deux fonctions h2(x) et g”(y) qui rendent homogènes lesvariantes conditionnelles :

LI[ql< = x ] = a;h2(x) et D[EI77 = Y1 = $i72(Y).

On pose alors :

1 1wfi = h2(xi) et wgi = g2(yi)

Wf=Cwfi e t Wg=Cw,,2=1 2=1

où zi et yi sont les centres des intervalles de regroupement respectivement pour z et pour y.Dans ces conditions, on a une autre expression du coefficient de corrélation :

{( j$j $ --Wf;XiYi ~ XY

F,, =Z-1 )C

$ CWgiXitJi - ic)1-12g ix1

{s&/“&/}1’2

374

Page 359: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

26. ANALYSEDE CORRÉLATIONETDE RÉGRESSION

=2sz = $ g- wgi(xi - E)"g i=l

et 2; = $ Cwgi(yi - c)2.g 2=1

Les relations surmontées d’une barre sont obtenues avec les valeurs de h2(zi) tandis que cellessurmontées d’une double barre sont obtenues avec les valeurs de g”(yi).

Remarque : Le signe de T doit coïncider avec le signe des facteurs sous le radical (les signes desexpressions situées entre les accolades sont les mêmes).

D’une façon semblable, le rapport de corrélation prend la forme suivante :

2. Régression linéaire

L’analyse de corrélation nous a montré que deux variables aléatoires sont liées. Maintenant, ils’agit de déterminer la forme générale de la liaison étudiée, puis d’estimer les paramètres entrantdans l’expression analytique de la liaison. Les seuls renseignements dont nous disposons sont lesdonnées expérimentales.

Il n’y a pas de méthode standard pour obtenir la forme analytique de la liaison, cependant,la connaissance de la nature du problème est utile pour orienter les choix adéquats. Il convientd’ajouter que les fonctions à partir desquelles la liaison entre les variables est décrite doiventêtre linéaires par rapport aux paramètres à déterminer. Dans le cas où la dépendance n’est paslinéaire, il s’agira alors de décrire une dépendance curviligne et l’on utilisera une parabole dedegré peu élevé.

Pour ce qui concerne l’estimation des paramètres, elle sera obtenue en règle générale par laméthode de moindres carrés à partir des données expérimentales. C’est pour cette raison quel’on demande la linéarité des fonctions par rapport aux paramètres à déterminer : la dérivationde la forme quadratique (définie positive) par rapport à chacun des paramètres à déterminernous conduit à l’obtention d’un système linéaire que nous savons résoudre.

2.1. Calcul des paramètres par la méthode des moindres carrés

On suppose que nous avons vérifié sur les variables aléatoires x et y un certain nombre depropriétés qui sont les suivantes :

1. il existe entre les variables une liaison du type de celles que nous avons évoquées au chapitreprécédent ;

375

Page 360: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2. les variables sont gaussiennes et les résultats d’observation sont bien dus au hasard :3. la variante de la variable dépendante satisfait soit à l’homogénéité des variances condi-

tionnelles D[~l<1 = cri, soit à une certaine loi h’(x) qui rend les variantes conditionnelleshomogènes D[~/lz] = a2h2(x) ;

4. la liaison étudiée est statistiquement significative, c’est-à-dire que la valeur du coefficientde corrélation ou du rapport de corrélation est suffisamment éloignée de zéro pour quel’hypothèse d’une absence de liaison de corrélation ne puisse pas raisonnablement s’expliquerpar des fluctuations dues au hasard;

5. la forme de la régression est linéaire du type Y = aX+b’. Si cela n’est pas le cas, on transforrnela variable de telle sorte qu’on trouve une forme linéaire.

En définitive, il convient d’obtenir des estimateurs de a et b’. Il faut bien comprendre qu’ils’agit effectivement d’estimateurs car ces valeurs dépendent de l’échantillon.

2.2. Méthode des moindres carrés

Pour déterrniner la droite empirique de régression, on minimise la somme des carrés des résidusc’est-à-dire la variante empirique s2 des données expérimentales par rapport à cette droite, soit :

et wi = h2(x2)

Calcul de la droite de régression - Notons d’abord qu’il est plus habile d’effectuer les calculsde la droite par rapport au barycentre des abscisses qui n’est rien d’autre que la moyenne de 2.On écrira donc la loi sous la forme :

avec jj-,t cxi.i=l

e t

Cette remarque n’est pas une coquetterie, non seulement les calculs se retrouvent beaucoup plusaisément par ce procédé mais a et b s’avèrent être des variables (estimateurs) stochastiquementindépendantes à la différence des variables (estimateurs) à et 6’.

Si on dérive l’expression de s2 par rapport à ü et b et qu’on annule les dérivées, on obtientalors :

IfA&--

yixi ~ nxy5 " ~_

mfyixi - nxy

a= i=l i=l - S?J

ns$-=TA,

ns?..I SX

3 7 6

Page 361: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

26. ANALYSE DE CORRÉLATION ET DE RÉGRESSION

avec

Dans le cas où O[v]<] = C~~‘(X), on obtient un autre jeu d’expressions :

b = & c uiyi = jj = 1L ’ c wimigii=l

cwimi i=l

i=l

e t

On remarquera que b n’est plus simplement relie au coefficient de corrélation comme dans lecas d’une variante constante.

2.3. Estimation de la précision

a - Sur /es paramètres 5 et 6 - Il s’agit de déterminer les intervalles de confiance pour laligne de régression inconnue à partir de l’expression de la droite estimée :

Y = a(x - z) + 6,

alors que la droite Y = a(z - Z) + b est inconnue.La distribution de Student à (n ~ 2) degres de liberté permet de résoudre le problème qui

consiste donc a déterminer la précision sur les coefhcients a et 6. On calcule pour ce faire lesquantités suivantes :

Sf = i 2 [xi - Z12 e t s2 = f 2 [y, - Y(Xi)]’i=l r=l

à la suite de quoi, nous pouvons affirmer que :

1. b-t a,& - 2)5 < b < b + t,,& - ‘45,

2. a ~ t,,2(n - 2)A.y, fi

< a < E+tn,2(n-2)LS:Xfi~

avec la probabiliti: (1 - CX) de tomber dans

chacun de ces intervalles.

Sur le Web (*), on trouvera le programme regres . c qui calcule l’incertitude sur la pente dela droite de régression.

*http://www.edpsciences.com/guilpin/

377

Page 362: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Pour une valeur donnée x0 de la variable x - On peut montrer que la variable :

suit pour toute valeur fixée de IL: la distribution de Student à (n - 2) degrés de liberté.La différence entre la valeur moyenne empirique Y(Q) et la valeur théorique Y(Q) ne dépasse

pas en valeur absolue la grandeur :

c - Cas des variantes conditionnelles non homogènes - Il est bien entendu que toutes lesformules de ce paragraphe doivent être modifiées au cas où les varianccs conditionnelles ne sontpas constantes. Les expressions prennent alors la forme suivante :

1 . b-t4(72-2) & <b<b-Q,(n-2) +

ù c wim,i=l

2. UE

avec

e t Z = -& -g wixi.i=l

2.4. Régression multilinéaire, estimation de la précision

À la fin du chapitre concernant l’interpolation, nous avons étudié les systèmes linéaires surdé-terminés qui s’écrivent :

m

c alkxk f ak = 0,

k=O

3 7 8

Page 363: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

26. ANALYSE DE CORRÉLATION ET DE RÉGRESSION

pour 1 = 0, 1,2,. . , n. Soit en notation matricielle :

AX=b, (26.1)

A étant une matrice de n lignes et de m colonnes (avec m < n). Le système des équationsnormales associé au système surdétermine s’écrit alors :

[ATA]X = [AT]b, (26.2)

expression dans laquelle AT est la matrice transposée de la matrice A. Il est intéressant de pou-voir estimer les incertitudes qui entachent les résultats obtenus. La résolution du système (26.2)fournit une solution que l’on note Z(&, [i, [z,. . , trn) et 1 ‘on désire obtenir les valeurs de ladispersion LTI, sur chacune des valeurs &. Pour cela on calcule d’abord la dispersion <T sur lesvaleurs des seconds membres, on l’obtient en calculant d’abord la somme des carrés des résidus :

R2=g [@k+~k]‘>

a est donné par l’expression suivante :

C+L.

Désignons par dlk les éléments de la matrice D = [ATA]-’ (’inverse de la matrice des équationsnormales). Alors la dispersion ak sur chacune des valeurs <k: est donnée par l’expression :

Il est aisé d’obtenir la matrice de corrélation rqp entre les variables zq et xp :

Le programme surdeter. c mentionné à la fin du chapitre 6 sur l’interpolation s’occupe decalculer la matrice de corrélation et les incertitudes sur les valeurs calculées des inconnues; ledétail des calculs se trouve dans l’ouvrage de H. Mineur cité en bibliographie.

Remarque : Si le coefficient de corrélation entre deux variables est proche de l’unité (hormisles éléments de la diagonale), cela signifie qu’il faut supprimer dans le modèle l’une des deuxvariables.

3. Éléments de bibliographie

S. AÏVAZIAN (1970) Étude statistique des dépendances, Moscou.H. CRAMER (1945) Mathematical methods of statistic, Princeton.H. MINEUR (1938) Technique de la méthode des moindres carrés, Gauthier-Villars.R. RISSER et C.E. TRAYNARD (1969) Les principes de la statistique mathématique, Gauthier-

Villars.H. VENTSEL (1973) Théorie des probabilités, Éditions MIR, Moscou.

379

Page 364: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A.

B.

C.

D.

E .

F .

G .

H .

ANNEXES

Les suites de Sturm. Application à la déterminationdu nombre de racines réelles d’un polynôme . . . . . . . . . .

Polynômes orthogonaux relativement à une fonction poids.Généralisation de la méthode de Gauss . . . . . . . . . . . . . . . . . . .

Les fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Les approximants de Padé et de Maehly . . . . . . . . . . . . . . . . . . . . .

Calcul des fonctions de bibliothèque élémentaires . . . . . . . .

Calcul numérique des fonctions de Bessel . . . . . . . . . . . . .

Éléments succincts sur le traitement du signal . . . . . . . . .

Problèmes et exercices.. . . . . . . . . . . . . . . . . . . . . . . . . .

. .

. .

. .

. .

.

. .

.

.

.

. . .

. .

.

.

.

. .

.

. .

. . .

. .

. . .

. .

.

.

. . .

. .

. .

3 8 3

389

397

. 405

. 421

. 429

433

443

1 . Corrigés des problèmes et exercices.. . . . . . . . . . . . . . , . . . . . . . . . . . . . . . . . . 497

381

Page 365: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A Les suites de Sturm.Application à la déterminationdu nombre de racines réellesd’un polynôme

En 1829, le mathématicien Charles Sturm (180331855) fait paraître un mémoire, célèbre alors,consacré à la détermination du nombre de racines réelles d’une équation f(x) = 0. L’intérêtest avant tout théorique, et, comme on s’en apercevra au cours des applications pratiques,les suites de Sturm ne sont pas d’un emploi aussi aisé qu’une première impression pourrait lelaisser supposer dans la mesure où leur usage impose une très grande précision dans les calculsnumériques. L’introduction des erreurs d’arrondi à chaque étape des calculs conduit d’une façonquasi inexorable à des résultats aberrants. Ceci explique la limitation des suites de Sturm aucas des polynômes de degré assez faible (quelques unités) à coefficients entiers.

1. Notion de variations d’une suite numérique

Considérons une suite numérique quelconque finie ou infinie notée aa, a1 , a2, . , ak, . . . On ditqu’il existe une variation dans cette suite lorsque deux termes consécutifs possèdent des signesopposés. Autrement dit, il existe une variation lorsque le produit de deux termes consécutifs estnégatif. Par exemple, considérons la suite finie suivante : 15,12, -8, -7,18, -15, -12, -4,7,9.

Cette suite possède quatre variations ou quatre changements de signe. C’est sur cette notionde variations dans une suite que repose le théorème de Sturm.

2. Suite de Sturm générée à partir d’un polynôme

Soit un polynôme de degré n, à coefficients réels, que l’on note P,(Z). À partir de P,(Z), on

génère une suite de polynômes Qj(z) dé me ainsi : on pose &O(Z) = P,(s) et QI(Z) = PA(z),fi .F’;(X) étant le polynôme dérivé de P,(X) par rapport à 2. Ensuite, on divise &O(Z) par QI(X).On obtient alors :

&O(X) = (aoz + bo)Ql(z) + %-2(x),

expression dans laquelle on a désigné par &-2(x) le reste de la division, c’est au plus unpolynôme de degré (n - 2). On pose alors :

Q2(x) = -Rn-2(x)

On opère de la même façon en divisant QI(Z) par Q~(x), ce qui s’écrit :

QI(X) = (alz + h)Qz(x) + S-:s(x),

383

Page 366: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUME~RIQUEAPPLIQUÉ

le reste de la division R,,-:{(z) étant un polynôme de degré est au plus (n. - 3). À nouveauon pose Q3(x) = -R1L-3(x). N ous allons poursuivre les mêmes opérations jusqu’a ce que nousparvenions au terme ultime de la suite :

Qn(x) = -R”(z),

où IX~(Z) est alors une constante. La suite des Q~(z) s’appelle suite de Sturm. Pour des raisonsde concision d’ecriture, on peut désigner par rnj la quantité (n,jX + b,), et l’on obtient la relationde rccurrcnce entre trois polynômes consécutifs :

avec les deux prerniers polynômes de la suite : &a(~) et Qr (x)

3. Quelques propriétés des suites de Sturm

D’abord, nous allons supposer que le polynôme PTI,(~) ne posstde aucu11c racine multiple.autrement dit, Qc)(z) et Q ( )r z n’ont aucune racine commune. Sous cette hypothèse, on déduitles propriétés suivantes :

a . Q,, (.z) est une constantc differente de xero. En effet. Qn (XT) est le plus grand commun diviseurde Q”(X) et de QI(Z), et si QT1( z es e a à zéro cela signifie que &a (XT) ct Qr (x) ont au) t ‘g 1moins une racine commune ce qui est contraire à l’hypothèse.

b. Deux polynômes consécutifs Q~(z) ct Qk+r(* )L ne possèdent, aucune racine commune. Eneffet, la relation de récurrence montre que, s’il n’en était pas ainsi, Qk+a(.~) s’annulerait aussiet ainsi de suite jusqu’à QTL(x) q ui serait nul ; mais nous VCIIOI~S d’etablir au paragrapheprécédent que cela n’était pas possible.

c. Si, pour une valeur z = q de la variable, le polynôrne Q~(z) s’annule, la relation de rccurrencenous donne :

Qk-(v) = -Qk+2(71) ou encore Qk(q) Qk+z(q) < 0.

d. Lorsque Q”(z) s’annule pour la valeur II: = 6, le rapport Qa(z)/Qr (x) passe du négatif aupositif quand z passe par < par valeurs croissantes. Ceci n’est vrai qu’au voisinage immédiatde la racine de Q”(X) dans un domaine où QI(x) garde un signe constant on rappelle queQ~(z) ct QI(X) n’ont pas de racine commmle.

Comme par hypothèse < est une racine simple, nous pouvons écrire :

Qo(x) = (x - C)(Q,,-1 + a-~(~ - I) + . )

À ce propos, signalons qu’on peut toujours écrire la deuxième parenthesc du deuxième membresous forme d’un polynôme IL-r (z) de degré (n ~ 1) :

rI,,-,(x) = c,, + CL,,-IZ + c,,-&x2 + ‘. + ClZ 71-1

Le changcmeru de variable x en z ~ [ permet d’écrire :

384

Page 367: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE A. LESSUITESDE STURM

D’un autre côté, on peut krire QI(z) sous la forrne :

QI(x) = a,,,-1 + ~cu,-~(z - <) + ~cx,-:~(z - Q2 + . . + (n - l)rul(x - PJ-l.

Dans le voisinage immédiat de la racine <, c’est-à-dire dans le domaine ([ - $, < - E”) oùQI(z) n’a pas de racine, on peut écrire :

g# = (x-E)= = (x - E)

les signes sont donnés ci-dessous :

X < - E2 I x - E2

Qc~(x)QI(X)

0 +

Il s’ensuit que Qui et QI(z) ont 1eurs zéros entrelacés. À présent, il nous faut envisager lccas des racines multiples. À partir d’un certain rang, noti: (p + l), q ui ne diipend que de l’ordrede multiplicité des racines, la suite des polynômes devient identiquement nulle. Le polynômeQ,(x) est alors le PGCD de Q”(x) et QI(z). Si l’on pose :

Q; = Qk(x)Q,(x)

alors la nouvelle suite Qo (x), QT, Q5, . . QG est une suite de Sturrn, et le polynôme QG n’a plusque des racines simples. Ainsi s’est-on ramené au cas précédent.

4. Le théorème de Sturm (1829)

Soient IL et b deux nombres réels tels que a < b. Le nombre N de racines réelles du polynômePT1(x) à coefficients réels et de degré n, qui sont comprises entre a et b, est égal à la différencedes variations prises par la suite de Sturm {Q,(x)} aux points a ct b : N = N(a) - N(b), oùN(y) désigne le nombre de variations de la suite de Sturm {Q,(x)}.

Démonstration

Pour parvenir à nos fins, nous allons faire croître la variable x depuis la valeur a jusqu’à lavaleur b. Chaque fois que l’on passe par une racine < de Qk(z), les signes des deux polynôrnesvoisins Qk-l(x) et Qk+l(x) sont conservés et demeurent, bien sur, opposk. Que lc signe deQ,+~(z) change ou non, le nombre de variations de la, suit,e Part>ielle Qk,-, (CI:): Qk(x) et Qk+l (x)ne change pas. Donc, d’une fa$on générale, le fait de passer par une racine d’un polynôme Qk(x)ne change pas le nornbrc de variations de la suite excepté si k = 0. En effet, dans cc derniercas, au passage de chaque racine de Q”(z), le rapport Q”(x)/Ql(x) passe du négatif au positifpour les x croissants et l’on perd alors une variation. Il est évident qu’une racine muItiple n’estcomptke que comme racine unique, et il est indispensable d’examiner en détail la suite des Q,j (x).D’un point de vue pratique, le nombre total de racines réelles est donnk par :

NI = Iv-cm) - N(+oo).

Dans cc cas, seul le coefficient du degri: le plus élevé dc chaque polynôrne Qj (z) est, utile pourcalculer NI.

3 8 5

Page 368: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M ANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Le nombre de racines positives est donné par :

Nz = N(0) - N(+~O).

Il faut, pour calculer Nz, connaître les coefficients des termes de degré zéro dans chacun despolynômes (il s’agit de la constante). Nous pouvons donc en déduire que, pour qu’un polynômede degré n possède n racines réelles, il faut que les coefficients de degré le plus élevé soientpositifs pour chacun des polynômes de la suite de Sturm. Par ailleurs, pour qu’un polynômen’ait que des racines positives, il faut en plus que les termes de degré zéro aient des signesalternés. Insistons sur le fait que le théorème de Sturm peut se révéler très efficace pour localiserune racine ou pour vérifier qu’il existe ou non une racine dans un domaine choisi à l’avance (finiou infini).

5. Disposition des calculs, schéma de Routh (1831-1907)Le but de cet algorithme (1905) est avant tout d’éviter les nombres fractionnaires résultant dela division de deux polynômes consécutifs. À cette fin, il suffit de multiplier tous les coefficientsdu dividende et tous les coefficients du diviseur par deux nombres tels que le reste et le quotientn’aient pas de nombres fractionnaires comme coefficients. On dispose sur deux rangées lescoefficients de Q~(z) et de &I(X) selon les puissances décroissantes.

a0 a1 CL2 a3 u4 . . G-1 a,b. bl bz b3 b4 . . b,+l b,.

On calcule une troisième rangée de termes appelés cj possédant (n - 1) termes et que l’onexprime facilement à partir des uj et des bj au moyen de la relation :

c3-1 = boa, - aobj avec j = l...n.

Cette ligne correspond au reste partiel de la division de Q~(z) et QI(Z), on obtient le restedéfinitif en calculant une quatrième rangée de termes dj exprimée au moyen d’une combinaisonlinéaire des b.j et des cj :

dj-i = cobj - bocj.

La rangée des dk est donc l’ensemble des coefficients, disposés selon les puissances décrois-santes, du polynôme &z(~). On recommence rigoureusement les mêmes opérations en utilisantles polynômes QI(Z) et Q~(x) ; o n p oursuit jusqu’à parvenir à Qn(x).

6. Quelques exemples de suites de SturmChaque suite de polynômes orthogonaux constitue une suite de Sturm. L’étude des zéros de cespolynômes peut être envisagée par ce moyen.

7. Mise en œuvre du théorème de SturmSur le Web (*), nous proposons le programme sturm. c qui dénombre les racines réelles d’unpolynôme quelconque à coefficients réels. Afin de limiter la taille très rapidement croissante desnombres calculés par la méthode de Routh, à chaque calcul de la suite des dj, nous effectuonsla recherche du PGCD de tous les nombres d,, puis, le cas échéant, nous procédons à lasimplification, c’est-à-dire à la division par le PGCD.

*http://www.edpsciences.com/guilpin/

386

Page 369: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE A. LES SUITES DE STLJRM

7.1. Exemple 1

Voici les coefficients dans l’ordre des puissances décroissantes d’un polynôme de degré 4.

a0 = 1 a1 = - 5 CL2 = 10 a3 = - 1 0 a4 = 4.

Ce polynôme admet deux racines réelles qui ont pour valeur 1 et 2, et deux racines complexesconjuguées 1 f i. Le programme donne :

nombre de racines réelles multiples = 0 et nombre de racines réelles distinctes = 2.

7.2. Exemple 2

Voici les coefficients dans l’ordre des puissances décroissantes d’un polynôme de degré 5.

a0 = 1 a1 = - 2 CL2 = - 1 a3 = 4 a4 = - 2 a5 = - 4 .

Ce polynôme admet une racine réelle double qui a pour valeur -1, deux racines complexesconjuguées 1 f i, et une racine réelle qui a la valeur 2. Le programme donne :

nombre de racines réelles multiples = 1 et nombre de racines réelles distinctes = 2.

7.3. Exemple 3

Voici les coefficients d’un polynôme de degré 6 :

a0 = 1 a1 = - 2 1 a2 = 1 7 5 aa = - 7 3 5 a4 = 1 6 2 4 a5 = - 1 7 6 4 a6 = 7 2 0 .

Ce polynôme admet pour racines 1,2,3,4,5,6. Le programme donne 6 racines réelles distincteset aucune racine multiple.

7.4. Exemple 4

Voici un polynôme de degré 10 qui admet comme racines : 4 fois la valeur 1 , 3 fois la valeur 2 ,2 fois la valeur 3. 1 fois la valeur 4. Ses coefficients sont :

ao = 1 a1 = - 2 0 a2 = 175 as = -882 a4 = 2835 as = -6 072a6 = 8777 a7 = -8458 a8 = 5204 a9 = - 1 8 4 8 aio = 288.

Le programme indique qu’il y a 6 racines multiples, et 4 racines réelles distinctes. Cet exemplemontre qu’il ne faut pas espérer trop de cette méthode dès que le degré du polynôme atteint ladizaine, la perte de signification des nombres calculés devient la cause principale de cette mise enéchec. Nous avons rencontré un problème semblable lors du calcul des racines d’un polynôme :si l’on dispose d’une machine utilisant 16 chiffres significatifs, on ne peut guère espérer calculerdes racines correctes pour les polynômes de degré égal ou supérieur à 13.

8. Éléments de bibliographie

E. DURAND (1971) Solution numérique des équations algébriques, Tome 1, Éditions Masson,Paris.

H. MINEUR (1966) Techniques de calcul numérique, Éditions Dunod.

387

Page 370: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

B Polynômes orthogonauxrelativement à une fonctionpoids. Généralisationde la méthode de Gauss

Compte tenu de la grande simplicité d’emploi agrkmentée d’une grande précision, on peutSC demander dans quelle mesure la méthode de Gauss est susceptible d’être gknéralisée auxcas d’intégrales, ayant bien sfir un sens, mais prksentant des singularités. Le plus souvent; cessingularités existent aux bornes du domaine d’intégration lequel peut, être fini ou infini.

Il n’est pas question de chercher à passer en revue le plus grand nombre de singularités,mais d’étudier, dans la mesure du possible, les cas les plus fréquemment rencontrés dans lesapplications. La méthode consiste à conserver les principes généraux qui ont permis d’obtenir laformule d’approximation de Gauss, et bien entendu, notre attention devra tout particulièrementporter sur l’utilisation des polynômes orthogonaux classiques.

Nous montrerons l’existence de racines de ces polynômes exclusivement récllcs et distinctes,ainsi que quelques autres propriétés générales. En résumé, ce chapitre préscntc les définitions etthéorèmes utiles pour l’établissement de méthodes d’intkgration généralisant celle de Gauss.

1. Généralisation de la notion de polynômes orthogonaux

On appelle suite de polynômes orthogonaux sur l’intervalle fini ou infini (a: 0) relativement à lafonction poids W(Z) d é finie positive ou nulle sur (a, b) une suite dc polynômes :

WC)(x), Wl(X), W2(2), ‘. > WI(~), . ”

de degré respectivement 0, 1,2,. . , 12, . et qui vérifient, les relations :

h

.Iw(~)W~(z)W~(z) dz = 0 si k # j

CI

Cela implique que :

03.1)

doit, converger quel que soit n.Remarquons que la suite n’est définie qu’à une constante multiplicative près. On peut choisir

cette constante, comme nous l’avons déjà écrit, selon divers critères que nous rappelons :

Page 371: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1. WTL( 1) = 1 pour tout n. ;b

2. orthonormalité : s ~(X)IV~(X) dz = 1, pour tout n positif ou nul ;

3. le coefficient de 18 puissance la plus élevée du polynôme a une valeur fixée à l’avance ; lorsquecette valeur est égale à 1, on dit que le polynôme est à coefficient principal réduit.

Il nous reste à justifier l’existence d’une telle suite. Considérons la suite de fonction linéaire-ment independantes :

~,x~,x2&(q ,..., x:“&fq )...

Le procédé d’orthogonalisation de Schmidt (187661959) nous permet d’obtenir un système defonctions orthogonales répondant à notre question. On obtient alors :

où W”(X),W~(X),. . ,Wl(X),. . sont respectivement des polynômes de degré 0, 1, . , n, . .

2. Décomposition d’une fonction f(x) sur la base des polynômes Wk(x)orthogonaux sur l’intervalle (a, b)

Théorème liminaire

Tout polynôme Qn(z) de degré n est représentable par une somme finie de polynômes W,(X)de degré inférieur et égal à n.

Pour démontrer cette proposition, il suffit de reprendre la technique analogue à celle que nousavons mise en œuvre lors de l’étude des polynômes de Lagrange (chapitre 6). Développons Qrl(z)selon les puissances décroissantes de 2 :

Qn(x) = uoxn + UIX n-1

Il nous suffit de remarquer, alors, que :

1. 1 est proportionnel à IV~(Z) :

1 = aoowo(x) ;2. x est une fonction linéaire de IV~(X) et WI(X) :

x = folio +~ll~oow~(~);

3. x2 est une fonction linéaire de IV~(Z), WI(X) et IV~(X) :

x2 = aozwo(x) +a12W(z) l ta22W2(x),

et ainsi de suite.

Page 372: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A N N E X E B . POLYNOMES O R T H O G O N A U X R E L A T I V E M E N T À U N E F O N C T I O N P O I D S

Ces différentes expressions reportées dans QTL(x) d onnent directement pour QTL(x) une formelinéaire en IV~(X) :

Qn(x) = boW,(x) + hWl(x) + . . + h,Wn.(x).

On en déduit la relation suivante :

bJ ~x)W,+~(X)Q,,(X) dJ: = 0

À présent, intéressons-nous à la fonction f(x) p ouvant être légitimement approchée par lepolynôme R,(z) sur l’intervalle (a, b) dans les conditions du théorème de Weierstrass ; nouspouvons écrire :

f(x) = RT<,(X) + e(x) où c(x) est le résidu ou le reste.

R,, (x) peut se décomposer sur la base des polynômes IV,(x) :

Pour obtenir les coefficients ck, il suffit de multiplier les deux membres de l’équation précédentepar w(x)Wk(x), puis d’effectuer l’intégration sur l’intervalle (a, h) dans la rnesure où celle-ci aun sens.

b ,b

Jw(x)Rn(x)Wk(x) dz = ck J w($V,,(x) dzn aen vertu des relations d’orthogonalité. En posant :

I, = ~(+V~(Z) d zJa011 peut alors écrire :

1Ck = ~

Ik J w(x)R,(~)W~(x) dz.

a.

Autrement dit, on choisit comme approximation de f(x) un polynôme R,(z) de degré n quivérifie les relations :

b b

J w(x)%(x)Wk(x) d17: =J w(x)f(x)W,(x) dza aavec k= 1,2 ,..., 71.

Du point de vue strictement mathématique, la décomposition est d’autant plus précise que lavaleur de n. est élevée. et cela en vertu du théorème de Weierstrass.

391

Page 373: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLJQUÉ

3. Racines des polynômes orthogonaux

Théorème

Les zéros d’un polynôme dc degré n appartenant à une suite dc polynômes orthogonauxrelativement à la fonction poids W(T) sur l’intervalle (a, b) sont rkels, distincts ct compris dansl’intervalle (a, b).

Considérons l’expression suivante :

elle signifie que W”(z) et W,(z) sont orthogonaux. Comme W(Z) n’est jamais II~I~ fonctionnégative dans l’intervalle (a. b), il s’ensuit nkcssaircment que W,,(z) s‘annule au moins en unpoint dans l’intrrvallc (n, b). Désignons par :x:1,22, . , xh. tous les points O<r wrj,(:l*) s’annule. Lepolynôme :

II(z) = Wn(x)(2T ~ x1)(2 - x2). . . (LE -LT&) = W,,(X)X~(2T)

conserve un signe constant dans l’intervalle (a, b). X ( )k z cs, ~1 polynôme de degré k. Faisonstl‘hypothèse que k soit plus petit que 12. Il vient :

/W(Z)WIL(~)X~(X) dz # 0

0.

puisque Wn(~)X~(2) g dil1 e un signe constant sur l’intervalle (a, b). Par ailleurs, Xk:(.z) estdkomposable en polynômes ~V~(Z) de degrk kgal et inférieur à k, soit :

X,.(x) = c d]Lv,(Lc).j=O

Il s’ensuit que :

en vertu des relations d’orthogonalité puisque ‘II # k par hypothk. On en dbduit que k doitêtre égal à n puisque l’intégrale prkckdente est diffkente dc z6ro pour k = 71. Par conséquent.ceci nous conduit à affirmer que le polynôme W71(z) de degri: n possède 71 racines rtkllcs dansl’intervalle (a: b).

Il nous reste à montrer qu’il ne peut, y avoir de racines doubles. Pour cela, supposons que lah? racine soit double, dans ce cas la forme :

II(x) = WlL(2)(2 - 21)(x - x2). (cc ~ 2,,)2.. . (x ~ X.,-l)

est définit positive sur (a, h), mais il en est de même pour le polynôme :

II(x) = WTL(L72)(X - x1)(x ~ x2). . (x - 2&l)(ll: ~ Z,!,+l). (:r - 5,,p1)

et l’on retombe exactement sur lc raisonnement prkkdcnt,. On en conclut donc que toutes lesracines sont distinctes (ou racines simples), car par lc même processus on montrerait qu’il ncpeut y avoir dc racines triples, quadruples et ainsi de suite.

392

Page 374: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

AN N E X E B. P O L Y N Ô M E S O R T H O G O N A U X R E L A T I V E M E N T À U N E F O N C T I O N P O I D S

4. Relation de récurrence entre trois polynômes orthogonaux consécutifs

Théorème

Entre t,rois polynômes orthogonaux conskutifs, il existe toujours une relation de récurrence dcla forme :

K(x) - (Anx + %)Wn-I(X) + CmW-z(x) = 0 (B.2)

où A,,; B,,, et C,, sont trois constantes qui ne dépendent que de n.Pour obtenir cc théorème, OII procedc de la manière suivante : d’abord on ajuste le coefficient

A,, cn identifiant les termes de degré n, ce qui revient à écrire que :

II(x) = W,,(x) - A,W,,-, (x)x

est 1111 polynôme de degré (n. - 1) au plus.Développons alors II(z) sur la base dc polynômes PV7 (x) :

n(x) = n()W()(x) + ulW* (.lz) + . . . + U,,-lWn-l (x).

En écrivant les relations d’orthogonalitk pour k < (n - 2), on obtient :b b

1&ll(x)W(x) dz = A,

sw(x)xWk(x)Wn~, (x) dz = 0

a a

ca,r XIV~(.~) est au plus UII polynôme de degré (n - 2). On cn conclut que :

a() = a1 = U‘J = us = . . . = u,,p:< = 0

Il suffit, dc poser : u,,-z = -CTL ct n,,- ~i ~ B, pour obtenir la relation de rkurrcnce proposée.L’intérêt, de cc theorème repose sur lc calcul effectif des coefficients des polynômes orthogo-

naux : il suffit dc connaître la relation dc rkurrence ainsi que les coefficients dc deux polynômesconsécutifs (génCralement les deux prcmicrs IVe(z) etdes autres polynômes.

5. Généralisation de la méthode de Gauss

La méthode dc Gauss généralisée s’applique au calcul

Wi(,z)) pour obtenir tous les coefficients

d’intégrales de la forme :

1 = /i(x).f(x) d z

où f(.z) est une fonction régulière sur (a, h) représentable par 1111 polynôme sur cet intervalle ctou W(T) est une fonction définie positive ou nulle sur (a, 6) p ouvant prkcnter des singularitéssans pour autant, altérer la convergence de l’intégrale 1. Du reste, dans le cas le plus @ni:ral,les singularités se présentent aux bornes a ou b du domaine, lequel, rappelons-le, peut être finiou infini selon les cas. On conserve la relation (7.12) du chapitre 7 pour calculer une valeurapprochée de l’intégrale 1, soit J cette approximation :

il

J = c %f(~~) 03.3)j=o

et 1’011 conserve également le critère précédemment retenu pour obtenir les H3 et les xJ : il fautque 1 = J si f(z) est un polynôme arbitraire dont le de@ est le plus élevé possible ; on dksignepar Q,,(X) ce polynôme.

393

Page 375: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5.1. Calcul des xj

Reprenant la relation (7.12) du chapitre 7, on écrit l’expression :

Les zj sont les racines du polynôme W,+r (x) appa,rtenant à la suite de polynômes orthogonauxsur l’intervalle fini ou infini (a, b) par rapport à la fonction de base W(X) non négative sur (a, b).

5.2. Calcul des Hj

Comrne nous avons vu que chaque polynôme IV~(X) possédait k racines distinctes, on peutencore ccrire :

n

k=O

expression dans laquelle a est le coefficient du terme de degré le plus élevé. On poursuit lescalculs de la mêrne manière que celle abordée lors de l’etude des polynômes de Legendre. Dureste il suffit de s’apercevoir que le calcul des IT, ne fait appel qu’à la seule ort,hogonalité pourobt,enir la nouvelle expression des Hj, soit :

ou bien

où K dépend de la suite particulière dc polynôrnes envisagée. Son expression est donnée par :

où QJ,~~ et UO,~~,+~ sont respect,ivcment le coefficient du terme en 9 du polynôme WT1(z) et lecoefficient du terme en z”+r du polynôme WT1+r (.z) ; ce rapport est calculé à partir de la relationde récurrence entre trois polynômes consécutifs en identifiant les coefficients des termes de degré(n + 1). Par ailleurs, 1, est la norme de Wlz,(z) :

(B.5)

En revanche, pour obtenir une expression analogue à (7.17) du chapitre 7, il sera nécessaired’examiner chaque suite particulière de polynômes orthogonaux.

6. Expression de l’erreur en remplacant I par J

L’expression (7.20) du chapitre 7 est quelque peu modifiée bien que le calcul demeure le mêmedans son principe. On obtient alors :

I3 = (u:;f)2”up~ If (P+“(,) [(2n + 2)!

où ITz+r est la norme du polynôme I%$&+~(X) et u7Ltr le coefficient principal (coefficient de &‘).

3 9 4

Page 376: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE B. POLYNÔMES ORTHOGONAUXRELATIVEMENTÀ UNE FONCTIONPOIDS

7. Éléments de bibliographie

G. HACQUES (1971) Muthématiques pour l’informatique, Armand Colin.F. HILDEBRAND (1956) Introduction to the numerical analysis, Mc Graw-Hill.A. LICHNEROWICZ (1960) Algèbre et analyse linéaire, Masson.H. MINEUR (1966) Techniques de calcul numérique, Éditions Dunod.H. STAHL et V. TOTIK (1992) Gen,erul orthogonal polynomials, Cambridge University Press.

395

Page 377: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

C 1 Les fractions continues

Aujourd’hui, l’enseignement traditionnel effectuk en France ne fait plus guère état dc l’cxistencctics fractions continues, pourtant ces êtres mathématiques ne sont pas tombés c:ompl~terrle:rIt endésuét,udc car ils demeurent un remarquahlc procédé de calcul des fonct,ions usucllcs qui sontinstallées dans les calculateurs. De plus, l’ktude des approximants dc Padk (1863-1953) ainsi queles fondernents thboriques de l’epsilon-algorithme sont indissociables des propriktks essenticllcsdes fract,ions continues. C’est la raison pour laquelle nous avons pensb qu’il ktait utile d’enprkscnter les éléments.

1. Un exemple de fraction continue

L’cxcmple qui va nous servir d’introduction à la présentation des fractions contimles n’est riend’autre qu’un aspect du problème de l’interpolation. 011 se propose de dkterrnincr une certainefraction rationnelle :

(C.1)

où Pn(x) et Qn( z sont chacun des polynômes de degré rl de telle sorte que c/ prenne la valeur)bj quand z prend la valeur aj. On voit que 2r> + 1 couples de valeurs sont nécessaires B ladétermination de la solution; on les numérote de 0 à, 2~1. On peut écrire (C.l) de la fac;onsuivante :

2 - a0yzbo+Q71.(Z) cc.21

~‘,,-l(~)

cette forme montre bien que y = b. quand z = ajo. Écrivons que l’expression (C.2) prend lavaleur b,, quand J: = nj (j # 0) :

CC.31

le second rnembrc n’étant rien d’autre que l’inverse de la différence première divisée : notons-la 6(no, aj), j prenant les valeurs 1,2, . .2n. Rappelons C~IE les différences divisées sont lesdiffkrcnces premières, deuxièmes etc. (rencontrées lors de l’étude des polynômes d’interpolation)divisées chaque fois par un terme du type (a,, - uk) j # k.

397

Page 378: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANIJEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Rien ne nous empêche de traiter l’équation (C.3) comme nous avons traité l’équation (C.l)en écrivant :

Écrivons que l’expression (C.4) prend la valeur b, quand z = a3

cc.41

(j # Ql) :

cc.51

le second membre n’étant, rien d’autre que l’inverse de la différcncc deuxième diviscc ; notons-la&(a~, ul, u3), j prenant les valeurs 2,3.. .2n.

En poursuivant la procédure jusqu’à j = 2n, et en not,ant 6(urj, ar, ~2,. (~2~) l’inverse de ladifférence 2ne divisée, on aboutit à l’expression :

y=bo+2 ~ ao

CC.61

quo, a11 +2 - a1

6(ao, a1, Q) +

x ~ a2

6(ao, a1, a2, a3) + . +x - h-1

quo, a1, a2, . , a2n)

La fonction y est donnée sous forme appelée fraction continue, et l’on verra un peu plus loincomment calculer numériquement une telle expression au moyen de relations de récurrence quipermettent d’obtenir la quantité définie par la relation (C.l).

2. Les fractions continues finiesPar définition, on appelle fraction continue R,, d’ordre n une expression telle que :

R, = bo +a0

h +a1

b2 +a2

+b:s +a3

+&+...FFL

Comme cette notation n’ut,ilise pas une écriture lincaire, on préfère de facon trCs usuelle lesformes conventionnelles suivantes :

R,, = bo + uo/bl + ai/bz + . + a+i/bn,

ou encore :

UOl Ull G-11R, = b. + - + - + . . + ~lb1 lb2 lb,, ’

ak s’appelle le numérateur partiel tandis que bk s’appelle le dénominateur partiel. si l’ondéveloppe une fraction continue finie, comme on l’a vu à propos de l’exemple précédent, elleprend la forrne d’une fraction rationnelle que l’on note :

3 9 8

C

Page 379: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE C. LES FRACTIONS CONTINUES

Toujours par définition, on appelle réduite d’ordre p (avec q 5 n) d’une fraction continued’ordre n, la fraction continue tronqke à l’ordre q, notée :

2.1. Relations de récurrence entre les termes des réduites

En krivant les réduites successives on trouve :

A0-=BO

b0,

Al Wl + a1-=h«+z= bBI

)1

A2-=bo+ u1 = oILb b b‘ + albs + albo

B2 bi + azlbz blbz + u2I

soit encore :

A2 bzA1 + uaAo-=B2 bzB1 + u2Bo

Cett>e dernière expression se généralise de la manière suivante :

p _ bpA,-1 + u,A,-2A

BT, - bpBp-1 + u&4-2((3.7)

Signalons que cette façon d’écrire contient deux égalités : celle des numérat,eurs ct celle desdénominateurs. Nous allons démontrer la relation (C.7) par rCcurrence en faisant la suppositionqu’elle est vraie pour la valeur p; examinons alors la réduite d’ordre (p + 1) :

AR P+I

p+l = ~BP+I

Pour réaliser les calculs, il suffit de remplacer b, par b, + ~,+~/b,+~ dans la réduite d’ordre p.Nous obtenons :

soit encore :

R (bb,+l + up+l )A,-1 + ~,Ap-zbl,+~‘+’ = (bpbp+l + a,+dBp-1 + a,B,-zb,+l ’

ce qui peut encore s’écrire :

bp+l (bTIATl-~ + a,A,-2) + ap+lAp-l’ -bp+l ~

P+I @pBp-1 + a,B,-2) + u,+~B,-~ ’

et puisqut A, = b,A,-1 + a,A,-2

e t BT, = b,B,-1 + u,B,-2

Page 380: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQTJE APPLIQUÉ

110115 oht,cnons :

Ces deux dernières relations sont celles que l’on obtient en remplaçant p par (1J + 1) dansles equations (C.7). Comme les expressions (C.7) sont vraies pour p = 2, on en deduit parrCcurrence qu’elles sont générales. Par ailleurs, si l’on désire pouvoir 6galenient les utiliser pourn = 1. il suffit de choisir les convernions A-. 1 = 1 ct B-1 = 0.

2.2. Une autre relation intéressanteMultiplions A,+r p ar B, et B,+l par A rI; puis retranchons mcmlne à membre les relations derccurrence. Nous ohtcnons :

L4,+~B, - B,+lA, = -af,+l(A,,Br,-~ - &IB,,).

En posa.nt lJ,+r = A,+lB3, ~ B,+lAI,. on obtient la relation :

upfl = -%I+l p.u

Comme Ur = AIBu - B,Ao = ai, on trouve en définitive :

ou encore. cn divisant (C.2) par le produit BI,B,,+l, on établit :

upfl A_ P+I%%+I Bp+r

(C.8)

cc.91

2.3. Propriétés essentiellesOn adrnettra sans dCmonstration les deux propositions suivantes :

1. les polynômes A, et BT, des variables aTa, ar, a~, . . , ulI: bo, bl, hz, . . b, sont, irrcductihles entreeux. ou encore premiers entre eux, si les va~riahles uh et les variables bh: sont indcpendantes :

2. aucune ri:diiitje ne se présente sous la forme O/O.

3. Les fractions continues infiniesDans ce cas la fraction contimre devient illimitee ct la notion de convergence s’introduit toutnaturcllcrnent lors dc Cet)te étude.

Considérons la réduite R,, d’ordre rr,. Si R,, tend vers une limite R lorsque ~1 croît ind&nment.on dira que la fraction continue est convergente et a pour limite R. Dans lc cas contraire, nousdirons qu’elle est divcrgcnte.

Remarque : Supposons que clk = 0. Les relations de recurrcncc (C.8) et (C.9) nous donnent :

&Bkpl - AkplB,> = 0.

Ak A-1-xp=

“lt’ : BA- Bk-10

donc : Rkpl = RAI = 0,

et la fraction continue est alors finie. On conclut que, si ime fraction continue est, infinic~ tousses uk sont différents de zéro.

Page 381: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE C. LES FRACTIONS CONTINUES

Calcul des ak et des bk à partir des réduites

Du point de vue numkrique, il va dc soi que le calcul d‘une fraction continue se ramène tolljours àUC approximation rkalisée au moyen d’une réduite. Cependant, il est indispensat)le d’(~xaminersous l’angle de la Fgitimité les opbrations susceptibles d’être réalisées. Il est possitk dc calculerles coeffkicnts ak et bk au moyen des réduites R,, Rqpl et Rqp2. En effet, à partir des relations dcrkurrcnce établies au paragraphe 2, nous obtenons un système linéaire dont la solutjion s’krit :

On remarquera que les relations (C.7) sont définies à u11c constante multiplicative prc’s ; onobtient alors des fractions continues dites équivalentes, tout simplement parce que tjoutjcs lesrbduites sont égales. Il s’ensuit que les réduites dépendent, dc paramètres arbitraires non nuls.Choisissons comme contrainte linéaire :

Nous pouvons écrire :

Il est souvent commode dc choisir arbitrairement les cy Cgaux à 1, on obtient alors des expressionstrès simples :

4. Développement en fraction continue à partir d’un développementen série entière

On considkre le dtvcloppement en skie suivant :

et l’on souhaite que les sornmcs partielles SP soient @ales aux rtduites R,, dr la fractioncontinue R :

Ull fiaI arr 1R zz bu + ~ + - + . . + - + . .

lb1 lb2 lb,,

Compte tenu dts résultats obtenus au paragraphe prkédent: on peut écrire :

s-1 - s,(4 = sqpl ~ s,-, et

b = sq -z-2Cl s,-1 -As,-2

Si l’on tient cornptc du fait que S, ~ S,-l = uy: nous pouvons kcrire :

401

Page 382: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

cc qui permet d’obtenir le développement suivant :

Remarque : Si nous connaissons les réduites d’une fraction continue, réciproquement: il luicorrespond une série dont le terme général Ut, s’écrit :

thk = & - Rk-1.

5. Développement en fractions continues de séries usuelles

Considérons le développement général d’une fonction en série de MacLaurin :

s = 2 QkXk.k=O

Nous obtenons, par application directe du résultat établi au paragraphe 4, le développement enfraction continue suivant :

D’un point de vue pratique, c’est-à-dire dès que les applications sont en vue, on a tout intérêtà procéder à la transforrnation de la suite des ap de la manière suivante : on forme la suite desPT> obtenue en posant :

Po = Qo

P1= Ql

pq = aq/c+l avec q > 2;

ceci a pour but une économie évidente de calcul. Par application de ce procédé, on obtient lesdéveloppements suivants :

xl 1%log,(l ~X) = - + ~

22x1 (P - U2xl~11 lpJ:+ l3-2x+-‘+ Ip-(p-:l)x+- avec lxlcl.

mxl(1 + x)7rL = 1 + II - x(m - 1)/2l x(m -P - ~)/PIIl+x(m-1)/2-“’ Il+x(m-p-l)/p-“’

avec Ix/ < 1.

xl 12x” 1arctan = - + ~

32x2 1 (2p ~ 1)2x21~11 ~3-x”+~5-3x”+“‘+~(2p+~)-(2p-~)x2+”~ aveC lxlsl.

Xl Xl 2x1exp(z) = 1 + - ~ ~ ~ ~ (P ~ 11x111 12+x 13+x +...+ Ip+x +.‘.

On notera que la convergence de la fraction continue est assurée dans le même domaine quecelui qui assure la convergence de la série entière génératrice.

402

Page 383: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE C. LES FRACTIONS CONTINUES

6. Développement en fraction continue à partir d’un produit infini

Bien que les produits infinis ne jouent pas ml rôle aussi important que celui tenu par lesdéveloppements en série entière, il est tout de meme intéressant de voir comment de tels produitspermettent de générer un développement en fraction continue. Précisons que nous limitons notreétude aux produits infinis de monômes que nous écrirons donc sous la forme :

P = fi(l + u,).i=l

Pour étudier la convergence de P, il suffit de passer aux logarithmes, ce qui permet de seramener a l’étude d’une suite classique dont le terme général se rnet sous la forme :

W - log,(l + U,,).n-

Comme les suites ~u,,I et Iw,I convergent ou divergent simultanement, il suffit de s’assurer dela convergence de lu,1 pour obtenir la convergence absolue du produit, lequel, alors, admet unelimite non nulle. Donc, en définitive, on souhaite former la fraction continue R dont les réduitesR, sont égales aux produits partiels Pc,. On entend par produit partiel d’ordre 4 le produit finides 4 premiers termes du produit infini. Puisque :

RI, = Pp = fii, + vi),i=l

nous pouvons écrire :

pq-1pq pq-1%~

uq = Pqpl - Pqp‘J = -‘uqpl - Pq-2= “4(1+ Uq-r),

uqp1

et b, = pq - pc]-2

Pqpl - Pqp2 =-1+ (1+ uq)(l + v-1) =1+ T/q(l tu,-1)

Uq-1 uq-1 ’

cc qui permet de conclure que :

b, = 1 ~ a,.

En adoptant comme notation Po = 1, cela nous permet d’écrire ba = 1, et puisque PI =1 + ~1 = RI = ba + ar/br, cela entraîne que :

a1 = ul et bl = 1,

ainsi nous obtenons la fraction continue

a11R = 1 + II + ,l-‘u2 + a31 %Il -a3

+...+ Il-aq +...

403

Page 384: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Application à quelques exemples

a4

= _ (2q - 3)V + 4x2(2q - 1)W

7. Éléments de bibliographie

C. BREZINSKI (1978) Algorith,rn,es d’accélérntion de la convergence, Éditions Technip, Paris.É. DURAND (1971) Solutions numériques des équations algébriques, Tome 1 pp. 20 et 91, Éditions

Masson, Paris.I.S. GR.ADSHTEYN et I.M. RYSHIK (1980) Table o.f Integrals, Series and Products, Academiç

Press.F. HILDEBRAND (1956) Introduction to the nvumerical analy&, Édition Mc Graw-Hill.C. ,JORDAN (1959) CO~LTS d’analyse de l'École Polgtechnkque, Tome 1, Gauthier-Villars? Paris.A-M. LEGENDRE (1955) Théorie des nombres, A. Blanchard, Paris.P. MONTEL (1957) Leçon>s sur les récurren,ces et leurs applications, ch. VI, VII, VIII et, IX:

Gauthier-Villars, Paris.H. PADÉ (1893) Sur lu repre’sentation upprochke d>une fonction, pur des fractions rationnelles.

Tome IX, p. 1, 93, Annales Scientifiques de l’École Normale Supérieure.(1899) M&oire sur les développements en fructions contiwaes de la, fonction expon,entielle

pouvant servir d’introduction, CL lu théorie des ,fractions continjues algébriques, Tome XVI.p. 395, 426 Annales Scientifiques de l’École Normale SupSrieure.

.J. TRIGNAN (1994) Introduction, uun: problèrnes d’upprozimation : fructions continues, dijj%renceCç

jin*ies~ Edition du Choix.G. VALIRON (1955). Théorie des ,fonctions, Masson, Paris.

404

Page 385: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

D Les approximants de Padéet de Maehly

Le cadre de ce chapitre a pour toile de fond l’approximation des fonctions, qu’elles soient usuellesou spéciales, que l’on retrouve très fréquemment en calcul. En filigrane, se pose le problemcde connaître les rnoyens les plus économiques qui permettent de calculer les « fonctions debibliothèque >).

C’est à H. Padé (186331953) que revient le mérite de s’être interrogé sur ces problèmes etd’avoir recherche la mcthode la plus efficace possible pour realiscr des calculs nunrcriques defonctions (voir la bibliographie). La méthode a été ensuite reprise par Maehly comme on leverra. Aujourd’hui encore bien des théoriciens continuent de poursuivre de tels travaux quidcmcurcnt ur1 vaste champ de rcchcrche. Rappelons toutefois que les approximants de Padi:sont intimement liés aux fractions continues dc Lagrange (173661813) et que les algorithmesd’accélcration de la convergence sont indissociables de ces études (cf. C. Brézinski p. 72 etsuivantes). Du reste, les publications originales de Padi: en 1892 et 1899 portent respectivementpour titre : « Sur la représentation approchée d’une fonction par des fractions rationnelles » et« Sur les développements en fractions continues de la fonction exponentielle ».

1. Le théorème fondamental de Padé

Par definition, un approximant est une fraction continue (cf. annexe C) qui a été tronquce à uncertain ordre. 11 en résulte qu’un approxirnant se présente toujours sous la forme d’une fractionrationnelle au sens le plus large.

Soit f(x) une fonction développablc en série entière au voisinage dc z = 0 qui s’ccrit :

f(x) = ao + CL12 + 42x2 +. ‘. avec ae # 0.

Considérons le polynôme dc degré 4 :

PJX) = lo + ZlX + 1 2x2 +. ‘. + l,xY = k liXL,2=0

et formons le produit :

405

Page 386: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

expression dans laquelle on conviendra que les coefficients affectés d’un indice négatif sont nuls.Égalons à zéro les coefficients de degré p + 1, p + 2, . . . ,p + q. On obtient un système linéaireconstitué de q équations à q + 1 inconnues que l’on écrit :

ap+lZo + a,11 + a,-lZ2 + . + a,-q+lZq = 0a,+& + ap+lll + upz2 + . + a,-q+zzq = 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .u,+,Z0 + u~+~-IZI + a,+,-212 + . + a,l, = 0

que l’on peut encore écrire sous forme matricielle :

ap+l aP UP-l . appq+l 10ap+2 ap+l ap . ap-q+2 . = 011

CD.11. . . . . . . . . . . . . . . . . . . . . . . . . . .

aP+q ++q-1 UP+-2 ... aP 1 (1

Comme le nombre d’inconnues est supérieur d’une unité au nombre d’équations, il est toujourspossible de satisfaire l’ensemble de ces équations par des valeurs des inconnues telles qu’ellesne soient pas toutes nulles ensemble. Si l’un des déterminants de la matrice (D.l), obtenu parsuppression d’une colonne, est différent de zéro, alors toutes les inconnues sont déterminées à unfacteur multiplicatif près. En revanche, si tous les déterminants sont nuls, alors plusieurs valeurspeuvent être choisies arbitrairement. De préférence, on s’intéresse à la suite lu, 1i, 12, . ,2, quicommence par le plus grand nombre de zéros possible. Le polynôme Pq(x) est alors divisiblepar une puissance de x dont l’exposant est noté wp4, exposant au moins égal à celui que l’onobtiendrait en adoptant toute autre solution. Cette valeur de l’exposant est nulle lorsque ls estdifférent de zéro. On note par J&(x) le polynôme dont le degré est au plus égal à p, soit :

RP(X) = f&dO + ai-lll + aie212 + . . . + ai-&Jzi zz 2 bkxk,

i=o k=O

(D.4

Alors on peut écrire :

f(x) . PV(X) = RP(X) + &(xp+q+l),

expression dans laquelle s(xP+q+’ ) est un infiniment petit dont l’ordre est au moins égal àp + q + 1. Il s’ensuit que l’on peut écrire :

ou encore : R; (xlf ( x ) = m,

dans le cas où les polynômes RP(x) et P4(x) ne sont pas premiers entre eux (RP(x) et P;(x)sont premiers entre eux). Quoi qu’il en soit, nous avons établi que la fonction f(x) pouvait êtrereprésentée ou approchée par une fraction rationnelle au voisinage de zéro. Notons que sous ladernière forme on aurait :

P;(x)f(x) = R;(z) + E(z~+~+‘).

Remarque : Comme dans l’expression de Pq(x) ou de P;(Z), il y a nécessairement un termeconstant différent de zéro, alors R,(z)/P,(s) d ffi ère de f(x) d’un infiniment petit dont l’ordreest (p + q + 1 - wpq) qui est plus grand que la somme des degrés des polynômes de la fraction.

406

Page 387: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LESAPPROXIMANTSDE PADÉ ETDE MAEHLY

Théorème de Padé

Parmi toutes les fractions rationnelles irréductibles dont les termes ont des degrés égaux au plusà p pour le numérateur et au plus à 4 pour le dénominateur, p et q étant des entiers positifsou nuls égaux ou inégaux, il y a une fraction R,(X)/P,(z) q ui fournit une approximation dontl’ordre est supérieur à celui de l’approximation fournie par une quelconque des autres fractions.

Nous admettrons ce théorème sans démonstration (cf. les mémoires de Padé).

Remarque 1 : Dans l’état actuel des choses, à notre connaissance, on ne sait pas dire quelle estcette fraction rationnelle. Cependant, l’expérience montre que ce sont les termes de la diagonalepour laquelle p et q sont égaux ou les termes de la première parallèle supérieure à la diagonale(première sur-diagonale) telle que p = q + 1, qui fournissent les meilleures approximations.Remarque 2 : On peut montrer que le nombre wpq est au plus égal à q, mais qu’il est aussi auplus égal à p.

Théorème - Les polynômes RP(x) et P4( 2 ont l’un et l’autre un terme constant différent de)zéro ; wpq désignant zéro ou un entier positif au plus égal au plus petit des deux nombres p et q,les degrés des termes &(Ic) et &(z) ont respectivement pour limite supérieure p - wPq, q - wPq ;l’ordre de l’approximation a pour limite inférieure p + q + 1 ~ wp4.

Ici encore, nous ne démontrerons pas ce théorème (cf. les mémoires de Padé).

2. Sur le calcul effectif des coefficients

AU départ, on connaît les coefficients du développement en série entière que l’on désigne par ai.Ensuite on calcule les Zk en faisant dans le système (D.l) lu = 1, ce qui permet de calculer lesecond membre du système linéaire. Comme les Zk sont définis à une constante multiplicativeprès, on peut rechercher à exprimer les Zk sous forme entière, mais cela demeure un problèmesecondaire. Pour terminer, on calcule les bh à partir de l’expression (D.2) qui se développe selonles égalités suivantes :

bl = aIl0 + a0Zl

b2 = a2Z0 + alll + a0Z2

b3 = a3Z0 + a211 + aIl2 + a0Z3bd = a4Zo + a3Zi + a2Z2 + alZ3 + aoZ4

et ainsi de suite.

3. Estimation de l’erreur commise

L’erreur strictement mathématique E[f(z)] commise en remplaçant f(X) par une fractionrationnelle s’écrit :

Pour évaluer cette erreur il est commode de revenir aux équations de départ. On peut alorsécrire :

f(x) . PAZ) = Rdx) + s,+,(x)

4 0 7

Page 388: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

où S,+,(LzT) = &(zp+q+l ). Il est pratique alors d’écrire S,+, (z) sous mie forme plus exploitable.soit :

S,+,(2) = zp+q+l g- c&ck.k=O

Les coefficients C~C décroissent en général extrêmement rapidement si bien que le premier termecc est de loin prépondérant. Aussi cette remarque permet-elle d’estimer l’erreur qui est donc del’ordre de :

Reste à calculer cg. Pour cela, il suffit de rcprcndre le developpcment dc f(z). Pc1 (z) et d’identifierles coefficients des termes en &q+‘. On obtient alors :

cO = a~+q+llo + ap+dl + . . . + a,+ll, = C lkaI,+,+l-k.k=o

4. Développements de quelques fonctions en approximants de Padé

4.1. Développements de exp(x) (exemple donné par Padé)

On part du développement en série entière :

exp(z) = 1+ : + $ + $ + f +. .k=O

Nota - Pour des raisons de commodité d’écriture, on notera l’inverse d’un nombre au moyendu nombre souligné d’une barre, ainsi g = l/z.

a - Approximation par la fraction rationnelle p = 1, q = 3 - En choisissant 10 = 1, onobtient le système linéaire suivant :

1 1 0 - 22 1 1 -66 2 1 -z

La résolution donne :

11 = -0,75

12 = 0,25

l3 = -4,166666 106’

ou encore en rnultipliant par un facteur convenable :

l. = 2 4

II = - 1 8

12= 6

13 = - 1 .

408

Page 389: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LESAPPROXIMANTSDE PADÉ ETDE MAEHLY

À partir de l’équation (D.2), on tire les valeurs des b :

b,, = 24bI = 6.

De là, on exprime l’approximant :

exp(z) =24 + 6x

24 - 18x + 6x2 - x3 .

b - Approximation par la fraction rationnelle p = 2, q = 3 - On résout le système linéaire :

2 1 1 -66 2 1 -24

2 6 2 -120.

D’où l’on tire, après multiplication par 60 :

l. = 60

l1 = - 3 6

32= 9

13 = - 1 .

En reportant ces résultats dans les équations (D.2), on accède aux bj :

b,, = 60bl = 24bz = 3.

En définitive, on obtient l’approximant :

exp(x) =60 + 24x + 3x2

60 ~ 36x + 9x2 - x3

c - Approximation par la fraction rationnelle p = q = 3 - Les équations (D.2) donnent lesystème linéaire :

!3 2 1 -24

24 6 2 -l2J

120 g 6 -72J

Après multiplication par 120, n o u s trouvons :

1” = 120

Il = - 6 0

12 = 12

13 = -1

409

Page 390: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

puis :

bo = 120

bl = 60b2 = 12b:< = 1

d’où I’approximant recherché :

exp(z) =120 + 60~ + 12~~ + x3120 - 60~ + 12~~ - CI? .

d - Approximation par la fraction rationnelle p = 4, q = 3 - Tous calculs faits, on trouve :

exp(z) =840 + 480~ + 120x2 + 16~~ + x4

840 - 360x + 60x2 - 4x3

Dans le cas présent, nous avons multiplié les coefficients lk par 4 pour obtenir les bj sousforme entière.

Avec une calculette, il est intéressant d’expérimenter ces différents approximants et d’enapprécier la précision.

4.2. Développement de la fonction de Bessel d’ordre zéro JO(X)

Jo(x) s’exprime à l’aide d’un développement en série entière donné par l’expression :

Jo(x) = -&l)k& (;)2kk=O

soit encore :

Jo -( >4 = axez’:.k=O

a - Approximation par la fraction rationnelle p = 3, q = 4 - Il faut résoudre le systèmelinéaire suivant :

-fj2 4 - 1 1 -2

g2 -52 4 - 1 1202-1202 a2 -62 4 -7202

7202 -&02 a2 -cj2 50402

10 = 1II = 0,1139373674

l2 = 0,671266 793 x 10-2l3 = 0,255 002 275 8 x 10-3

l4 = 0,565 105 603 8 x 10F5

410

Page 391: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LESAPPROXIMANTS DE PADÉ ET DE MAEHLY

On en déduit les bk :

b. = 1bl = -0,8860626326ba = 0,142 775 300 5

b3 = 0,600 355 363 x 10-2.

b - Approximation par la fraction rationnelle p = q = 4 - On donne les résultats du calcul :

1” = 1

Il = 0,113 9373674

12 = 3,315 091014 x 10-2

l3 = 8,160 869 521 x 106”

l4 = 1,084 070 461 x 10-”

puis, bo = 1bl = -0,918 085 7713b2 = 0,171400 862 3

b3 = -0,105 327 029 2 x 10-l

b4 = 0,208 963 998 1 x 10p2.

Remarque sur l’utilisation des approximants - Lorsque le degré des polynômes dépasse deux,on a alors intérêt, pour réaliser les calculs, à utiliser le schéma de Horner (178661837) qui faitgagner un nombre intéressant d’opérations. Soit dans le cas présent :

{[@4x + h)J: + h]x + bl)x + b,,{[(/4x + /3)x + 1212 + I’}X + Z”

Pour se faire une idée plus tangible des approximants, on se propose de tabuler quelquesvaleurs de JO(X).

Cette tabulation amène plusieurs remarques. D’une part, les approximants de Padé étantextraits de développements en série de MacLaurin (ou de séries entières), donc valables auvoisinage de zéro, sont également eux-mêmes valables au voisinage de zéro. Le tableau D.l, pagesuivante, montre à l’évidence que la précision de l’approximation se dégrade avec l’éloignementde l’origine. Cependant il est intéressant de noter que pour la valeur x = 6 l’approximationobtenue avec la fraction rationnelle p = q = 4 donne une précision de l’ordre de cinq pour millece qui reste tout à fait raisonnable.

4.3. Développement de x-‘arctan (exemple donné par Padé)

On part du développement suivant :

x-l arctan = 1 - g + $ - $ + $ + .

Approximation par la fraction rationnelle p = 3, q = 2 - On résout le système linéaire :

5 -3 1- 7 5 -9

411

Page 392: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2

0:l

0,51;O2.02,55.56.07:o

609s1o:o

Tableau D.1. Résultats n,umérique.ç ohtenus.

JO(x) tables

0:999 750,938 50,765 20,223 9

-0,048 4-0,006 8

0,150 60,300 10,1717

-0,090 3-0,245 9

JO(x) Padép=4 q=4

0,997 5010,938 4690,765 1970>223 890

-0,048 383-0,006 697

0,1512140,305 750,20823,380,327

JO(x) Padép=3 q=4

0,997 5 0 10>938 4670,765 0090>222 080

-0,047 9-0,022 6

ce qui donne :

10 = 1

II = 1,111111111

l2 = 2,380 952 355

d’où l’on dkduit : bU = 1

bl = 0,777 777 777

b2 = 2,210 581985

b3 = -0,714 285 705 7

4.4. Calcul de sinus et cosinus

On se propose de calculer la fraction rationnelle adaptée à chacune des ‘fonctions sinus etcosinus en se fixant pour 2 l’intervalle (0,7r/4) car ce sont ces dkveloppements que nous allonsutiliser pour fabriquer les fonctions de bibliothèque ultkrieurement. Nous partons donc desdéveloppements en série de MacLaurin :

sin(z) = 2(

1 - $ + $ ~ $ +. t. + (-l)nXT1

(2n + l)! + 1

cas(2) = 1 - g + 2 ~ $ + . t + (-l)$$ +...

On se propose de dkterminer les fractions rationnelles p = 9 de telle sorte que l’erreursur chacune des valeurs calcukes (appartenant à l’intervalle prkite) soit inférieure à 10-s.Il s’agit avant tout d’une erreur purement mathématique liée à, la troncature des skies. Celadu reste nc préjuge en rien des autres erreurs liées à l’exécution des calculs qui peuvent devenirprépondérantes notamment lorsque les calculs font apparaître des différences. Comme nous

4 1 2

Page 393: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LES APPROXIMANTS DE PADÉ ETDE MAEHLY

l’avons vu précédemment, il faut d’abord connaître les approximants avant de procéder auxévaluations des erreurs. Nous allons donc calculer les approximants pour p = q = 2 puisp = q = 3 (cf. Tab. D.2), cela nous permettra d’effectuer un choix par la suite.

Tableau D.2.

sinus cosinus

Cas p = q = 2

l()= 1 z”= 1l1 = 3,282828283 x 10-’ l1 = 4,365079365 x 1OF”12 = 4,50937951 x 10F4 l2 = 8,597 8 8 3 6 x 10P4bu= 1 ho= 1bl = -1,338383838 x 10-l bl = -4,563 492 064 x 10-lbz = 3,312890813 x 10-” ba = 2,070 105 82 x 10F2

Cas p = q = 3

2,414321216 x 10P22,760 512 714 x 10P41,595 035 872 x 10-”1

-1,425234545 x 10-l4;585 515 911 x 1ow

-4,163 277 311 x 1OV”

z()= 111 = 2,940421157 x 10-”l2 = 4,237288 124 x 10F4l3 = 3.235 543 474 x lO-”bu= 1bl = -4,705 957884 x 10-lbz = 2,738 828 969 x 10F2b3 = -3,723 422 695 x 10P4

L’erreur sera maximum en valeur absolue pour 2 = 7r/4. Donc. nous obtenons les résultatsprésentés. dans le tableau D.3.

Tableau D.3.

sinus cosinus

Cas p = q = 2

c = 2,4 x 10P8E = 2,l x 1OV”

c = 6 x 10-l”E = 2 x 10-l”

Cas p = q = 3-

c = 4.2 x 10P7E = 3,6 x 10-s

c = 1,34 x 10-11 --E = 4,5 x 1OF’”

En conclusion, pour obtenir huit chiffres significatifs exacts, on pourra prendre la fractionrationnelle p = q = 2 pour le sinus et p = q = 3 pour le cosinus.

413

Page 394: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5. Généralisation des approximants de Padé, méthode de Maehly

Comme nous avons eu l’occasion de nous en rendre compte les approximants de Padé donnentune excellente précision au voisinage de zéro ; rien d’étonnant à cela puisqu’ils ont été construitspour remplir cet office. Malheureusement quand 011 s’éloigne de zéro, cette précision décroîtnotablement. Si l’on souhaite pouvoir obtenir une bonne précision sur tout l’intervalle fini (a, b)que l’on réduira grâce à une transformation linéaire à l’intervalle canonique (-1, +l), il nousfaudra développer non plus les fonctions en série de MacLaurin mais, bien sûr, en une série depolynômes de Tchebycheff (1821-1894). En effet, on sait que, parmi tous les polynômes de degrén à coefficient principal réduit, c’est le polynôme de Tchebycheff de dcgri: n qui s’écarte le moinsde l’axe des J: sur l’intervalle (-1, +l) au sens de la norme du sup. Donc, si l’on développe unefonction en série de polynômes de Tchebycheff, la précision de l’approximation sera homogènesur tout le domaine, l’erreur oscillant entre deux extremums.

On est en droit de penser que les erreurs auront un comportement identique pour lesapproximations par fractions rationnelles que l’on déduira non plus à partir de la série deMacLaurin mais à partir du développement en série de Tchebycheff. De plus on peut ainsi espérerconstruire de meilleurs algorithmes dans le cas de séries de puissances lentement convergentes etqui donneront de meilleurs résultats que les approximants de Padé dans le cas où l’on s’éloignede l’origine. En revanche, ils seront moins précis dans le voisinage de zéro.

Nous avons étudié les polynômes de Tchebycheff quand nous avons évoqué la méthoded’intégration de Gauss-Tchebycheff (cf. chapitre 8). Aussi serons-nous bref pour ce qui concerneleurs propriétés.

Nous avons défini le polynôme de Tchebycheff de degré n au moyen de la relation (cf. cha-pitre 8) :

T,(z) = COS[~ arccos(z

on a donc : T”(Z) = 1 e t T~(X) = IC.

Les polynômes de Tchebycheff obéissent aux relations de récurrence :

ainsi qu’à la propriété fondamentale d’orthogonalité (relativement à la fonction poidsl/.JïY?) :

À présent nous allons rappeler comment décomposer une fonction f(x) en série de polynômesde Tchebycheff sur l’intervalle canonique (- 1, +l) sans préjudice de la généralité puisqu’il esttoujours possible de ramener tout intervalle fini 1 à cet intervalle. f(x) admet un développementunique en série de Tchebycheff donné par l’expression :

414

Page 395: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LES APPROXIMANTS DE PADÉ ETDE MAEHLY

avec

1et as = - +l f(x)

Te1 Jr2 dx.s

Remarque : Il n’est pas souvent simple d’obtenir les coefficients ak sous forme littérale. Enrevanche on peut les obtenir assez facilement par voie numérique au moyen de la méthode deGauss-Tchebycheff qui fournit une remarquable précision.

Cela dit, nous obtiendrons la méthode de Maehly par transposition directe de la méthode dePadé. On écrira :

j=o

où ici RP(x) et Pq( )x représentent des développements en série de Tchebycheff. On peut montrerque l’erreur est de l’ordre de TP+,+1 (x). Comme dans le cas des approximants de Padé, lesmeilleures approximations sont obtenues pour p = q et p = q + 1.

À partir de la connaissance des coefficients ak, IIOUS allons effectuer des calculs tout à faitsemblables à ceux de Padé. Soit un polynôme de degré q ecrit en termes de polynômes deTchebycheff :

On écrit alors :

M 4

f(x)P,(x) = c &T~(X) c Ui(x).k=O i=o

Il nous faut à présent développer ce produit de sommes, et pour cela il faut utiliser la seconderelation de récurrence que nous venons de rappeler. On obtient successivement :

~(X)I’,(X) = 2.2 b&Ti(z) . Tk(X) = 2 2 hhTi(x) Tk(X)k=O i=O i=O k=O

= 7; f; v [Ti+k(X) + +k,(“G)] = f 2+ 5 bkziqt-k,(x)

k=O i=O a=0

415

Page 396: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

R.appelons pour mémoire que les indices negatifs correspondent à des coefficients nuls. On peutégalement développer les deux sommes, puis regrouper les termes, ce qui donne en définitive :

2f(ZPdZ) = ~o(~)(Wo + blli + ‘. + b,l, + b”l”) + T1(z)(boll + bll” + bol1

+ hz2 + bals + '.. + b,-ll, + bllo + bal1 + ,$$2 + . + b,+ll,)

+ Tdx)(boh + hll + Wo + bol2 + bl13 + bal4 + . + bqp21, + b& + b311+bzila+...+b q+zh) + T~(z)(boh + bll2 + bd1 + bsZo + b&+ b114 + bd5 + . + b,-xl, + bd” + b411 + b5Z2 + . + b,+;&) + .

La technique de calcul demcurc la même que celle utilisee lors dc l’étude des approximantsde Padé. On égale à zéro les coefficients des polynômes de degré p + 1,~ + 2,. . ,p + 4, et l’onconsidère le cas classique où p > 4. Dans ce cas; la somme

bob + hlk:+l + . + b,&,

disparaît. En apparence on retrouve la matrice obtenue lors de l’étahlissemcnt de la méthodede Pade: mais il convient dc faire attention car a chaque ligne de la matrice, il correspondune valeur dc p que l’on ne retrouve evidemment pas sur l’autre ligne. Il faut; par conséquent.différencier attentivement les éléments selon la ligne à laquelle ils appartiennent. Pour mieuxsituer le problème considérons les matrices dans le cas p = q = 2. Avec la méthode dc Padé onécrira :

a2 a1 -a3a3 a2 -a4

et en se servant de la methodc de Maehly on aura :

Q:32 QYZ -03:3

Q4B Q42 -Q44

et l’on n’aura pas l’égalite 032 = Q42, ni l’égalitéa4:S = 033.En revanche, on devra écrire :

expressions dans lesquelles les 6, sont les coefficients du développement en série de Tchchycheffque l’on souhaite distinguer du developpement en série entière.

Un exemple : étude de la fonction log,(l - 2ty + t*) sur (-1, +l)

Nous allons procéder au calcul de deux approxirnants de Maehly sur cette fonction tout simple-ment parce que le calcul des coefficients de la série de Tchchychcff est réalisable formellement.

416

Page 397: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LESAPPROXIMANTS DE PADÉ ETDE MAEHLY

En effet, on trouve dans les tables :

7T

J’log,[l - ~~COS(Z) + t2] COS(~~) dz = -it’r’- si t2 < 1.

Ilw7r

e t./

log,[l - ~~COS(Z) + t2] COS(X) dn: = -:Y, si t” < 1.

0

Le changement de variable .7: = arccos nous permet de calculer les coefficients dudéveloppement en série de Tchebycheff. Pour fixer les idées, choisissons t,out à fait arbitrairementle coefficient t égal à 0,5 ; reste donc à obtenir les cocfficicnts du développement en polynômesdc Tchebycheff de la fonction : Iog,(l - 2 + 0,25).

Il niy a pas de difficulté à calculer les coefficients uk (cf. Tab. D.4).

Tableau D.4.

ao= 0a2 = -7r/8a4 = --/r/64n(j = -Tr/384us = -7r/2048ulo = -nIlO 240cl12 = -7rl98304

a1 = -7r/2CIL:~ = -~/24a5 = -7r/160cl7 = -7r/896a<, = -7r/4608ull = -7r/45056

a - Étude du cas p = q = 3 - Ce cas est présenté dans le tableau D.5. Pour des raisonsévidentes de commodité de calcul, il sera judicieux dc dkvelopper les polynômes de Tchebychcffpour obtenir f(z) sous la forme :

On obtient alors Ics valeurs du tableau D.6, page suivante.

Tableau D.5. Étude du cas p = q = 3

l(j= 1 bo = 0,516 155 56211 = -1,078971778 b1 = -0,966 519 6716la = 1,890 890 323 x 10-l bz = 0,335 223 066 2l3 = -7,339252452 x 1OF” bx = -0,273 101370 2 x 10-l

-.~

417

Page 398: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau D.6. Étude du cas p = q = 3

1; = 0,810910968 b& = 0,1809324961; = -1,056954021 b; = -0,8845892601; = 0,378 178 065 b; = 0,670 446 1321; = -0,029 357 010 b; = -0,109240548

b - Étude du cas p = q = 4 - Les résultats sont présentés dans le tableau D.7. De là on tireles valeurs du tableau D.8.

Tableau D.7. Étude du cas p = q = 4

10 = +1 bo = -0,085 339 731l1 = +0,439993085 1 bl = -0,460239216l2 = -1,171670 047 bz = -0,614 231378l3 = +0,288 160 179 b:s = +0,453 766 143l4 = -0,013 102 673 bd = -0,047 218 321

Tableau D.8. Étude du cas p = q = 4

1; = +2,158 567 374 b; = +0,481673 3251; = -0,424487452 b; = -1,8215376451; = -2,238 518 707 b; = -0,850 716 1861; = +1,152 640 716 b; = +1,8150645721; = -0,104 821387 b; = -0,377 746 570

Pour mieux apprécier les différentes méthodes, nous avons tabulé la fonction sous diversesformes dont le développement classique (cJ Tab. D.9, page ci-contre) :

log(l + z) = z ~ ; + g - f + . . . + (-y$ + . .

6. Erreur liée à l’usage des approximants de MaehlyOn peut se faire une opinion sur la précision des approximations proposées. En effet, on peutécrire :

L’erreur est donc de l’ordre de : a. Comme on pe ut considérer que P(z) = l. = 1, on endéduit que :

wp4 ayant été défini au paragraphe 1.

418

Page 399: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE D. LES APPROXIMANTS DE PADÉ ET DE MAEHLY

Tableau D.9.

2 log(l,25 - x)k=O

Maehly

p=q=4

-1,2 0,896 088 024 0,847 958 0,042 759 0,896 046-0,5 0,559 615 787 0,558 333 0,548 071 0,559 616-0,l 0,300 104 592 0,301856 0,300 034 0,300 104-0,Ol 0,231111721 0,232 049 0,231 102 0,231113

w 0,223 143 551 0,223 958 0,223 139 0,223 1450,Ol 0,215 111379 0,215 798 0,215 106 0,215 113

071 0,139 761942 0,139 185 0,139 761 0,139 765

0,5 --0,287 682 072 -0,287 500 -0,287 671 -0,287 688

0,7 --0,597 837 000 -0,595 837 -0,596 951 -0,597 832

7. Difficultés liées à la recherche d’une généralisation

Il est naturel d’envisager l’usage d’autres polynômes orthogonaux, voire de fonctions ortho-gonales, offrant des propriétés intéressantes afin de former d’autres approximants. La difficultéessentielle repose sur le fait qu’il n’est pas aisé d’obtenir une relation simple entre les produits depolynômes orthogonaux telle, par exemple, la relation de récurrence utilisée avec les polynômesde Tchebycheff. On pourrait penser à des approximants formés à partir des séries de Fourier,mais il n’existera pas de différences fondamentales avec les approximants de Maehly, car on passed’une représentation à l’autre par un changement de variable du type 1~ = arccos( Quoiqu’ilen soit, les approximants de Padé et de Maehly sont à la base du calcul de toutes les fonctionsde bibliothèque existant dans les calculateurs arithmétiques quels qu’ils soient. Nous verronsdans la prochaine annexe E comment sont effectivement calculées la plupart des fonctions debibliothèque à partir des approximants que nous venons d’étudier.

8. Éléments de bibliographie

G.A. BAKER et P.R. GRAVES-MORRIS (1978) Padé Approzimants, Cambridge University Press.C. BREZINSKI (1978) Algorithmes d’accélération de lu convergence, Éditions Technip, Paris.H. PADÉ (1892) Sur la représentation approchée d’une fonction par des fractions rationnelles,

Annales Scientifiques de l’École Normale Supérieure.H. PADÉ (1899) Mémoire sur les développements en fractions continues de la fonction exponen-

tielle, Annales Scientifiques de l’École Normale Supérieure.A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,

Dunod.

419

Page 400: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

E Calcul des fonctionsde bibliothèque élémentaires

Le calcul des fonctions de bibliothèque repose sur la décomposition préalable de la fonctionen deux parties qui seront le cas échéant une somme ou un produit. Cette décompositionest effectuée de telle sorte qu’une des parties soit calculée exactement et que l’autre soitune fonction dont l’argument est genéralement petit devant l’unité. Très souvent, on évaluecette dernière fonction au moyen des approximants de Padé, de Maehly ou des fractionscontinues. Malheureusement, cette technique qui donne des résultats remarquables n’est passystématiquement applicable. Considérons par exemple le cas des fonctions de Bessel, il n’est paspossible dans l’état actuel de nos connaissances de procéder à leur calcul par cette voie. En effet,on ne sait pas réduire le calcul d’une fonction de Bessel à un intervalle canonique au voisinagede zéro ou sur l’intervalle (-1, +l) q ui nous permettrait ensuite d’utiliser les approximants déjàévoqués.

Avant d’entreprendre à proprement parler cette étude, insistons sur le fait qu’on n’utilisejamais directement un développement en série pour calculer les fonctions de bibliothèque. Onpeut s’en persuader facilement en considérant le développement de exp((z) qui nous servirade technique de calcul pour z = 10. Nous obtenons une série alternée dont le terme général vacommencer seulement à décroître lorsque :

10” < n!

ce qui donne approximativement :

n z 10.

On conçoit sans difficulté que les sommes partielles vont être relativement importantes avantde décroître jusqu’à une valeur petite. Cela imposerait des mots-mémoire de taille importanteet de fort longs calculs.

Dans ce chapitre, nous nous attacherons à l’esprit de la technique du calcul d’un certainnombre de fonctions élémentaires.

1. Calcul de exp(x) pour x appartenant à (-00, +oo)

L’idée de base pour calculer exp(z) ( sur une machine qui fonctionne avec des nombres enreprésentation binaire) repose sur la décomposition de cette fonction en un produit du type :

exp(z) = 2N exp(Q) (E.1)

423

Page 401: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

de telle sorte que N soit un entier et Q un terme compris entre -1 et +l. Passant aux logarithmesen base 2, nous pouvons écrire alors :

x log,(e) = N + Q log,(e) = N + n. (E.4

En remarquant au passage que log, (e) log, (2) = 1, on obtient sans grande difficulté N et n.N est la partie entière de X/ log,(2) et n la partie fractionnaire du même rapport. Le calcul delog,(2) s’effectue au moyen d’un développement en série et l’on obtient pour log, (2) et doncpour log,(e) autant de chiffres significatifs qu’on le souhaite. Il s’agit là de constantes calculéesune fois pour toute : log,(2) = 0,693 147 180 et log,(e) = 1,442 695 04. Il reste à calculer N etn, puis Q = nlog,(2).

Du simple fait que la machine calcule en binaire, il n’y a pas d’erreur en calculant 2N puisqueN est entier. On obtient donc n sans problème et l’on note que Q est compris dans l’intervalle-0,693 147 < Q < +0,693 147.

Il reste à calculer la fonction exp(Q) ce que l’on réalisera par les approximants de Maehly parexemple. Nous aurons :

exp(Q) = 2 wXk(x)k=O

avec+1

a0 = -s

-p(x)

:-l JziTdX

+12

ak = -IT

Tableau E.l.

bb = 1,905 369 087 10 = +1,905 369 014b; = 0,954 415 684 1; = -0,950 951382b; = 0,190 992 815 1; = +0,189 261972b; = 0,015 822 193 1; = -0,015 540 073

Le calcul des coefficients ak peut se faire par la méthode de Gauss-Tchebycheff, mais il faudracalculer les valeurs de exp(xk), xk étant un zéro du polynôme de Tchebycheff de degré p, soitpar un développement en série, soit par un approximant de Padé déterminé dans un précédentchapitre. Les coefficients que nous avons trouvés pour p = q = 3, en ayant développé lespolynômes de Tchebycheff, sont présentés dans le tableau E.l. On aura donc :

exp(x) = I(%x + Wx + ~:IX + % .[(lix + 12)x + I{]x + 1;

Il faut bien noter que les degrés p et q des polynômes formant la fraction rationnelle sont fonctionde la précision recherchée. Il en va de même du nombre de chiffres significatifs qu’il convientde conserver. Ce problème doit être étudié pour chaque cas particulier comme il a été dit àl’occasion de l’étude des approximants de Padé et de Maehly.

422

Page 402: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXEE. CALCUL DES FONCTIONS DE BIBLIOTHÈQUE ÉLÉMENTAIRES

Un exemple numérique - On se propose de calculer exp(35,257). pour cela on réalise ladécomposition :

xlogs(e) = N+n

qui donne : N = 50 et n = 0,86509903 d’où Q = 0,599 640954.Voici les résultats trouvés par différents procédés, il convient de les multiplier par 1015 :

machine X 2 ~T~(X) Padé p = q = 3 Maehly p = q = 3.k=O

2,050786965 2,050786 931 2,0507875 2,0507872

2. Calcul de sin(x) et COS(X) pour x appartenant à (-00, +oo)

Compte tenu de la parité des fonctions, on se ramène à l’intervalle (0, T), puis ensuite, on réduitle champ à (0, ~/2) te enfin à l’intervalle (0,7r/4) puisque l’on dispose de relations du genre :

= C O S ( X ) e t = sin(x)

qui permettent de calculer sinus et cosinus sur l’intervalle (0,7r/4). D’abord, on détermine lesnombres n et N tels que :

x = r(N + n) avec 0 < n < 1,

on en déduit que :

sin(x) = (-l)Nsin(n~) e t COS(X) = (-1)N cos(n7r).

Donc, pour l’instant, nous nous sommes ramené à l’intervalle (0, T). À présent, voyons commentse ramener à l’intervalle (0, n/2). Posons :

1si=signe - - n( )2

1 1puis : nl=--sl ( --n. > .

2 2

Si si est positif, on écrit : sin(x) = (-1) N sin(ni7r) et COS(X) = (-l)N cos(ni7r).

Si si est négatif, on écrit : sin(x) = (-l)Ncos(ni~) e t Cos(x) = (-l)Nsin(nrT).

La dernière transformation consiste à obtenir l’argument de la fonction sinus ou cosinus dansl’intervalle (0,7r/4). Il suffit de reprendre la technique déjà utilisée pour parvenir à ces fins.Posons :

8,

1

s2 = signe ( - - 721 >4

puis1 1

: 7x2 = - - s2 ( --721 > .4 4

/423

Page 403: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Si s2 est positif, on aura : sin(nrr) = sin(n2T) e t cos(n17r) = cos(npT).

Si s2 est négatif, on écrit : sin(ni7r) = cos(n27r) et cos(n17r) = sin(ngr).

On calcule les fonctions cosinus et sinus des réductions au moyen des approximants de Padi:obtenus respectivement pour p = q = 3 et p = q = 2 qui assurent une précision d’au moins huitchiffres significatifs. Il est possible de faire mieux encore, mais il nous a semblé préférable de nousattacher surtout à la philosophie générale. Cependant, lorsqu’il s’agit d’implanter une fonctiondans un système, il n’y a plus aucun détail qui puisse etre délaisse. À précision égale, l’algorithmequi contient le moins d’opérations logiques et arithmétiques ~ qui sera par conséquent le plusrapide ~~ sera toujours préferé, économie de temps oblige. Ainsi, pour le calcul des fonctionscosinus et sinus, on obtiendra de meilleures performances si l’on réduit l’intervalle à (0,7r/6) surlequel on adoptera les approximants de Maehly ; toutes choses égales par ailleurs, on conserverales mêmes principes que ceux qui viennent d’être développes, mais on ajoutera l’analyse des casparticuliers usuels tels que 7r/2 et 7r/4 ou encore 7r/3 et 7r/6.

Exemples d’application

a - On se propose de calculer sin(69,674 361). Nous pouvons écrire :

N = 22 et n = 0,17803792.

Puis nous obtenons :

sl = signe (0,5 - n) = +l e t nl = 0,5 ~ (0,5 - rb) = n.

Il nous reste donc à calculer sin(niT). L’usage de l’approximant de Padé pour p = q = 2 établidans un chapitre précédent permet d’obtenir le résultat suivant :

sin(69,674 361~) = 0,530 612 163 8

le dixième chiffre « significatif » étant sujet à caution. Maintenant, on se propose de calculercos(58,125 769 8).0 11 obtient sans problème :

N=18 e t n = 0,502 007 17.

À partir de là, nous déduisons :

Sl = - 1 e t n = 0,5 + (0,5 - n) = 0,497 992 83,puis : s2 = -1 et n = 0,25 + (0,25 - n) = 0,002 007 17.

Il nous faut donc calculer sin(0,002 007 177r), on trouve alors :

cos(58,125 769 8) = -0,630 566 873 9 x 10p2>

les dix chiffres significatifs mentionnes sont exacts.

b - Un autre exemple. On se propose de calculer sin(7,587214 583). On établit que :

N=2 e t 7~ = 0,415 085 41

ce qui donne :

sz=-1 e t n2 = 0,084 914 59.

En adoptant l’approximant de Padé p = q = 3 pour évaluer le cosinus, nous obtenons :

sin( 7,587 214 583) = 0,964 628 186 9.

L’erreur absolue sur ce résultat est inférieure à 5 lO-‘“.

424

Page 404: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXEE. CALCUL DES FONCTIONS DE BIBLIOTHÈQUE ÉLÉMENTAIRES

3. Calcul de log,(x) pour x appartenant à (0, +oo)

Écrivons le nombre z dans le système binaire. Nous obtenons en choisissant la représentationflottante :

zx = 0,boblbzbxb4bsb6b7.. . 2L’1 avec bo # 0.

POSOI~S N = 2L, de telle sorte que l’on puisse ecrire :

log,, (x) = L log, (2) + log, (Q)

Autrement dit, on a 5 = LLQ avec 1 < Q < 2. On reconnaît une technique tout à faitsemblable a celle utilisée pour la décomposition de exp(z).

Il reste à calculer log, (Q) avec 1 < Q < 2, opération que l’on réalisera soit avec lesapproximants de Padé soit avec les approximants de Maehly. Encore une fois insistons surle fait que cette idée ne constitue que le principe du calcul. À titre d’exemple, on peut très bienutiliser les approximants de la fonction log( 1 - 2tz + t2) en choisissant t = 0,5, soit log(1,25 -x).On obtient alors z = 0,25 et z = -0,75 comme limites de variation pour x.

Proposons-nous dc calculer log(35 784,35174). En appliquant les règles précédentes, on obtientL = 15 et Q = 1,092 05175. Il faut faire :

x = 1,25 ~ 1,092 05175 = 0,157948 25

et l’on trouve :

log(Q) = 0,088 061275

en adoptant l’approximant de Maehly pour p = 4 = 4. D’où lc résultat :

log(35 784,35174) = 10,485 269

Ici le dernier chiffre est entaché d’erreur.

4. Calcul de tangente et cotangente pour x appartenant à (-00, +oo)

Les raisons de parité permettent de travailler sur l’intervalle (0, oo), tandis que la division parT ramène l’intervalle à (0, T). En appliquant la technique dé,@ évoquée pour les fonctions sinuset cosinus, on se ramène à l’intervalle (0,7r/4). B’ren sûr, OII se souviendra que le produit detangente et de cotangente du même argurnent est égal a l’unité.

Ensuite, il y a plusieurs façon d’évaluer ces fonctions dans un imervallc reduit. On peut utiliserla fraction continue suivante :

mais on peut aussi obtenir des approxirnants de Padé ou de Maehly à partir du developpementbanal de cet(x) :

où les Bzk sont les nombres de Bernoulli (cf. p. 178). Cette série converge pour x2 < 7r2.

425

Page 405: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5. Calcul de argtanh(x) pour x appartenant à (0,l)

Comme nous avons la relation :

argtanh(x) = log

on peut adopter soit la fraction continue :

ou encore le développement de Tchebycheff :

où 1x1 < 1 dans chacun des deux développements

6. Calcul de arctan pour x appartenant à (0, +oo)

On pose x = tan(Q) ce qui est toujours possible. Ensuite, on divise l’intervalle (0,~/2) selondes angles en progression arithmétique donnés par la relation :

Qk = (k - 0,5); avec toutefois Qe = 0.

Si x est compris entre Q~C et Qk+r, alors on peut écrire :

k7rarctan = - + arctan

4 (

bkak - -

2 + ak >

expression dans laquelle ak = cet (hr/q) et bk = 1 + [email protected] règle générale, q dépasse rarement la valeur 12. Ensuite, on calcule la valeur de arctan du

second membre au moyen de la fraction continue de Gauss :

arctan = $ + g m2t2 .m=l l2m + 1

7. Calcul de arcsin et arccos pour x appartenant à (0,l)

On peut se ramener sans grand problème au calcul de arctan en remarquant que :

arcsin = arctan (~/I/D)

et arccos = i - arcsin(

Cette remarque étant faite, il faut préciser que ce procédé est « long » en temps-machine,aussi préfère-t-on implanter une fonction arcsin fondée sur les approximants ou les fractionsrationnelles.

426

Page 406: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE E. CALCUL DES FONCTIONS DE BIBLIOTHÈQUE ÉLÉMENTAIRES

8. Calcul de la racine carrée pour x appartenant à (0, oo)

Il s’agit probablement de l’un des plus vieux algorithmes toujours en vigueur, dont la paternitéreviendrait à Héron d’Alexandrie (Pr siècle). Grosso modo, la technique consiste à obtenir unordre de grandeur «convenable » de la racine carrée puis à appliquer la méthode de Newtondont la convergence est, rappelons-le, quadratique. En calcul binaire, on pourra poser :

5 = 22mrl avec i < n < 1 donc qrnP1 < 2 < 4 ” .

On obtient alors fi = 2”fi.À présent, il nous reste à calculer fi. Cette opération est réalisée au moyen de la fraction

continue :

fi = 7 _ ,:;;;;;A2 _ 4 102 7-41 .172 + 15 7-2

En introduisant cette valeur dans la formule de Héron-Newton :

a+1 = (a + nlyk)P

après trois tours d’itération, on obtient alors une précision relative sur y2 qui sera meilleure que4,5 10-g.

Exemple

On se propose de calculer &7584,34833. On établit que :

4? < 17 584,348 33 < 48

e t donc : dl7 584,348 33 = 256dO,268 315 862.q u eL’application de la fraction continue donne : fi = 0,518 098 408 4, laquelle, introduite dans

la formule de Newton-Héron, permet d’obtenir : fi = 0,517 992 155 5 à la première itération,e t J;F = 0,517 992 144 7 à la seconde.

En définitive, on trouve : J17584,348 33 = 132,605 989, tous les chiffres significatifs sontexacts.

9. Éléments de bibliographie

A. RALSTON et H.S. WILF (1965) Méthodes mathématiques pour calculateurs arithmétiques,Dunod.

4 2 7

Page 407: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

F Calcul numériquedes fonctions de Bessel

Les fonctions de Bessel occupent une place très importante dans les solutions de problèmesoffrant la syrnétrie cylindrique et l’on peut dire que, dans la hiérarchie des fonctions qu’ilest nécessaire de tabuler, elles viennent juste après les fonctions trigonométriques, la fonctionlogarithme et la fonction exponcntielle, mais on a coutume de les faire rentrer dans la classe desfonctions dites spéciales. Il existe beaucoup d’ouvrages qui traitent des propri6tés remarquablesde ces fonctions, on en trouvera quelques uns cités en bibliographie. Notre but est de montrercornment on peut obtenir aisément ces t,ables numériques au moyen des algorithmes que nousavons établis.

1. L’équation différentielle des fonctions de Bessel (1784-1846)

L’équation de Laplace (ou de Poisson) à laquelle obéit une grandeur V(p, 0,~) s’écrit encoordonnées cylindriques (p, 0,~) :

d2V 1 ûv 1 d”V @V-+p.Y&+~.gjy+i)Z2=0dp”

On recherche les’solutions sous forme de produits de Laplace :

V(P, O>Z) = R(p)@(W(z),

ce qui nous autorise ensuite à passer en dérivées droites :

(F.1)

c’est cette équation différentielle qui est appelée équation de Bessel. Rékcrivons-la plus conven-tionnellement en terme de W(X) :

Cherchons une solution sous la forme d’un développement en série entière que l’on écrit :

y = xp fy UjXj CF.21.1=0

429

Page 408: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On peut voir sans grande difficulté que tous les coefficients aj dépendent du coefficient aa.Par définition, les fonctions de Bessel de première espèce sont celles pour lesquelles le coefficientarbitraire ao est égal à :

1ao = 2/qy1+ PI

où I’(z) est la fonction gamma ; en définitive, elles s’écrivent sous la forme :

Sans entrer dans les détails, il existe une deuxième solution, indépendante de la première,appelée solution de Weber (184221913)) qui donne naissance aux fonctions de Bessel de deuxièmeespèce ; elles s’écrivent (si v est différent d’un nombre entier) :

yv(x) = A(x) cos(rv) - J-v(x) .sin(7w) CF.4

Si Y est entier égal à n, cette dernière expression est une forme indéterminée; en appliquantla règle de l’Hospita1, nous obtenons la solution :

Y,(x) = CJ&) loge (;) - ; nc cn - ;!- l)! (;)2m-”m=O--; go m!i;y”nL), (;)îm+n [Q(m) + *cm + n)l,

où Q(X) est la dérivée logarithmique de la fonction factorielle, à savoir :

e(x) = Y(1 + z)r(1 + z)

(F.5)

P.6)

encore appelée fonction digamma. Si x est un nombre entier appelé n, nous avons :

avec @(O) = -y = -0,577215 664 901532 8 (constante d’Euler).

Ce sont les expressions (F.3), (F.4) et (F.5) qui font l’objet de la programmation pour obtenirles tables désirées.

2. Relations de récurrence

Les deux espèces obéissent aux mêmes relations de récurrence, donc en désignant par WV(x)l’une et l’autre des deux fonctions nous pouvons écrire :

xw:(x) = zAvv(x) - XWv,l(X)xiv:(x) = -uWY(x) + XWv-l(X)

2w:(2) = WV-l(X) - Wu,l(X)

zSww(z) = WV-l(X) + Wv-tl(X). (F.7)

430

Page 409: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE F. CALCUL NUMÉRIQUE DES FONCTIONS DE BESSEL

On peut fonder quelques espoirs sur cette dernière relation de récurrence si l’on cherche àcalculer les fonctions de Bessel d’ordre entier comme c’est généralement le cas.

À partir de IV~(X) et WI(x), on peut calculer Wn(x) ; malheureusement, le jeu des erreurs dûaux soustractions nous conduira très rapidement à des résultats peu précis et l’on ne peut pasespérer dépasser pour n une dizaine d’unités, mais tout dépend du nombre de chiffres significatifsretenus pour effectuer les calculs. Du reste une application sera présentée pour le calcul de Jeu(x)servant au calcul de YV(,) pour v non entier.

3. Représentation de Jy(x) par une intégrale définieOn admettra sans démonstration les résultats suivants :

TP

sin2”(t) COS[~ sin(t)] dt

07T

&+ 1/2) ; v(>s sin2v(t) COS[~ sin(t)] dt

0(F.8)

Jv(x) = @(u2+ 1/2) % v()J’ (1 - TL’)-~‘~ COS(~~) du

0(F.9)

avec cette restriction toutefois que u > -1/2.Cette dernière relation est une excellente expression qui s’intègre élégamment par la méthode

de Gauss-Tchebycheff et fournit des résultats d’une remarquable précision.

4. Technique de calcula - Le calcul de Jn(z) avec n entier s’effectue au moyen de l’intégration numérique de larelation (F.9)) et pour plus de précision nous calculerons séparément Je(z) et Jr (z) au moyendes relations :

1COS(d)

Jo(x) = ;-, J1-t" dts

e t Jr(x)=%J cos(st) J1-tz dt.

-1

6 - Le calcul de JV(x) avec v non entier s’effectue au moyen de la relation (F.9). Bien qu’il n’yait aucune différence apparente dans le calcul de J que l’ordre soit entier ou non entier, nousavons tenu à la séparation des deux types, les fonctions de Bessel d’ordre entier étant de trèsloin les plus utilisées.

En ce qui concerne le calcul de la fonction gamma qui figure dans les formules, on utilisel’expression intégrale suivante :

00

r(x) = J exp(-t)tZP1 dt,

0qui se calcule aisément au moyen de la méthode de Gauss-Laguerre.

431

Page 410: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - Lc calcul de Yv(z) avec v non entier est réalisé au moyen de la formule (F.4) dans laquelleon devra calculer JpV(z) que ne permet pas de calculer la relation (F.9). On l’obtiendra aumoyen de la relation de rkurrence (F.7).

d - Le calcul dc Y, (z) avec n entier est fondé sur l’exploitation de l’expression (F.5) qui utilisele calcul deJ, (z

I.

Sur le Web *), on trouvera url ensemble de programmes besselln. c, bessellf . c,bessel2n.c, bessel2f .c, besseljf .h, besse1jn.h et besse1yn.h qui réalisent ces différentscalculs. La précision obtenue est donnée dans les commentaires en tête des programmes.

5. Calcul de l’erreur sur JO(X)Nous partons de l’expression intégrale de Jo(z)

11

Jo(x)=; ~s

cos(xt) dt

~1 VT3

kvaluée par la mkthode de Gauss-Tchebycheff pour laquelle pèse une erreur de l’ordre de :

hf21Lf2 est aisé ü obtenir et sa valeur est :

2n+21x1

Comme nous avons choisi n = 100, nous pouvons faire usage de la formule de Stirling pours’affranchir de la fonction factorielle, et nous obtenons :

log, E(z) = (2n + 2) log,

Pour fixer les idkes, cherchons les valeurs de 5 qui permettent d’ohtcnir mie précision ahsoluede lO-‘O sur Job, en choisissant toiijours n = 20 :

1x1 = 54.

D’un point de vue pratique, cela signifie que tous les chiffres significatifs de la tabulationsont exacts, la seule source d’erreur étant, la propagation de l’erreur k travers l’opération detroncature des opérations arithmétiques effectuées...

Pour ce qui concerne les autres fonctions de Bessel de prcmikrc C~~~CC, il est difficile d’exploiterune relation généra.le qui donnerait directement une majoration de ïV zn+2 pour Jk (z), toutefois,pour les prernières valeurs de k, le calcul direct en faisant usage de la formule de dérivation deLeibnitz permet d’aboutir.

6. Éléments de bibliographie

A. ANGOT (1972) Compléments de mathkmatique,s, Éditions Masson.G. GO~DET (1962) L,, fes onctions de Bessel, Editions Masson.C. MULLER (1998) Analysis of s&rkul symetries 1;n euckdian SZ>(I,CCR, Springer.E.T. WHITTAKER et G.N. WATSON (1992) Modem Analysis, Cambridge University Press.

*http://www.edpsciences.com/guilpin/

432

Page 411: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

c IÉI éments succinctssur le traitement du signal

Dans ce chapitre, nous allons évoquer quelques aspects des principales fonctions mathéma-tiques Utilis?es en théorie du traitement, du signal. Il s’agit plus spécifiquement des notions dcconvolution et de corrélation.

Ce chapitre ne fait pas partie à proprement parler du calcul numérique mais en est uneapplication directe, c’est dans ce sens que nous présentons un certain nombre de notionsélémentaires qui font aujourd’hui l’objet d’un traitement direct sur ordinateur. En vkrité, iln’est pas à dissocier des chapitres consacrés à l’étude statistique des rksultats d’expériences engénéral.

Par dbfinition, un signal est le résultat de la mesure d’une grandeur physique qui varie dansle temps. Le signal peut se trouver à la sortit d’un capteur qui délivre soit un signal continu(analogique), soit un signal numérique (échantillonnage). C’est généralement mlc t,ension qui estrecueillie dont l’amplitude et la phase dépendront du temps t. Nous désignerons par a(t) ct b(t)les parties réelle ct imaginaire associées au signal z(t) :

z(t) = u(t) +$I(t). CG.11

1. Puissance et énergie d’un signal

a - Par définition, la puissance instantanée du signal z(t) est donnée par l’expression :

p(t) = [a( + [b(t)y = [a(t) +jb(t)][a(t) ~ .jb(t)] = z(t)z*(t),

où z*(t) désigne la quantiti: complexe conjuguke.

b - La puissance moyenne sur un intervalle T, à partir du temps tu; est donn6e par :

to+T

P(t”,T) = ;J

z(t)z*(t) dt,

to

s’il s’agit de signaux physiques, z(t) est réel, et l’on écrit :

to+T

P(to,T) = f J x(t)” dt,

t0

((3.2)

CG.31

CG.41

4 3 3

Page 412: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - La puissance instantanée d’interaction de deux signaux z(t) et y(t) s’écrit :

P“y = dt)y*(t)

et P,, = ai*d’où la relation : p,, = p&

et dans le cas des signaux réels : Px, = Pyx = 4t)y(t).

d - La puissance moyenne d’interaction de deux signaux sur un intervalle T s’exprime au moyende la relation :

to+T

Pz,(to,T) = $ J dt)y*(t) dt, (G.5)

toto+T

Pyz(to>T) = ; J v(tb*(t) dt, CG.61toce qui permet d’écrire :

Ky(to, T) = p;z(to, T),

et dans le cas de signaux réels :

to+T

Gy(to,T) = P,z(to,T) = $ J 4Mt) dt.t o

e - On apporte quelques modifications à ces définitions si l’on a affaire à des signaux transi-toires, lesquels sont, par définition, à support borné. (Ils sont nuls hors d’un intervalle fini biendéterminé.) On préfère alors définir l’énergie d’une autre façon au moyen de la relation :

t1 + C C

E,, = J x(t)y*(t) dt = J z(t)y*(t) dt. CG.71to -cc

f - Rappel du théorème de Parseval - Il s’agit, pour le physicien, de l’expression du principede conservation de l’énergie (ou de l’information) quel que soit l’espace de représentation :

+oO +CC

J x(t)y*(t) dt = J X(w)Y*(w) dw,

-CO -cc

où X(w) et Y( w sont respectivement les transformées de Fourier de z(t) et y(t). Dans le cas)où z(t) = y(t), on obtient :

+03 +CC

J Ix(t)12(t) dt = J IX(w) l2 dw-cc -cc434

Page 413: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE G. ÉLÉMENTS SUCCINCTS SUR LE TRAITEMENTDUSIGNAL

Densité de puissance ou densité spectrale énergétique - C’est la fonction S,,(wc) égale à ladérivée de la puissance P(w) par rapport à la fréquence w (il s’agit de la puissance définie auparagraphe 1 exprimée en fonction de la fréquence) :

dP(w)s7x(wo) = ~dwpour w = wc.

Types de signaux - Les signaux rencontrés au cours des expériences réelles sont essentiellementde trois types :

a. Les signaux périodiques,b. les signaux «transitoires » qui ne sont pas périodiques mais qui sont localisés dans l’espace

direct,c. le bruit.

Aux signaux évoqués en a et b se superpose, dans le cas général, un bruit. Celui-ci est bienreprésenté par une fonction aléatoire ayant la propriété de stationnarité (la moyenne, l’écartquadratique etc. sont indépendants du temps). De plus il n’est ni périodique ni localisé dansl’espace direct.

2. La corrélation et ses propriétés

Sans nuire à la généralité, nous limiterons notre propos aux phénomènes dépendant du temps.Plus précisément, il s’agira le plus souvent de considérer un ensemble de fonctions représentantle même phénomène physique donc de fonctions réelles.

Voici quelques exemples : les enregistrements de tensions délivrées par des capteurs pourréaliser un encéphalogramme, un électrocardiogramme, l’enregistrement de la température enun lieu donné, l’enregistrement du taux de CO2 dans une ville donnée, l’enregistrement duspectre d’émission d’un astre, etc.

La question alors qui se pose est de savoir si le processus P, qui donne naissance aux fonctionsz(t) et le processus physique Py qui donne naissance aux fonctions y(t) sont en relation. Laréponse se trouve dans la fonction de corrélation qui consiste à comparer z(t) et y(t) à différentsinstants. L’idée repose sur la mesure de la surface commune au graphe de z(t) et au graphede y(t) décalés entre eux d’une quantité T. Cette surface est une fonction du décalage T. Plusle signal y(t) aura tendance à reproduire l’allure du signal z(t) après un décalage 7-0, plus lasurface commune sera «grande » et plus les processus physiques seront corrélés. Si les signauxz(t) et y(t) sont différents, la fonction de corrélation s’appelle intercorrélation, tandis que si lessignaux sont les mêmes on parle de fonction d’autocorrélation. L’expression de la fonction decorrélation s’écrit au temps to :

to+T

s4t)y(t - 7) dt,

totn+T

sx(t)x(t - T) dt.

to

Un exemple physique de fonction de corrélation : les interférences

(G.8)

CG.91

4 3 5

Page 414: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

On peut imaginer qu’il s’agit d’interférences lumineuses. On désigne alors par z(t) l’amplitudede la radiation émise par UIIC source lumineuse. Après la différence de marche 7, les interférencesseront données par la fonction q(t, T) :

9(t, T) = z(t) + z(t - T).

Comme l’int,ensité 1~ au point M est la moyenne du carré de l’amplitude, nous écrivons :

1, = (Q2) = (z(q2) + (z(t ~ T)“) + 2<2(t)z(t ~ T)).

S’il s’agit d’une source lumineuse non cohércntc :

1, = 2[aZ + c&(T)],

où :

CL.s(~) détermine la variation (spatiale) de l’énergie moyenne en fonction dc la différence demarche 7. Ici la fonction de corrélation donne la forme des franges d’interférences.

2.1. Cas de la fonction d’autocorrélation

Il est intéressant de donner les principales propriétés de la fonction d’autocorrélation concernantles trois types de signaux. Quel que soit le signal :

1. La fonction d’autocorrélation CTzz(7) est paire, soit :

et sa transformée de Fourier est réelle et paire.2. Le maximum de la fonction de corrélation est atteint pour la valeur T = 0. Czz(0) représente

la valeur quadratique moyenne du signal.3. Sauf pour un signal périodique, limT+co C&T) = 0.4. Théorème de Wiener-Kinchine (sans démonstration). La densité spectrale d’énergie et la

fonction d’autocorrélation sont transformées de Fourier l’une de l’autre.

T F

Gx (t) ++ Szz(w).TF-I

Dans le cas où un signal n’a pas de composante continue S&.(O) = 0, alors à partir de :+CCSm(w) = s CzZ(t) exp(2rjwt) dt,

on déduit que :

+CC

S,,(w) =o=.I

Cm(t) dt,-oc

ce qui signifie que la fonction d’autocorrélation a une surface algébrique nulle.

4 3 6

Page 415: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE G. ÉLÉMENTS SUCCINCTS SUR LE TRAITEMENTDIJSIGNAL

Dans lc cas d’un signal periodique e(t) de période T, la fonction d’autocorrélation estegalement périodique de période T. Dans ce cas, le signal est décomposable en série de Fourier:soit :

e(t) = 7 + -g 27ltktak Cos ~

Tk=l

on en dcduit la fonction d’autocorrélation (définie sur

27rl‘iA , 27rICtl7’/2

e(t)e(t - T) dt = + ak Cos ~T

+ cq+ sm ~Tl

-T/2

X ak Cos27rlc(t ~ 7)

T+ bk sin

27rlc(t - 7)T 1 27rkr

dt = 2 + ; 2 [u;. + O;] COS T .k=l

27rkzt+ bk sin ~ 1T ’

une période) :

2.2. Cas de la fonction d’intercorrélation

Dans ce cas, il n’y a plus de propriétés extrémales ni de parite.

a - Czy(t) = Cyz(-t).

b - Le théorème de Wiener (189441952) - Kinchine (1894 1959) demeure :

T FG,(t) ff S:lxJ(w).

TF-I

SX,(w) est la densité énergctique d’interaction, elle est liée à l’information échangée entre lesdeux signaux.

Dans le cas de deux signaux périodiques de même période T, la fonction d’autocorrélation estégalement pcriodique de période T.

3. Applications de la corrélation

La corrélation trouve des applications fondamentales dans les domaines suivants :

3.1. Détection et extraction d’un signal périodique noyé dans du bruit

On considère un signal e(t) périodique, de période Te auquel s’est superposé un bruit /3(t). Lesignal délivré est alors :

s(t) = e(t) + P(t).

On désigne par C,,(r) la fonction d’autocorrélation :

T

CL(T) = ;J’

[e(t) + P(t)][e(t - T) + P(t ~ T)] dt,0

437

Page 416: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

qui s’écrit encore :

Puisque le bruit est indépendant du signal e(t), on en déduit que :

Par ailleurs, nous avons dit que ~DB(T) tendait vers zéro quand la période d’intégration T,tendait vers l’infini. Bien que la période Ti ne tende pas vers l’infini mais est « suffisammentgrande », on pourra admettre que :

Ainsi, les extremums successifs donnent la période Te du signal.Comment extraire ce signal périodique?C’est la fonction q(t) = sha(t) ( pel‘gne de Dirac) qui nous apporte la solution. Comme c’est

une fonction paire, le résultat de la corrélation et le résultat de la convolution sont identiquesà un facteur multiplicatif près (si l’on ne divise pas par T, la corrélation). Or la convolutiond’une fonction périodique e(t) avec une fonction peigne de même période laisse la fonction e(t)inchangée. Ce qui revient au même de dire que l’intercorrélation de la fonction périodique e(t)avec la fonction peigne de même période fournit la fonction e(t) elle-même. Donc :

Csq(TT) = G,(T) + Cfiq(7)

Coq(~) est nulle et comme Ceq(7) = e(T), on obtient en définitive :

Csq(~) = e(T)

Remarque : Lorsque le signal est susceptible d’être reproduit aux erreurs près dues au bruit,la somme des signaux successifs permet d’éliminer statistiquement le bruit. On a enregistré nfois le signal si(t) = ci(t) + ,6,(t). Nous écrivons alors :

car la moyenne du bruit est nulle k En=, p,(t) = 0.

3.2. Calcul de la densité spectrale d’énergie

La densité spectrale énergétique S,,(w) est la transformée de Fourier de la fonction de corrélationCZy (t) (théorème de Wiener-Kinchine). En général, c’est la fonction de corrélation que l’on saitcalculer ; on en effectue la transformée de Fourier, et l’on obtient la densité spectrale d’énergie.

3.3. Recherche du maximum de la fonction d’intercorrélation

La recherche du maximum de la fonction d’intercorrélation fournit une mesure du temps dedécalage entre une excitation e(t) et la réponse r(t) et par conséquent une mesure de la vitesse depropagation du phénomène. L’étude de la dispersion de la vitesse en fonction de la fréquence peutêtre abordée au moyen de la fonction d’intercorrélation puis du théorème de Wiener-Kinchine.

438

Page 417: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE G. ÉLÉMENTS SUCCINCTS SUR LE TRAITEMENTDUSIGNAL

4. La convolution

Tout instrument de mesure modifie le signal d’entrée e(t) pour délivrer un signal de sortie s(t).Cela est lié au fait qu’un signal d’entrée infiniment bref (impulsion de Dirac) a une réponse finie.Cette réponse impulsionnelle a(t) du système de mesure (supposé linéaire) est appelée fonctiond’appareil.

La fonction d’appareil d’un dispositif électronique peut s’obtenir en attaquant l’entrée parune très brève impulsion. Bien qu’il ne s’agisse pas d’un signal temporel, signalons toutefois lafonction d’appareil d’un spectrographe qui peut être obtenue, dans le voisinage de Xc, par unlaser de longueur d’onde X0.

On peut voir maintenant de quelle manière un signal d’entrée e(t) se trouve perturbé à lasortie s(t) par une fonction d’appareil u(t).

Pour cela il suffit de décomposer le signal d’entrée e(t) en une suite «d’impulsions » de largeurAt et dont l’amplitude sera e(kAt) avec le = 0, 1,2,. . , R. L’impulsion e(kAt) fournira à la sortiele signal :

sk(t) = e(kAt)a(t - kAt)At.

Comme l’instrument de mesure est supposé linéaire, il y a additivité des sk(t) pour recons-tituer le signal à la sortie, soit :

s(t) = 2 e(kAt)a(t - kAt)At.k=O

Par ailleurs la fonction u(t) étant nulle pour t < 0, cela revient au même d’écrire que U(t-kAt)est nulle pour t < kAt. Donc u(t) est à présent définie sur (-CO, +oo) et l’on a la relation :

s(t) = E e(kAt)u(t - kAt)At.-00

Un classique passage à la limite obtenu en faisant tendre At vers zéro donne le résultat :+03s(t) = s e(z)u(t ~ z) dz,

l’écriture symbolique de cette équation étant s(t) = e(t) * u(t).

Remarque 1 : En général, s(t) et u(t) sont les deux fonctions connues et c’est e(t) qui estla fonction inconnue. L’équation de convolution, qui est pourtant une équation fonctionnellelinéaire, offre bien des difficultés quant à sa résolution. Sur le plan numérique, les fonctions sonttoujours à support borné et l’intégrale est finie. Cette équation devient donc une intégrale deFredholm de première espèce qui est typiquement un problème mal posé (cf. chapitre 17). Sarésolution nécessite l’usage de méthodes appropriées telles que la méthode des régularisants quenous avons évoqué dans un paragraphe spécial consacré à l’équation de convolution.

Remarque 2 : Les opérateurs de convolution et de corrélation se ressemblent beaucoup ; notam-ment si une des fonctions est symétrique ils ne différeront que d’une constante multiplicative.Dans les autres cas, la convolution consiste à renverser une des fonctions avant de procéder aumême calcul que celui défini pour la corrélation.

439

Page 418: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Fonctions propres de l’opérateur de convolution

En d’autres tcrmcs, il s’agit de rcchcrchcr les fonctions qui, convolu~cs par cllcs-mêmes, restentinchangées. Désignons par 4(t) une de ces fonctions propres ; elle doit obéir à l’équation :

@(t)*@(t) = k@(t),

qui deviendra : Q(w)Q(w) = kQ(w)

dans l’espace de Fourier où Q(w) est la transformée de Fourier de 4(t).La solution au sens classique est W(w) = CU # 0 sur un compact Iwl < WO, et 0 ailleurs. C’est

la fonction «porte » usuelle dont la transformée de Fourier inverse est, :

2Qwsin(27rw”t)

27rwot

Il existe aussi une solution au sens des distributions; il s’agit de W(w) = fl sur l’intervalle(-00, +oo) dont la t,ransformCc dc Fourier inverse est /36(t).

5. Notions sur le filtrage

Par dkfinition, un filtre ternporel est une opération d’at,ténuation voire d’interruption ~ surml signal. Désignons par z(t) Cett)e opération d’atjténuation, par s(t) le signal à filtrer ct par z(t)le résultat ; nous pouvons écrire :

z(t) = z(t) s(t).

Le spectre de fréqucncc est modifié par cette opération et en passant dans l’cspacc dc Fourier,nous obtenons :

T Fz(t) = z ( t ) ‘s(t) w X(w) = z(w)*s(w).

TF-I

On voit bien que tout filtrage ternporel modifie le spcctrc du signal filtré. À titre d’exernple, onpeut évoquer l’usage d’un potentiomètre (ou d’un interrupteur), et lc simple fait dt «monter ))ou « baisser » le son sur un amplificateur d’audiofréquences modifie le spectre entendu. Pours’en convaincre: il suffit de réaliser plusieurs fois ces opbations plus ou moins rapidement sur lepremier poste radiophonique verill.

5.1. Exemple

La fonction «porte » laisse passer le signal sur l’intervalle (-T, T) e sa transformk dc FouriertZ(w) est :

sin( 2nTw)Z(w) = 2T &fJTw

S(w) sera convolué par Z(w) et plus T sera «grand », moins l’effet du filtrage sera sensible.

Remarque 1 : Le fait de dkoupcr un événernent temporel dans le temps afin de l’étudier acomme conséquence la modification de son spectre.Remarque 2 : On peut appliquer l’opkration de filtrage à la représentation fréquentielle (dansl’espace dc Fourier). L’opération de convolution se fera dans l’cspacc direct.

440

Page 419: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE G. ÉLEMENTS SUCCINCTS SUR LE TRAITEMENTDUSIGNAL

5.2. Les filtres physiques

Aux instants t < 0, un filt,re physique ne peut avoir qu’une rkponse nulle (principe de causalité) jct à l’irnpulsion 6(t) on observe la réponse a(t) qui est nulle pour t < 0 et définie pour t > 0.Soit A(w) sa transformée de Fourier que nous kcrivons :

A(w) = U(w) +~V(W) U ct V sont rkcls.

V(w) n’est jamais mille car pour cela il faudrait que a(t) soit symétrique par rapport à t = 0 ccqui n’est pas possible. On peut adopter III~~ autre présentation :

4~) = lA(w)l exdNw)loù IA(w) 1 est le module et 4(w) la phase. De là, on conclut que t,out, filtre physiqw dkphasr: lesignal d’entrée.

5.3. Cas du monochromateur

Il s’agit de concevoir 1111 filtre qui ne laisse passer qu’une seule fréqucncc. Cela n’est pas rkalisahlc.En effet, dans l’espace de Fourier, on doit obtenir deux raies infiniment étroites (cf. la fonctionde Dirac) symétriques par rapport 2 w = 0 ou symétriques par rapport à l’axe w = 0. Dansl’espace direct, nous avons vu qu’il s’agissait soit, d’une sinusoïde pure, soit d’mlc cosinusoïdcpure lcsquclles s’étcndcnt toutes les deux sur (-w ; +oo).

Dès que l’on aborde les applications pratiques, on ne peut que tronquer ces fonctions ct lesconsidérer uniquement sur 1111 intervalle fini. Ccttc opkation dc troncature est kvidemrnent unfilt,ragc t,cmporel qui a comme consCquencc immédiate l’klargissement des «raies )) dans l’espacedc Fourier. Transcrivons n~athCmatiqucmcnt ces opk-ations :

Soient e(t) le signal à filtrer et E( )w sa transformée de Fourier. Il s’agit donc dc convoluer e(t)et a(t) = cos(2rwot), mais on voit bien qu’on ne peut pas réaliser la convolution sur l’espa.ce dest tout entier, et il nous faut tronquer par la fonction porte p(t) dont la transformk dc Fourierest P(w).

T Fe(t)*a(t) H E(w)A(w)e(t)* b(tMt)l - E(w)[A(w)*P(w)l

T F - ’

6. Notion de bruit

Il y a diverses approches du bruit qui sont plus ou moins fkcondrs et riches de développcmcntsfructueux :

6.1. Le bruit blanc

On dit qu’un bruit est blanc lorsque son spectre de puissance est constant dans toute l’étenduedes fréquences. Autrement dit, sa fonction d’autocorrélation est une irnpulsion de Dirac h(t). Ils’agit là d’une analogie avec la lumitirc blanche.

D’un point de vue pratique, un tel bruit n’existe pas ; cependant, on dira que l’on a affaire àun bruit blanc lorsque la fonction est constante en moyenne dans la bande de fréquence utiliséepar les systèmes considérés. Bien sûr la fonction d’autocorrélation calculée nc sera pas 1111 pic deDirac mais une courbe très étroite dans le temps, l’unit& de ternps étant les temps de corrélationconsidérés. Il s’ensuit que les hautes fréquences seront filtrées (le bleu s’il s’agit de la lumière)et il restera les basses frkqucnces (le rouge s’il s’agit de la lumihrc), d’où le norn de bruit rose.

441

Page 420: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

6.2. Le bruit gaussien

Soit un bruit dont la moyenne est m et l’écart quadratique moyen o. On parle de bruit gaussienlorsque celui-ci suit une loi de probabilité p(t) gaussienne à savoir :

p(t) = & exp [y$].

Le grand intérêt de ce type de bruit repose sur la simplicité de sa formulation analytique quine fait appel qu’aux deux premiers moments. De plus, dans bien des cas, la somme de processusaléatoires non gaussiens tend vers un processus gaussien, c’est ce que l’on rencontre dans lathéorie des erreurs (voir le théorème central limite). Attention, cela n’est pas systématique, unesomme de processus de Cauchy reste un processus de Cauchy.

7. Éléments de bibliographie

A. ANGOT (1972) Compléments de mathématiques, Éditions Masson.R. BOITE et H. LEICH (1980) Les filtres numériques, Éditions Masson.J. MAX (1980) Méthodes et techniques de traitement du signal et applications auz mesures

physiques, Éditions Masson.A. PAPOULIS (1977) Signal analysis, McGraw-Hill.J.C. RADIX (1970) Introduction au filtrage numérique, Eyrolles.E. ROUBINE (1970) Introduction à la théorie de la communication, Tomes 1, II et III, Masson.

442

Page 421: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

H 1 Problèmes et exercices

L’annexe 1 contient les corrigés de la plupart des exercices énoncés ici.

1. Généralités sur le calcul numérique

1.1. Calcul du nombre d’or

Soit la suite définie par les relations suivantes :

U” = 0 u1=1 . u,+~=lJ,+u,~l

Cette suite s’appelle suite de Fibonacci (1180?-1250). Montrer que la suite de terme généralk, = Un/U7L-1 tend vers une limite lorsque n tend vers l’infini.

Effectuer un programme permettant de calculer les termes de cette suite k,. Quel critèreretiendra-t-on pour obtenir une approximation de la limite de la suite? Estimer la précisionobtenue sur ce nombre.

On peut calculer directement cette limite k. On montrera que k est la solution positive del’équation du second degré : y2 - y - 1 = 0N.B. - La suite de Fibonacci est utilisée en informatique dans les problèmes de tris externes.

1.2. Tabulation des polynômes de Tchebycheff

Les polynômes de Tchebycheff sont définis de la manière suivante :

T,(z) = cos[narccos(z)] avec - 1 < 1c 5 +l.

Établir la relation de récurrence suivante entre trois polynômes consécutifs :

et définir les deux premiers polynômes TO et Ti.Effectuer un programme qui permette de calculer la valeur des polynômes quels que soient le

nombre n appartenant à l’ensemble des entiers positifs et la valeur de l’argument J: à l’intervalle(-1, +1).

Quelles limitations viennent affecter cet algorithme? On comparera les résultats donnés parle calcul direct utilisant les fonctions inverses et l’utilisation de la relation de récurrence.N.B. - Les polynômes de Tchebycheff jouent un rôle essentiel dans le problème de l’optimisationdes approximations de fonctions (chapitre 8).

443

Page 422: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.3. Calcul de la fréquence des notes de deux gammes

Calculer les fréquences des notes de la gamme naturelle et de la gamme tempérée dans l’intervallecompris entre le laa (440 Hz) et le la4 (880 Hz).

1.4. Calcul de la constante d’Euler

La constantc d’Euler que l’on rencontre lors du calcul des fonct,ions de Bessel de deuxieme espèceest donnée par l’expression :

y = lim[1 + i + i + . + W - log,, (m) 1

lorsque m tend vers l’infini.Réaliser un programme qui calcule y selon cet algorithme. et effectuer UIC estimation dc la

precision obtenue.Comme la vitesse de convergence est loin d’être satisfaisante, on préfère utiliser une autre

expression pour calculer y :

m-1

c:- =log,,(r+-&-1 1 1 Bk-+--

, 12’rrL2 120m4 s + '. . + (-lJkw + . "h-=1

expression dans laquelle les Bk sont les nornbrcs de Bernoulli (cf. chapitre 12). On donne lespremiers nombres :

Bz = & B3 = ;

B4 = f B, = & 691B6 zz ~2 730

B7 = ; 3617B8 = ~ 43 867510

BF] = ~798174 611Blo = ~ 854 513Bll = ~ B12 =

236 364 091

330 138 2730 “.

Les nombres dc Bernoulli sont les coefficients du développernent de :

t p

exp(t) ~ 1= 1 - ; + Bl; - B2; + . . + (-1)7L+1Brj- +.

(2n)!et par ailleurs, ils sont reliés à la fonction C de Riemann laquelle permet d’obtenir les relationssuivantes :

B71

= 2&,(2n)!47d+h

avec 55, = 1 + & + & + & + . . + &

Effectuer 1111 programme qui réalise le calcul de y selon cette procedurc.En machine (précision relative de 10-“), déterminer expérimentalement combien on doit

utiliser de nombres de Bernoulli au minimum pour obtenir la meilleure precision avec la machineutilisée (une fois m fixe). Ou bien calculer rn sachant que l’on arretc le développement à. l’ordrej compris, c’est-à-dire après B,f. Pour mener à bien les calculs, on utilisera le fait que l’erreursur y est inférieure à deux fois le module du premier terme de la série abandonné (cc G. Valiron,Théorie des fonctions, Masson, p. 218 et 219).

La convergence est tres rapide, cependant, la serie infinie est-elle convergente?

444

Page 423: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ETEXERCICES

1.5. Calcul numérique des dérivées d’un polynôme à coefficients réels pour la valeur x = r

On considère un polynôme Pr,(x) à, coefficients rCcls que l’on écrit :

P,!,(X) 2 cLkXk avec n(J # 0

a - Rappeler comment calculer effectivement la valeur numérique du polynôme P,L(x) pour lavaleur pli = ‘r au moyen du schéma de Horner. On écrira les ktapes du calcul au moyen d’unerelation dc rkurrencc que l’on explickera donnant une suite que l’on appcllcra ~k pa.r exemple.

b - On divise le polynôme P,,(z) par (x ~ sr), et l’on kcrit :

Pr<(x) = (CE~~)P~-,(X)+ R,,. CH.11On poursuit la division des polynômes P+,(cc) par (X - sr). Écrire la relation de récurrcncc

qui donne le polynôme P7,-,(x), et, montrer que : PI(x) = (x - r)Po(x) + RI, par la suite onposera ~O(X) = Ro pour des raisons de commodité d’écriture et d’homogknéité.

Donner la relation de récurrence qui permet de calculer les coefficients du polynôme &I(X)en fonction des coefficients du polynôme Pk(x).c - Réécrire l’cxprcssion (H.l) en éliminant tous les Ph(2) : PT,(x) s’exprime cn fonction dex>r ct, des Rk.d - Donner l’expression du développement du polynôme P,, (x) en série dc Taylor au voisinagede x = T + h en fonction de x7 r’ et des dkrivks dc P,, (z). En déduire la valeur de Rk.e - Montrer comment calculer effectivement tous les Rk: à l’aide du schkma de Horner.

1.6. Calcul numérique de la fonction c de Riemann

Rappel du théorème de Cauchy - Soit f( )z une fonction positive et dkroissantc pour 5 > 1:alors l’intégrale 1 = ,fIw f(x) dz et la sbric f(k) ( où k est un cnticr strictement positif)convergent ou divergent ensemble.

Soit la fonction de Riemann

a - Associer l’intégrale 1 = T~(X) d x à la fonction C(s) en explicitant p(x), puis donner les

différentes expressions de 1 (obtenues par quadratures simples sous le signe somme) cn fonctionde s. En déduire la condition de convergence de la série: au préalable, on aura représenté surun graphique les termes 1, $, $, . ainsi que la fonction associée f(x).

b - On diisigne par Sk(s) la série dc Riemanrl tronquk à l’ordre k :

Sk(S) = 1+ ; + f + ; + ; f. ‘. + ;

En approchant c(s) par Sk(s) on effectue une erreur de troncature strictement rnathématiquc(indépendante dc la troncature numérique des nombres) :

ek = (k : 1)” + (k : 2)” + (k ; 3)” + ‘.

Au moyen de l’intégrale associée, proposer un encadrement de ek. puis en déduire une nkthodede calcul de c(s) lorsque celle-ci converge.

4 4 5

Page 424: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

1.7. Recherche d’une tangente commune à deux courbes

On considère deux fonctions y = f(z) et y = g(z). À l’intérieur d’un domaine D du planréel (02, Oy) elles admettent chacune, hormis les valeurs prises à la frontière du domaine, unextremum et un seul qui est un minimum. On suppose que, dans D, les fonctions f(z) et g(z) sontcontinues, dérivables au moins deux fois et qu’elles ne possèdent pas de points d’inflexion. Dansla suite, on s’intéressera aux courbes représentatives, Ci pour y = f(z) et Cz pour y = g(z), quiadmettent une tangente commune dans D. On se propose de déterminer numériquement cettetangente commune.

a - Soit (~0, yo) un point A du plan par lequel il est possible de tracer une tangente quelconqueà chacune des courbes Ci et CL. Écrire les coordonnées du point (zf, yf) tangent à y = f(z)!puis les coordonnées du point (zg, ys) tangent à y = g(z), la tangente étant issue de A. Indiquerune méthode de calcul numérique de ces coordonnées.

b - S’il est possible de tracer, à partir de A, une tangente à une courbe alors il est possible, engénéral, d’en tracer une seconde. Laquelle conviendra-t-il de retenir pour la solution qui nousintéresse?

c - Pour l’instant, il n’y a aucune raison pour que ces deux tangentes constituent unetangente commune, et nous allons déplacer le point A sur la droite z = ~0 pour obtenir cettetangente commune. Donner un algorithme qui permette d’obtenir numériquement cette tangentecommune. Comment devra-t-on choisir ~0 pour obtenir la précision optimum?

d - Les courbes représentatives Ci et (2’2 ne sont plus données par des fonctions explicites maispar des fonctions implicites qui s’écrivent :

@(CE, y) = 0 e t qq y) = 0.

Ici encore, on suppose que les fonctions ont les bonnes propriétés usuelles de régularité(continuité et dérivabilité à l’ordre deux, pas de points d’inflexion dans D). Donner une procédurequi permette de calculer numériquement les coordonnées (zg, yg) et (zf, yf) des points tangentsaux courbes, les deux tangentes étant issues de A. Puis, proposer une procédure pour obtenirnumériquement la tangente commune aux deux courbes.

2. Algorithmes accélérateurs de la convergence des suites

2.1. L’epsilon-algorithme scalaire

a - En réaliser la programmation sous forme de sous-programme. Application à une suitelentement convergente :

7-r- 11~ ; + ; - ; +. . + (-I>n&4

+...

6 - Appliquer l’epsilon-algorithme au calcul de

y=lim l+~+~+...+&logJm)( 1

À quel ordre m obtient-on le meilleur résultat avec une machine donnée?

4 4 6

Page 425: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

2.2. L’epsilon-algorithme scalaire

En réaliser la programmation sous forme de sous-programme.

3. Les développements asymptotiques

3.1. Développement asymptotique

a - Soit la fonction : f(z) = St-l exp(z ~ t) dt avec 2 > 0 encore appelée exponentielle

intégrale. En intégrant successivzment par parties montrer que f(z) admet un développementasymptotique dont on explicitera les coefficients. Montrer que la série est bien divergentequand n tend vers l’infini. Calculer l’erreur ~~(5) commise lorsque l’on remplace f(z) parson développement S,(z) et montrer que E,(Z) passe par un minimum qui dépend de n pourune valeur fixée de 5. Montrer qu’en machine ce minimum est obtenu dans le voisinage deEn(X) = &+1(5) ou G-l(X) E Es. On désigne par N la valeur de n pour laquelle on obtientce minimum (N est une fonction de z).

Effectuer un programme qui, pour une valeur quelconque de 2, détermine N puis calcule lasomme si et enfin l’erreur mathématique EN(x).

Appliquer l’epsilon-algorithme scalaire (cf. chapitre 2) aux sommes partielles S,,(z) pour desvaleurs de n quelconques plus petites et plus grandes que N, pour des valeurs quelconques de z(mêmes voisines de l’unité).

b - On propose la même étude sur les fonctions suivantes :

O(x) = c /exp(-t’) dt e t cerf(z) = 1 - O(2).

0

On montrera que

1.3.5 1 .cerf(z) 1L 3.. 5. -(2n 3)= $ { 1 - & + ~ 1.3 -22x4 2”26

+ . . + ( - 1 )2np122np2

+ . 1

4. Résolution des équations numériques

4.1. Racines d’une équation f(x) = 0

a - Réaliser un programme qui donne les racines d’une équation f(z) = 0 par dichotomie.Compte tenu de la précision relative de la machine utilisée qui est de 10-“, donner le nombrede tours de dichotomie suffisant pour obtenir la meilleure précision sur la racine. On aura soind’injecter la valeur de la racine trouvée dans l’équation f(x) = O...

b - Réaliser un programme qui calcule les racines selon la méthode itérative du premier ordre.

c - Réaliser un programme qui calcule les racines selon la méthode de Newton (méthodeitérative du deuxième ordre).

d - Application - (Équa ion rencontrée lors de l’étude du corps noir)t’Chercher la racine non nulle de l’équation transcendante :

y++exp(-y)-5=0.

Comparer les différentes méthodes, estimer la précision obtenue sur chacune des valeurs.

447

Page 426: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCIJL NTJMERIQLJE APPLIQUÉ

4.2. Méthode de Bairstow

Dans le cas particulier des polynômes, plutôt que de faire usage des mkthodcs du genre de cellesprograrnmées au paragraphe 1, on préfère utiliser des programmes spécifiques dont, la méthodede Bairstow est un exemple typique. Programmation de la méthode de Bairstow.

Applications - Rechercher les racines du polynôme de Lcgcndrc d’ordre TL que l’on note P,, (x).Les polynômes sont donnk par les relations de récurrence :

PC)(X) = 1

PI(X) = z

(TL + l)P,,,l(Z) - (2n + l)xP,,(x) + 7LPILp,(2) = 0.

À partir de quel ordre n commence-t-on à avoir de sérieux ennuis de calculs avec une machinedont les nombres ont une prkision relative de 1O-“?N.B. - Les xCros des polynôrncs de Legendrr jouent ur1 rôle fondamrnt,al dans la méthoded’intégration numérique dc Gauss-Legendre.

M&e problème pour les polynôrnes de Laguerre et les polynômes d’Hermite qui sont donnésrespectivcmcnt par les relations de récurrence suivantes :

Il”(.%) = 1

L,(x) = 1 -z

4.3. Calcul de la fonction arctan

Connaissant la fonction tangente, n = tan(z): on se propose de calculer n: = arctan( Montrerque l’on a l’identitk :

puis en dkluire que :

II” = arctan - arctan[tan(rc”)] + x0.

1c = zo + arctan ( a - tari

1 + a tan(z,,) >= 20 + arctari[F(.z~,)]

Donner lc développement de 2 en fonction de X = F(zo). À qucllc condition la skric converge-t-elle?

Calculer la valeur approchée de arctan &( >

en choisissant comme premik approximation

50 = 0,8 et cn se limitant à l’ordre 3. Quelle est la précision obtenue sur ce résultat?

4.4. Racine d’une équation f(x) = 0

On considère une fonction f(z) continue dans un domaine A. À l’intérieur dc cc domaine A.f(z) admet une seule racine X telle que f(X) = 0. On connaît lmc première approximationdc X que l’on note 20. On se propose d’obtenir une meilleure approxirnation x1 dc la manièresuivante :

En Ao de coordonnées [zo, .f(zo)], on trace la tangcntc à la courbe y = f(z): puis on effectueune projection orthogonale du point Bu de coordonnks (x0, 0) sur cette tangente. On désignepar CU cette projection dont les coordonnées sont (21, ~1).

448

Page 427: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

a - Donner l’expression formelle de x1 en fonction de ~0; de la fonction f et évcntucllement deses dérivées. Proposer un processus it,ératif du type :

on donnera explicitement G(z).

b - On dksigne par e, l’écart à la solution X après le 7~~ tour d’it,&ation : e,, = X - z,,.Montrer qu’au premier ordre on peut écrire : e,,,+l = ke,,. On cxplicitcra k en fonction dc @

ct de ses dérivées (ou dc f ct de ses dérivées).Donner les conditions pour que la suite des approximations soit tolljours convergente vers X.

c - En s’aidant dc quelques figures simples, retrouver les conditions sur f (ou ses dérivées)pour que l’approximation 21 soit effectivement meilleure que ~0. Représcntcr au moins 1111 caspour lequel la mkthode ne converge pas vers X.

d - Comparer cette mkthodc à celle de Newton, c’est-à-dire que l’on donnera les avantages etles inconvénients que ces deux rnéthodes prksrntent comparks l’une à l’autre.

4.5. Racines d’un polynôme à coefficients complexes

On considk un polynôme de la variable complexe à coefficients complexes :

P,(z) = (w,+jPo)~7z + ((11 +jP,)z 'L-1 + ((12 + j/32)P2 + . '. + (a,, + j&)

avc(' 00 + j/3(, # 0.

On dksire obtenir une racine complexe de ce polynôme que l’on a localiske dans le domainecomplexe A. Pour ce faire, on divise PTL(z) par lc monôme Dl(z) = z ~ (p + ja).

a - Montrer que le quotient, nott: Qn-i(~): est 1111 polynôme de dcgrk TL ~ 1 et le reste est uneconstante complexe notCc R = @ + jS. On écrit le polynôme Qnpl (z) sous la forme :

Qer(z) = (yo + jS0)2-~ + (71 + jS1)zTLp2 + (yz +js#-c3 + '.. + (Yn-l +jL,)

b - Expliciter les coefficients yk et 6~. en fournissant les relations de rkurrcnce auxquelles ilsobéissent. On précisera convenablement le début ct la fin des relations de récurrence. Donnerles expressions de <I> et de q. Montrer que, pour que (p + ja) soit UIK racine. il faut ct il sufiitque les fonctions @ et * soient nulles.

c - @ ct KLJ sont des fonctions implicites des deux variables p ct (T, rappeler la mkthode deNewton permettant de les annuler simultanément,.8~ $$ra8p rcl;$ons en fonct,ion @ et S’ et

de leurs dkrivées partielles par rapport à p et, (T : dp, da, - et x’&J

d - Calculer effectivement a@/ap et !T:/Op en dérivant les relations de récurrence des 71, etd6A.

des Sk par rapport à p puis en posant ~ = tkpl ct ~ = UU~-~. Ici encore; on explicitera bien&J &J

le dkbut et la fin des relations de récurrence.

e - Opérer de la même mani@re pour calculer d@/3a ct ??Z~/da. On dkivcra les relations de3%” 3Sk

rkcurrence des ~k et des Sk par rapport à 0 et l’on posera ~ = vk-1 et ~ = 1~k-1.da aa

4 4 9

Page 428: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

f - Donner l’algorithme permettant de calculer la racine appartenant au domaine A. Ensupposant que toutes les racines aient été localisées chacune dans un domaine A,, proposerune méthode générale permettant de calculer toutes les racines complexes du polynôme P,(z)à coefficients complexes.

4.6. Résolution d’un système non linéaire

On se propose de résoudre numériquement un système non linéaire de n équations à n inconnuesqui se note :

Fq(x1,x2,xg ,..., x , ) = 0 avec q= 1,2,3 ,..., n.

a - Montrer que l’on peut toujours écrire ce système sous la forme :

x~=~~(x~,x~,x~ ,..., x,) avec p=l,2,3 ,..., n.

b - Partant de valeurs approchées xp,x~),...,x;)>

de la racine recherchée, on forme lessuites récurrentes :

xu4 = a,P (

xy-l), xy,, . , x(lc-l)>

avec p = 1,2, . , 12.

On se propose d’étudier la convergence d’un tel processus itératif sur l’ensemble des valeurszr”). Pour cela on désigne par ZI$ la solution exacte du système, et l’on note par & l’écartentre la solution et sa valeur approchée au k” tour :

x* =xJk:)+&.3Après avoir développé la fonction @p en série de Taylor au p;;Imier ordre au voisinage de la

valeur obtenue au k” tour d’itération, donner l’expression de xp en fonction de Q>p et de sesdérivées partielles.

c - L’erreur après la k” itération est définie au moyen de l’expression :

(k) = xt _ x(k)ej 3 3

Donner l’expression de & au k” tour d’itération, puis, donner l’expression de ep+‘) en fonctiondes ey’.

On peut remarquer que les quantités ey+‘) sont les composantes d’un vecteur E(“+‘), alorsmontrer que E(“+l) peut s’écrire sous forme matricielle :

On explicitera la matrice M.

d - Soit E(“) le vecteur des erreurs sur les valeurs initiales. Donner l’expression de E(“+l) enfonction de E(O).

Quelle condition doit remplir la matrice M pour que le processus soit convergent ? (Applicationcontractante).

e - Dans le cas où la convergence est assurée, proposer une amélioration qui exploite mieux lesrésultats des calculs et qui, par conséquent, augmente la vitesse de convergence de la méthode.

450

Page 429: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

4.7. Résolution d’un système non linéaire

On considère un système non linéaire de deux équations à deux inconnues :

f(GY) = 0

dX,Y) = 0

On suppose qu’il existe un domaine A à l’intérieur duquel le système admet une solution etune seule ; en outre, on suppose que les fonctions possèdent des dérivées par rapport, à x et à y,jusqu’à l’ordre n inclus, et que les fonctions et leurs dérivées sont continues dans A par rapportà x et à y.

On se propose de calculer la solution (X, Y) en minimisant la forme quadratique suivante :

@(x, Y) = Pc? Y) + 9%> Y).a - Montrer que ce second problème est équivalent au premier.

b - On choisit comme première approximation de (X, Y) un point A&(2”, yy0) appartenant àA. Dans un premier temps on considère que yo ne change pas et l’on se propose de chercher unemeilleure approximation seulement de 20 appelée 21 telle que :

x1 = x0 + <.

Écrire le développement de Q2(xo + <, yo) au deuxième ordre en < au voisinage de 50 ; puiscalculer z pour que Q2(x, y) soit minimum.

c - Maintenant, on maintient x1 constant et l’on va calculer par le même procédé une meilleureapproximation de yo appelée y1 telle que :

Y1 = Y0 + 77.

Donner la valeur de 7.

d - Comme les développements successifs sont limités au deuxième ordre, les valeurs de < etde q ne sont que des approximations. Proposer un algorithme qui permet d’atteindre X et Y.Comment vérifier que les valeurs calculées sont bien une solution du système proposé?

4.8. Ordre d’un processus itératif

Soit f(x) une application de R sur R continue et indkfiniment dérivable. À partir d’une valeurx0 on génère une suite X~+I = f(5k).

Si dans le domaine D l’application est contractante, après un nombre fini d’itérations onobtiendra la relation X = f(X) à a1 précision de la machine utilisée.

Soit Q(z) = 0 une fonction dont on désire calculer la racine unique X localisée dans le domaineA. Montrer que les recherches de la racine par approximations successives et par la méthode deNewton obéissent au schéma fonctionnel que nous avons défini.

La recherche d’une racine X de l’équation Q(x) = 0 dans le domaine A consiste à associer àcette équation une autre équation équivalente z = f(x) où f(x) est une application contractantedans a de telle sorte que l’on ait X = f(X). On appelle ek l’erreur après la k” itération et l’onpose :

Page 430: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NTJMÉRIQUEAPPLIQUÉ

donner l’cxprcssion de e,+r en fonction de e, j de f(z) ainsi que des dérivées de p(z). En déduireque e,,,+r est un polynôme (ou scric enticre) cri eTL que l’on écrit :

e 2 Yn+l = ae,, + De,, + 7eT7 + t

On cxplicitcra les coefficients CL, p et y en fonction des dérivées de p(z).Dans l’hypothèse où l’application est contractante lim,+, e, = 0. cependant, en calcul

numCriquc, on cesse les itérations à l’ordre N (N tours d’itération) et, l’erreur eN est finie. Pardéfinition. on dira C~LIC l’on a affaire à un processus itératif du premier ordre si cy # 0 et à urrprocessus du deuxième ordre si cr = 0 et /3 # 0 et ainsi dc suite. On comprend que la convergencesera d’autant plus rapide que le processus iteratif contractant sera diordrc plus élevé.

1. Application à la méthode de Newton - On cherche la racine X de l’équation a(z) = 0dans le domaine a où l’on suppose que la méthode de Newton est convergente.

a - Rappeler rapidement la rnéthode de Newton, puis exprimer ,f(z) en fonction de a(z): etcalculer enfin les cocfficicnts Q et /? en fonction de CI>(z) et de ses derivées.

b - À quelle Condit)ion l’application est-elle contractante?

2. - Associée à l’équation a(z) = 0, on considère à présent la formule d’itcration suivante :

f(x) = x ~ s(x)@(x)g(x)a?‘(x) + h(x)@(x) ’

o ù h(x) e t g(x) sont des fonctions arbitraires dont on exige seulement la continuité et ladérivabilite à urr ordre suffisant.

Ici encore on suppose que a(z) a une racine unique dans le domaine a, domaine oùl’application est contractante. Calculer les coefficients o et /3.

Quelle est la condition qui permet d’annuler le coeflicient ,8? Quel sera alors l’ordre duprocessus?

4.9. Résolution d’un système de deux équations à deux inconnues. Méthode de Kacmarz (1937)

Soit :

f(x, Y) = 0

S(X,Y) = 0

un système de deux équations à deux inconmrcs. On suppose que les deux fonctions sont,contimres ct dérivables (à l’ordre nécessaire) et que dans un dornainc D ce système admetune solution unique (X, Y).

1. Cas où le système est linéaire - On écrit alors :

arz + bry + cr = 0 (droite Or)

aaz + b2y + cz = 0 (droite Dz).

Partant d’une approximation Ao(zo, y”) appart,enant au domaine a, on projette perpendicu-lairernent ce point sur la droite Dr, on obtient alors lc point Al dc coordonnées (51, yr). Ensuiteon projette le point Al sur la droite Dz ce qui nous donnera le point AZ de coordonnées (22, ya).On poursuit la génération des points Ak jusqu’à ce que l’on ait obtcmr la prccision souhaitée.

Page 431: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PR.OIIL&ES ET EXERCICES

a - Donner l’expression des coordonnCes x1 et 11~ en fonction de ,Q. ?jU: al, bl et R, cettedernière quantité 6tant ainsi définit : RI = alto + blyo + q.

b - Donner l’expression des coordonnées z2 et y> en fonction de ,x1; 11~. nz. b2 et R2 ccttcdernikrc quantité étant ainsi définit : RZ = qgl + bayl + c2.

2. Cas généra/ - Lintariscr le système

f(x, Y) = 0g(x, y) = 0.

Par ce procédé nous sommes ramcni: au problème préc6dent. il suffit de remplacer lescoefficients nl,~. 01: 02 et RI, Rz par les nouvcllcs valeurs fournies par la linéarisation : donrrerles expressions de a1 , ~2, bl, hz ct RI, Rz en fonction de f(z, y), g(z; I/) et de leurs dbrivkspartielles.

Donner alors les expressions de xk, & en fonction de xh-1; 1~k-1 puis SQ 1. ?/k-+l en fonctionde xk, IJ~.

Donner les expressions des diffkrents coefficients calculés sur l’exrmplc suivant :

f(x, y) = x2 + 4y2 - 36 = 0

g(s, y) = x2 + y2 - 12~ + 27 = 0

5. Éléments de calcul matriciel

5.1. Résolution d’un système linéaire

Soit 1111 système dc n équations & n> inconnues. Rkaliser un programrne permct,tant la rtsolutionde ce système linéaire par la méthode des pivots, puis le transformer en sous-programme.

Dans le cas où la matrice est mal conditionnée ou encore lorsque son déterminant est voisinde zPro, on rencontre des difficultés pour obtenir un résultat raisonnable. Voici une m@thodeperrnettant éventuellernent dc se tirer d’affaire.

On peut soupçonner dc tels problèmes quand la permutation dc lignes du système linéairefournit des résultats difErents les uns des autres et que les troncaturrs des nombres ne peuventpas directement expliquer.

a - On calcule une première valeur j& déterminant par le produit des pivots. Pour obtenirune erreur minimum à chaque ktape du calcul il faut amener 11011 pas le pivot lc plus grand(car cela conduit1 à amener en fin de calcul les pivots les plus pctit,s qui seront enta&.% d’uneimportante erreur puisque le produit des pivots est une constante.. .) mais le pivot dont le moduleest lc plus proche de z/la,l ce y ui conduit à une erreur rninirnum sur l’enscmblc des calculs.

b - On calcule une seconde valeur A, du déterminant cn amenant chaque fois le pivot dontle module est le plus proche de m. 0 n rCpèt,e l’opération jusqu’A cc que l’on obtienne desvaleurs stables & et de m.

c - On invcrsc la matrice (ou l’on rkout le syst@me linéaire) en amenant chaque fois le pivotdont le module est le plus proche de m.

d - Rkaliser 1111 tel prograrnme.

453

Page 432: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5.2. Système linéaire surdéterminé

On envisage l’ét,udc d’un systPmc linéaire de 11 équations 5. 711 inconnues awc II 2 m. Le systèmeappel6 SI se prkente sous la forme :

que l’on 6crira en notation matricicllc :

AX=B.Au moyen dc la méthode tics moindres carrbs, il s’agit dc rkluire cc systkc SI au système

SS appel6 système des équations normales. dc m équations CI rn ir~connues.Montrer yuc lr syst,èmc des Cqnations normales s’écrit, :

ATAX = ATBoù A7’ est la matrice transposée dc A.

Rhliser un programme qui ét,ablit le systeme des k~uations normales puis qui lc résoutnlirriéri<lilcrrierlt

Étudier les illcertitudes qui eiitachcnt les rfhltats du calcul wloll lc procbdb don& page 378.

5.3. Résolution d’un système linéaire volumineux

On consitlhe un syst?me lin&& invcrsible AX = B dans lequel 14 est ~III(’ matrice carr& d’ordreIV. Mallleurcllserrlcnt la matrice A est beaucoup trop volurnintuse pour tenir dans la mémoirecentrale du micro-ordinateur dont on dispose. 011 se propose dc fractionner la matrice A et levecteur B respect,ivement cn quatre sous-matrices et deux sous-vecteurs dr, la manière suivantje :

1:: nri#=~i;~

Montrer que lc problème peut SC ramener à la résolut,ion tics deux systCmes suivants :

AIX1 + A2X2 = B, w4AcsXI + A4Xâ = BL CH.31

et doniicr les conditions sur l’ordre des matrices pour que dc telles équations puissent, avoir unsens ; pour cela on désignera par Il et kl rcspectivcment lc nombre dc lignes et le nombre decolonnes de la matrice A,. II et kl positifs IIOII nuls strictcmcnt inf6ricwrs à N.

On SC propose d’~limincr le vecteur X1 entre les dwx équatiorls (H.2) ct (H.3). Donnerl’expression de X1 tir6e dc (H.2). E n reportant cette expression dms (H.3). dormcr l’expressionde X2.

Expliyucr la méthode à suivre pour calculer cffectivcment X2. Pour cela on dbtaillrra chacunedes opérat,ions à. rfaliser.

Détailler eusuitc la mét,hodc pour obtenir Xl.

5.4. Résolution d’un système linéaire par la méthode itérative de Jacobi

On considère 1111 système linéaire de ,rL Equations à n inconnues que l’on kit, sous la formemat,ricirlle uswlle :

A’X = B’où A’ est UIIC matrice d’ordre YZ sur laqucllc on fait l’llypothèse qu’elle est non singulihe, X levecteur des incommcs à, 71 composantes et LI’ lc vecteur sec:o~~tl mcmbrc a ré composantes.

454

Page 433: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

a - On désire se ramcncr à un système identique notk :

AX=Li’ CH.41

dc klle sorte que l’on puisse décomposer la matrice A en une diffhcncc dc deux matrices :

A=I-M (H.5)

oh 1 est la matrice uniti: d’ordre n et où AP est une matrice d’ordre 7 ~ n’ayant cpr: dw z6ros surla diagonale principale.

Les éléments de A’ sont notés ulk:; ceux de A notés uik, ct ceux de Af sou!, noth nrlk.Montrer que toujours la décomposition proposée est possihlc dans les conditions de l’honck.

Exprimer les éléments de A en fonction de ceux de A’ puis ceux de AJ. Dormer l’expression desékments hh du vecteur B en fonction des Clhcnts Oit du veckwr B’ ct des 6léments de A’.

b - En rcmplaqant dans l’équation (H.4) la matrice A par son cxprcssion donnée en (H.5) imontrer que l’on peut générer un processus itkratif de valeurs Xk dc X qui permet effectivementdc calculer la solution X. On écrira explicitcmcnt l’kquatiori matricielle Ti laqucllc cc processusohbit.

Partant du vcctcur X0 (dont toutes les composantes sont nulles par cxcmple). expliciter lesvecteurs X1, X2, X:3, . . , Xk, en fonction de 1, Af ct B.

c - Qucllc est la lirrlite 2 dc Xk quand k tend vers l’infini? Montrer que 2 rst, hicn solutiondu problhc.

d - On SC propose d’étudier la convergence de la procédure. Montrer que la sllitcx des Xkconverge à condition que W’ tende vers xkro quand p tend vers l’infini. Quelle propribt,é doit,vérifier la matrice: M pour qu’il en soit ainsi‘?

e - Quand cette dernière condition n’est pas vérifiée, le processus est divergent. Proposernéanmoins une procbdure qui permette quand mhe l’okention dc la solution X en exploitantles donnkes fournies par l’algorit,hme divergent.

5.5. Résolution d’un système linéaire dépendant d’une matrice symétrique(méthode de Choleski)

1. - On corlsidere une matrice carrée A d’ordrr: n, dont les éléments sont noti:s CQ~. On supposeque cette matrice est régulikc (ou non singulière : son dCterminant est différent dc zkro). Ondécompose cette matrice cn un produit de deux matrices triangulaires L et S, L ktant triangulaireinfkricurc avec des élérnents quelconques sur la diagonale, S btant, triangulaire supkrieurc avecdes 1 sur la diagonale: de tcllr sorte que A = LS. On désigne par I/k les 6h?mcnts de L et par.slk les éléments dc S, mais on ne demande pas de les calculer.

a - On se propose de rkoudre le système linéaire AX = B où B est un vecteur colonnedonné dont les éléments sont notés bl. Montrer qu’il est kquivaltnt de rfsoudre le systheS X = L-lB = Y .

b - Supposons que l’on connaisse les Clherlts y~ du vecteur colonne Y. Montrer commentcalculer dircctcmcnt la solution du système SX = Y.

c - Maintenant, il s’agit de calculer Y. Écrire explicitement le système B = LY, puis lesrelations cntrt les &?nients yk, l,, et b,.. En dkluirc la valeur des yk en fonction des 6,,,,. h,. ctdes yys déjà calculés (s = 1, 2, . , (k ~ 1)).

455

Page 434: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

d - Montrer que la matrice L peut Ctre rendue triangulaire avec des 1 sur la diagonale en lamultipliant à droite par une matrice diagonale DP1 convenablement, choisie. On kcrira L = AD.Donner l’expression des Cléments dc XI~ la matrice A en fonction des klémentjs 1,, de L. Montrerque A = LS = (hD)S peut aussi s’i‘crire (seulement dans ce cas prkcis) A = h(DS).

2. - À partir de maintenant on suppose que la matrice A est symétrique : A = A” (AT est lamatrice transposée de A).

a - Donner l’expression de A’ en fonction de D, S?’ et AT7 en dkduirc deux relations entre A.S, ST et AT.

b - Déduire que A = ADA’ (ou encore que A = STDS). C omrne D est une matrice diagonale.on peut écrire : A = Afi\IDAT = ïWMT. D onner les éléments 61, de V% en fonction desékments d,, de D.

c - Écrire directement les relations donnant les éléments rrllk de la matrice triangulaireinférieure M en fonction des élémcnt,s CLQ de A.

d - Indiquer une méthode de résolution des systknes linéaires dépendant d’lmc matricesymétrique non singulière.

5.6. Résolution d’un système linéaire par la méthode du gradient conjugué

On se propost de résoudre un système linéaire de N équations à N inconnues :

AX=B

où A est urle matrice définie positive et symétrique d’ordre N d’élément ulk, X le vecteurinconnu, B le vecteur second membre d’éléments {bl}.

1. - Soient p et CJ deux vecteurs de dirrrension N. On note par (p, q) lc produit scalaire de p et4 : (P> 4) = pï’q, PT étant lc vecteur transposé de p en kriture matricielle.

Montrer que (p, Aq) = (Ap, y) = (q, Ap) = (Aq,p).

2. - Par définition, on dit qu’une suite dc vecteurs {pi} est A-orthogonale (i = 0,1, . , N - 1)quand les produits scalaires (AP,, pJ) sont nuls pour i # j.

a - Montrer que (Api,pi) > 0.

b - Montrer que les {P,~} forment une base de l’espace à N dirnensions.

c - On désigne par h le vecteur qui est solution du systèrne AX = B; montrer que h peuts’écrire sous la forme :

N - l

hj = C c,~P,~ ,(B>P.~)

.j=O

avec C,j = cApj, p,~ )

Montrer qut h peut s’obtenir par le sclkma itératif suivant :

(H.6)

20 = topo

(B> Pi)“’ = (AP,j,P3)

x.7+1 = xj + (++1P,+1

XAJ = h, avec M 5 N.

456

Page 435: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A NNEXE H. PROBLÈ M E S ET EXERCICES

3. - On se propose maintenant de construire Mac base {pk} de vecteurs A-orthogonaux à part,ird’une base {Q} de N vecteurs lineairement independants (orthogonalisation de Gran-Schmidt)pour k = 0, 1,2, . , N ~ 1.

a - On pose p0 = 210, puis pr = vr + aroprMontrer que

(Av:Po)a1o = ~ (APO,PO)

puis que le vecteur pk+r s’exprime en fonction des k préctdrnts Vect>eurs p de la façon suivante :

I&+l = vc+1 + ~k+l,oPo + Qk+l,lpl + . ‘. + ctk,lJ$k = tJk+l + 5 r~e+l.,P,jr0

avec k < N ~ 2. (H.7)

Donner l’expression des ~k+r .,, en fonction des produits scakres de vcctcurs (connus au furet a rnesure). Montrer que

(7~1<:, Apj) = 0 pour ,J’ > k.

b - Si A est, la matrice unité (A = 1): la suite des vecteurs A-ort,hogonaux devient u~e suite devcctcurs orthogonaux. Dans ce cas particulier, montrer que la suite des {pk.} dont la définition(légèrcmcnt modifiée par rapport à (H.7)) est la suivantje :

k.-l

PL.+, = PL + c?k+l,jpi + Yk+l.kVk+l

.7=0

est, mie suite orthogonale que l’on peut écrire sous la forme :

PL,, = P’, +(P:.,Pk)

{

k-1 (w+l,P;) ,

(%+1,?4 ,lT” (P;>I$ ?j - T/k+*c

i

(H.8)

4. - On SP propose d’utiliser les rcsultats précédents pour résoudre le systeme AX = B. Pourcela, il nous suffit de connaître une base quelconque de l’espace de dimension N, à partir decelle-ci IIOUS obtiendrons une base {pk} A-orthogonale qui nous pcrrnettra de calculer lc vecteursolution h.

Cette base {pk} A-orthogonale sera détermincc à partir d’une base {r.k} orthogonale. Onpropose de calculer simultanément ~ ou en parallele ~~ les deux bases en procklant dc lamanière suivante :

Soit ~0 une approximation arbitraire du vecteur h. On pose :

Po = yo = B - Azo

T,;+1 = 5 , -a,Api

457

Page 436: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1hfhVUEL DE (‘ALCL’L NUMÉRlQlJE APPLIQUÉ

N.B. - À chaque étape du processus it,bratif~ r’? dorme l’écart à la solution exactJe et s’appellevecteur rkklu 0~1 résidu.

a - Montrer que la suite des {r.;} est, orthogonale en utilisant. la wlation (H.8). On pourraposer :

b - Montrer que la suite des {pl} est A-ort~hogonalc CII utilisant la relation (H.7).

c - Quel est le nombre maximunl de tours d’it6ratjion qui permettra d‘olh:nir la sohhion exacte.ahstra.ct~ion faite des crrcurs dues a.ux troncatiircs des calculs effectifs?

5. - Cet,te rrkthodc dc rkolution d’un syst,hc linkairc, déperldark d’une matjricc A définiepositive et symktriqut, s’appelle métllodt~ du gradient co~~jugué.

Les formules

montrent, que l’approximation X,7 s’ohticnt à partir de l’a.l->l>roximation prkéderlte en ajout,ant,une quantitk algkbriquc paralkle au vwtcur p,,. Nous a~llorls voir que, pr+cisémrrlt, la quantit6c,p,f est celle qui minimise le carre du rkidu dans la direction p,, On note E”(r) le carri‘ durkidu.

a - Montrer que? E2(:x) est donné par l’cxxprcssion :

E”(z) = [A(h - XT)> h ~ x].

Il s’agit de minimiser E’(x) da,ns la dircct,iou p sur la droite 2; = n;,, + I,,JJ,, et, de dét,ermincr1, c:orrcsponda.rlt à ce minimum.

b - Montrer CIU~ E’(zj + l,,p,,) = E”(r)) + lj(Ap,j:~),,) - 2b,7(r,7,p.I) ex )rr ssion dans laquelle on71 :Y‘a pos6 : ri = B ~ A.c,, (= B ~ xj).

~ (~.l~P./)Dkduirc q u e Z,, ~ (APj: ~,1)

déduire que bj = C,j.

6. - Soit A une matrice yuelconquc. Quelles transforma.tions doit-on appliquer au systèmelincaire pour pouvoir utiliser l’algorithmr i:tudib?

Page 437: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

5.7. Calcul direct des coefficients du polynôme caractéristique

Soit A mie mat,rice carrée d’ordre TL dont, les 6lémrnts sont r&ds. On se propose de calculerdircctcmeid les coeflkient,s 0k de son polynôme cl-Lrac:t,~ristiquc que l’on pc’ut krirc sous lesformes suivantes :

(H.9)

P,!(X) = -&Y,X”? (H.10)J=O

où 1,) est la mat,ricc unité d’ordre 11, les crochets signifianl. qu‘il s’agit, d’un tk%cwr~inant~

a - Ident,ificr l’expression donnée par (H.10) awc: le tl&eloppc~ment cn shrie tic MiL(~Lilllrin dcP,,(X) afin d’expliciter les wefficicrds c1~, Donner alors l’cxprcssion tl(, ok en fonction (le p,, (0)et, tics dérivées en zkro qui sont not6es P(“)(O): q = 1, 2: T 11.

Pour ohknir les dérivks successives dc P,, (A). on se propose dt> &rivcr l’wprcssion (H.9) parrapport 2 X7 puis on fa,it X = 0 pour olkenir les PA”‘(O).

Comme A ne dépend pas de A. la r?glr de tlkrivation du c16tjc~rminant donnant~ P:! (A) dans lecas particulier qui nous intéresse (1st doiin~c par les expressions suivantes :

OU 1,, ~ 1 est la matrice unit,& d’ordrc~ (n ~ 1) ct OC A,,,, dCsignc la rriatriw d’ortlrc~ (n ~ 1) obtenueen supprimant~ la jr ligne et, la jr colonne tic la matrice A.

Donner l’expression de P’ (0).

6 - En utilisant, la règle dc d6rivatiou prkklemmcnt~ fournie, donner l‘cxprcssiori & F’(X).puis en &tluire 1 ‘expression de 1’;; (0) cn fordion des rua.t,ricw Aj ,,hb (lui &signcnt 1~ matricesd’ortlrc: (~1 ~ 2) obtenues en supprimant~ clans la matrice A les lignc,s ,j c‘t, k cl’lmr~ part, ct lescolonnes j ct k d’aut,rc part, (on prfkiscra soigncuscwrut~ les indiws).

c - Montrer qllc l’expression de pi”’ (0) est donllk par :

Pr!“‘(O) = (kl)“m” C [Aj~.k~,....qq] = ~l!(-l)~“’ C [A~,~.~~.....qq]

,/.k ,_... q .jik.....<q

d - Montrer par ur1 examen direct de (H.9) que P:(O) = n!

e - Dire comment exploit,cr cet algorit~hme pour obtenir les valeurs propres tk la matrice A.

5.8. Calcul des valeurs propres d’une matrice réelle et symétrique par la méthode de Jacobi

a - Soit A urlc matrice car& d’ordre n ;i Ikmcds {a~~~} rkls. On consitl+rc mie autre mat riceT d’ordre ~7 à bli:ments ri:& {tlk} qui possède urle matjric:c~ inverw T -’ Les valtwrs proprw {A,}rt, les vcdcurs propres {X,} sont d ormks par l’+quat,ion : AX = XX. Monllw (111~ I? = ‘r ‘ATadmet les mCmes valeurs propres que A. Pour cela. on posera. X = TZ. cxprwGon <lans laquc~lk~2 est, vcckur propre> de B.

Page 438: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANIJEL DE CALCUL NUMÉRIQUE APPLIQUE

b - Dans toute la suite du problème ou considère que A est une matrice symétrique CL~,? = o,,~,..À quelle propriktk import.antc obéissent les valeurs propres de A‘!

c - A présent, on cherche à diagonaliser la matrice A au moyen d‘un<: succession de transfor-mations TplAT.

Choix de /a matrice T - T est ~IIC matrice unit6 d’ordre 71, à l’exception de quatre 61Cmcnt~sse situant à l’intcrscction des lignes p et q d’une part et des colonnes p et q d’autre part :

t pp = “OS(P) tïlcl = sin(cp) t,, = sin(cp) t<,(, = ~ COS( y).

Montrer que TP1 = T

d - Écrire les 6léments de la matrice (AT). Puis montrer comment ces ékmcnts sont modifiéslorsque l’on multiplie (AT) par T-l. É crirc les éléments blk de B = Tpl(AT) ct cn particulierb,,. b,,. b,, et b,,.

e - En dkduire que B = TplAT est urlc matrice symétrique. (Attention. lc produit de deuxrriatrices symktriques n’est pas, en général; uiic matrice symt;trique.)

f - 9 est, un paramètre que l’on choisit, de telle sorte qu’on annule lc coefficient b,, et parconskquent b,, . donner alors l’expression dc tan(2p) en fonction des nik. On pose tan(2p) = 7.Donner l’intervalle de variation de cp. Donner les expressions de COS(~~) ct dc sin(cp) en fonctionde 7 cn prenant garde aux évrntucls problèmes de signe, au prkalable, il peut être utile dccalculer sin(2p) ou COS(~~), et 1’ on dksigncra par E le signe de 7.

g - Définir ~II algorit,hme qui arnène progrcssivcmcnt des zéros partout, hormis sur la diagonaleprincipale dans la suite dc matrices L3, que l’on prkciscra. Dans le cas on 7 dcvicnt infini leproc6di: ne tornbe pas pour autant en défaut. Donner alors les valeurs numériques de ~OS(Y) etde sin(p) qui pcrmctt,ent de poursuivre la transformation.

Convergence de la méthode - Montrer que pour une matrice symkt,riquc telle que A: la sommedes carrés des valeurs propres de A no& S2 est égale à la somme des carres de tous les Gmentsde A. En déduire que cette valeur est invariante si la matrice subit lmc skric dc transformationsgknérales du type dc ccllcs définies ci-dessus TplAT.

h - Calculer b,, + b,, ct b,, - b,, en fonction des 01k ct dc cp. Dr ces deux équations auxquelles011 ,joint l’expression de bI,‘[. dkmontrer que :

i - En dkluirc que la mtthode étudikc est inconditiormellement convergente.

Quelques expressions utiles.. .

Cos’(y) ~ sin’(cp) = COS(~~),

2 sin(y) cos(‘p) = sin(2cp).

460

Page 439: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. P~013LèhfE.5 ET EXERCICES

5.9. Calcul des valeurs propres d’une matrice par la méthode de Souriau (1948)

Soit A UIC matrice car& d’ordrr TL dont on se propose dc calculer les valeurs propres Xj:lcsqucllcs sont. les racines du polynôme caractCristiquc :

P,,(z) = a”d7 + UlZ n-1 + a2x” -2 +...+a,, =O avec a() = 1.

Nous 11011s proposons de calculer directement les cocfficicnts ak: puis de calculer les racines dupolynôme. Pour ce faire; considérons une suite de matrices B, dkfinic de la fac;on suivantJe :

B 4 = Aq + alAqpl + QA”-~ + . + o 1“1 :

OU 1 est la matrice unitk d’ordre n.

a - Donner la relation de récurrence qui existe entre dellx rnatriccs conskutivcs l?k et n,+,.Quelle valeur convient-il de donner à Bu?

b - Dkmontrer 1~ relations de Newton exprimant les coefficients (~k cn fonction des sommesdes racines élevées à la même puissance m. On notera :

En utilisant l’expression de a,/; donnkc par la relation de Newton, montrer que

ct déduire ur1e procédure générale de calcul des valeurs propres d’une matrice

6. L’interpolation

6.1. Le polynôme de Lagrange

On dispose d’un fichier dc donnees constitué d‘une suite dc N couples d’abscisses et d’ordon-nées. On dksirc réaliser un programme qui pcrmcttc d’effectuer une interpolation voire uneextrapolation par le polynôme dc Lagrange.

a - Prograrnmcr dircctcment la méthode de Lagrange.

b - Calculer les cocfficicnts du polynôme de Lagrange par inversion de la rnatricc fournie parl’kriture du systkic linéaire.

c - Comparer les performances des deux a.pproches du mkne probkme.

6.2. Les fonctions «spline »

Rkaliser un programme qui effectue les interpolations (des rnêmcs données) au rnoycn dcfonctions «spline » de degré trois. La mise au point termink, le transforrncr cn sous-programme.

Applications des J 6.1 et 6.2 - Déduire des ktudcs précédentes 1111 ou plusieurs prograrnmcsqui realiscnt la différentiation et l’intégration.

Quelles sont les difficultk li@es à ces rnéthodcs?La différentiation est-elle une opération sfirc?Laqucllc des deux techniques d’interpolation donne les meilleurs rbsultat,s?Pourquoi?

4 6 1

Page 440: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUM.GRIQUE APPLIQIJE

7. Intégration des équations différentielles dans le champ réel

7.1. Étude d’un pendule de longueur variable

On considère im prndidc dont la longucwr I varie lin~aircmc~nt, avec lc temps wlon la loi :l = b" + 7rt où ?! est llrl~ cor1sta.r1te.

a - Écrire l‘équation diff~rcnticllc % laqucllc ohbit l’angle Q que fait, lc pcntliilc avec la vcrticalc.sachant que cc pcntlule est soumis à l’a.ct,ion de la pesanteur dont l‘int,ensit,é est g.

b - Écrire l’équation dans le cas où g est petit,. Rtkliscr 1111 programme qui cffcctw la t~abulat~iondc la solution de cette dernikr k~uation, sackant, que lc pendule qui nous pr~oc~upc~ est, labc~m~ d’une grue suspentlue au bout d’un c%l)lr de longurur I. = 10 m. Al1 kmps t = 0.19 = 7r/200 radian, dB/ dt = 0 radian/s et, 0 = 1 rri/s.

C - La hrnnc s’arretc quaiid clic a parcouru 7 in vertidrment (II = 3 m). Quelle 4 alorsl’amplitude des oscillat~ions‘? Pcubon considérer que H est, resté petit?

d - Mêmes questions qu’au $ c avec toutefois des conditions init,ialcs tliff6rcnt,cs : b. = 3 m.II = 10 m, 71 = -1 m/s. H et, H’ gardid les mêmes valeurs.

7.2. Système électromécanique dépendant d’une équation de Mathieu

On considère 1111 circuit, électrique fermé constitlk d’une> self L. d’une rksistancc R ct ~‘LIIIPcapacité C: tous les t,rois mont& en série. L et R sont fixrs, en rr:vanch(~. la capacit,b C va.rie t‘11

fonction du temps selon la loi :

1 1 + E siritilt

c(t) G

La réalisation de ce condensateur est, simple : il est constjitu6 dc deux plaques parallèlesséparées par mie distance e(t) qui varie au cours du temps ii la frkqucnce w1 /27r selonl’cxprcssion : e(t) = ~(1 + E sinwlt) awc lx valeur absolue de & plus pet,ik qiw l’lmitb. Ccmouvement des plaques est évitlemment, crt6 par mi niot,cur qui peut, donc fournir de 1’6iwrgicau circuit dectjriyue.

Écrire l‘équation difErcnt,icllc à laquelle obéit la charge kkctriquc: q(t). Int6grer nuriiérique-ment cette équation avec: lrs valeurs suivant,cs : L = 1 H. R = 1 il, CO = 1V4 F. E = 0:57 et,WI = 225 s -1.

Au temps t = 0, qc1 = 1V4 C ct i = dq/ clt = 0 A.

7.3. L’équation de Van der Pol

Soit 1’Cquation diff6rentic~llc suivante :

011 dolIlle E = 1,O. Intégrer nurri~riclilerrient cette bquation cn choisissant des conditions initialestrès difkentcs (cc sont des doiirltw qui sont c:oninmniqn~cs cn corivrrsa.t,ioririel).

Rqr~sentcr les rkultats de l’intégration dans l’cspacc des phases. c’est,-à-clirc dans l’cspacc~où y est port6 cn abscisse et &y/ dt t'ii ordonii~c. On cssaycra les valeurs 5 = 1,O et E = 10.0.Qu’observez-vous? Quel intérêt, y a-t-il à fréyuent,r:r de tcllcs équations?

4 6 2

Page 441: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PI~ORLÈMES ET EXERCICES

7.4. Intégration d’une équation différentielle du premier ordre par une méthode itérative(prédiction-correction)

Soit a intégrer rmmériqucmcnt l’kfuation différeruicllc suivante :

dy/ dz = f(.X, y) p our 3; appartenant à (a: 15).

De plus, on désire que la solution prenne la valeur yo pour la valeur ~0 = n, de la variable.

a - Rappclcr dans quelles conditions il existe une solut,ion unique y(z) à l’équation diff~wntielle.

b - Par la suite, on supposera que les conditions énoncées au # a sont satjisfaitjcs. ct l’ondksigncra par h le pa.s d’intégration de la variable .r et, par ynr la valeur dc la solution aupoint, :c,,, = (1 + rnh.

Soit, D la droite tangente en (2,,(, ym) à la courbe y(z). On procède à urlc interpolationparaholiqur d e y(z) , ~sur l’intervalle (z,,,-1. 2,,+r). la skcant,e passant par (2,,,- r, y,,,- 1); et(:x.rr!+l>?/rn+l) ‘ ~ d P 11.1est ont ara 6 c à la tangente en (.î7,,( ~ym): donner alors l’cxprcssion de ym+r

c - Cet)te relation appelée prédiction rnontrc que le calcul de yrl! cxig-e l a connaissance desvalciirs des deux points précédents, ct l‘on ne peut pas calculer la valeur de y1 par cc procklé.Dans ce cas, on utilisera la formule de Runbe et Kutta pour calculer yr. Donner l’expressionde O/I.

d - Hormis yr. nous allons améliorer la prkision de chaque Y,,+~ cn utilisant une formuleitérative appclkc correction. On désigne alors par y&+r la valeur calciilk au $ b et par yI,,+r la k’valeur itérée. Pour calculer la valeur &+r >on considère qu’elle est, dCt,crminee pa,r l’intersectionde la droit,c Q ct, dc la droite x = z,,+r ; la droite Q est construite de la manière suivamc : clicpasse par lc point (z,,, , y,,, ) et sa pent,c est la moyenne arithm6t~ique de la pente de y(z) calculéecn (cc,,,, y,,,) et de la. peme calculk en (z,,,+r, y&+r). D onner l’expression tir y$,+r

e - CJuel crit,ère pourra-t-on rctrmir pour limiter les it,eratioiis‘!

f - La mbthode proposée converge lorsque h < L/IV, on AT = sup~3f/& dans lc voisinage dupoint, où l’on rfftctuc les calculs. Comment s’affranchir de cet,te contrainte?

g - Après avoir transformk l’bqrration différcnticllc sous une forme integrale sur les intervallesdéfinis pour la formule dc prédiction et pour la formule de wrrcction, donner les expressions del’erreur dc la prklkt,ion et de la correction. On pourra effcctwr un développcmcnt analogue àcelui qui a Pt,k rbalisi‘ lors de l’ét,ude des mbthodes des t,rap&zcs ct de Sirnpson.

7.5. Étude d’un phénomène transitoire obéissant à une équation différentielle du premier ordre

Si la constarne de temps est, faitk devants l’uriitb, alors bien avant, l’imité, la solution prkcnterade faibles variations donnant l’illusion d’un phénomène rkgit par une grande constante de temps.L’intkgration numérique peut alors poser qiiclques prohlèmes.

1. Position du probkme - Soit l’équation diff~rcnt~ielle suivante :

&Ydn:

~ -507~ + 5 avec y(O) = 0,20. (H.ll)

463

Page 442: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

a - Montrer que la solution formelle peut, se met,tre sous la forme :

:y(t) = O,l[l + exp(-50t)]. (H.12)

D@terminer l’intervalle de variation de y(t) quand t apparticntj & (0 ; ZQ). puis reprkentergraphiyucmcnt cet,te solution.

b - Calculer par la méthode d’Euler les valeurs numériques y( 1) ct, y(2) (rcspcctiwment, pourles valeurs ti = 1 et tZ = 2) avec un pas d’intbgration h = 0.05. Comparer avec le calcul directde l’expression (H.12).

Que suggérez-vous pour obtenir des valeurs numériques plus confornws a celles olkemles àl’aide dc la relation (H.12)‘~

2. Étude d’une méthode de résolution spécifique - On considère une kluation un peu plusgCm?ralc. soit :

dY- = -Dy + <s(t)dz

avec D » 1.

où s(t) représente une fonction continue A variations faibles (lentes) sur (0, w).

(H.13)

a - En multipliant les deux memhrcs de (H. 13) par exp( -D t) puis cn intbgrant entre tl ettz. montrer que l’k~uation (H.13) 1 leut se mettre sous forme d’une kquation intégrale qui estéquivalerke :

v(h) = yy exp[-D(b - ti)l + .I exp[D(t - tz)s(t)] dt (H.14)

tl

b - L‘intégrale figurant dans (H.14), dtsignPe par 1. peut Rtre calcuke d’une manke approchéepar le procédé suivant : si s(t) est développable en série erkière. on obtient l’approxima.tion entronquant le d6vcloppcmcnt à l’ordre N ;

N

s(t) = c t”llk: ;k=O

qu’il sera plus hathile d’écrire (l‘intér&t apparaîtra plus loin...) :

cn posant, 1-1 = t2 - tl.Montrer que 1 peut être approchke par l’expression :

II&&k,=O

Donner l‘expression de C,,. puis la relation de récurrençc cntrc deux valeurs conskutivcs Cket C~+I. (Intégration de Ck par parties.)

Choix des points de calcul - Il est commode de choisir les poirks eu progression arithmétique :

T~-k=t2-kp a v e c : k=O,l,...,N

464

Page 443: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

Étude du cas N = 1 - Calculer les points TO et T1, puis les valeurs sk = S(T~) en fonction des(1,). Exprimer les ni en fonction des sk. Donner alors l’expression de y(Tl) en fonct~ion des C,et .T,~.

Application numérique - En conservant le pas h = 0,05; calculer y(l) et y(2) dc l’tquat,iondiff&enticlle (H.11).

Étude du cas N = 2 - Calculer les points TO; T1 et T2, puis les valeurs sk; = S(T~) (:II fonctiondes u,, Inverser ces relations pour obtenir les ‘II en fonction des sJ Donner l’cxpwssion tic y(Tz)en fonction des C, ct .çj.

3. Généralisation de l’équation (H.13) - 0 ri considere à présent yuc s(t) dépend de :Y(t) ctl’on Ccrira :

s(t) = s[y(t): t].

L’éyuat,ion (H.13) n’est évidemment plus linéaire, mais on supposera encore que s [y(t); t]est, une fonction à variations lentes et faibles. Rien du développement, formel préckdemrnentr&li& n’est, modifié, seul lc calcul de l’int,égralc demandera le calcul explicite tic s[y(t); t], carles coefficients ak dépendent des valeurs obtenues pour les y(T,).

Écrire explicitement l’expression donnant y(Tl) à partir de la forrnulc obtenue pour N = 1.Indiquer ur1 procédé pour obtenir effectivement y(Tl) en fonct,ion dc ~(T(I) = y(0).

Cormaissant à présent y(To) e t y(Tl), donner la formule exprimant y(!&) A partir del’expression obtenue pour N = 2. Puis indiquer un procédé perrnett,ant dc calculer cffectivemcnt02).

Décrire urle procédure complète d’intégration de la dernière équation différentielle proposcie.

Application numérique - Soit l’équation : 2 = -501/+ & avec y(0) = 0.2. Calculer ?/(II) ety(2h) avec h = 0,05.

7.6. Problème de la poursuite

Un jardinier tourne à la vitesse constante dc 6 km/h autour d’un parterre dont la forme est uneellipse de grand axe 26 = 20 m et de petit axe 2a = 12 rn. Lorsqu’il est en A, son chien est cn Bet court à sa rencontre de telle sorte que le vecteur vitesse du chien passe à chaque instant parle point où SC trouve le jardinier. Le chien court à la vitesse constante de 20 km/h. Sachant~ quela distance OB = 30 m ct que le chien a le droit de piétiner le parterre, t,rouver la trajectoiredu chien et représenter la graphiquement (cf. Fig. H. 1, page suivante).

Trouver, au besoin expérimentalement, des conditions initiales de ce problème pour lesquellesle chien ne rattrape pas le jardinier. Tracer dans ce cas le cycle limitcx de la trajectoire suiviepar lc chien.

8. Intégration des équations aux dérivées partielles

8.1. L’équation de Laplace, les isothermes d’un réfrigérateur

Nous nous proposons de d&rminer dans le plan les isotherrnes d’un rkfrigérateur à l’équilibrethermique, c’est-à-dire quand dT/dt = 0, expression dans layuellc T représente la t,cmp+rat,urc:et t lc temps (cf. Fig. H.2, page suivante).

Page 444: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DF: c4~f.x~ IWIMÉRIQUE APPLIQUÉ

La géonktrie du réfrigérateur est donnée sur la figure H.2 : lc congélateur est représenté par unrectangle à la température dc -10 “C, en revanche, la paroi du rkfrigkrateur est à la tempkratureambiante dc 20 “C.

x0 cm

Figure H.2. Isothermes d’un m?frigFrmkw.

Procéder & mi rnaillage convenable du dornaine, calculer la tcrnpératurc cri chaque point dumaillage et déterminer quelques isothermes dr cc système thcrmiqur:.

4 6 6

Page 445: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A N N E X E H. PROBLéMES E T E X E R C I C E S

8.2. Refroidissement d’une sphère homogène

Une sphère homogène dc cuivre dc rayon 7’ = 5 cm est, portée à la temp&at,ure uniforme Ho =90 “C. Au temps t = 0. elle est plongée dans 1111 grand rkervoir d’wu à la tcmpératurc uniforme01 = 10 “C. On considère que cc rkservoir est un excellent thermostat. On demande do calculerla tcmpiirat,ure dans la sphkc: à diffkrcnts instants. On dit que la sphère est c:orrll->lèt,cmr,ntrefroidie lorsqur son centre, est à une température inférieure à 10,l “C. Déterminer la durée durefroidissement. On donne le coefficient dc diffusion dans le cuivre D = 1.12 cm2/s.N.B. - Attention & l’usage des coordonn~cs sphériques que nous emploierons dc toute façon,mais CII 1’ = 0 les équations sont discontinues. Comment pallier cet inconv6nicnt ?

8.3. Cas où tout le volume est le siège d’un dégagement de chaleur

Si tout lc volume est, le siège d’un dégagcmrnt de chaleur, montrer que l’kluation dc la clialcurs’krit, :

où P est la puissance dissipk par unit,6 de voliimr~. p est, la capücit~k calorifiyuc par unit6 devolume et X est la conductibilité thermiyuc du milieu.

Un cylindre dc cuivre de longueur indkfinie, dc rayon R = 1 cm. est, parcouru par 1111 courant 1.La rkistivitk du cuivre est r(T) = ro(l + QT), où r‘() = 1,72 10-s bL m. T est cxprimb en “C cta = 4,1( OC)-‘. On donne 0 = 3,40 Jcn? ct D = f = 1,12 cm p2se.-1. On plonge w fil dans unbain (thermostat) 5, la tcmpératurc de 10 “C, on attend que le fil soit en éyuilibrc thermiyuc,ensuite on fait passer 1111 coura.nt continu réparti uniformément d’intensité 1 = 200 A.

Après avoir montré que P = r(T)j” avec j = 5: dkterminer lc profil de température deseconde en seconde dans une: section du fil.

9. Les transformées de Fourier

9.1. L’algorithme de Cooley-Tuckey

Réaliser le programme dc la transformée dc Fourier directe et de la transformée dc Fourierinverse.

On c’omrncncera par rkliser des programmes de mise au point qui sont :

a. la table des adresses pcrmettjant de mettre les domkes dans le bon ordre ;b. la table des simls (et cosinus) au moyen d’un algorit,hme rCcurrent ;c. la transformke de Fourier par dkimation.

On pourra tcstcr les deux transformkes de Fourier sur une gaussicnrle tronquk (il fautréflkhir sur la troncature.. .). La transforrn+e inverse doit permettre d’obtenir les valeurs dcdépart, éventuellement entachkcs d’une petite erreur, déphasées dc ?r selon lc choix rctcnu pourrcprkentcr les données.

Transformke de Fourier de la fonction porte.Transformk de Fourier d’un rkeau (taches de difbaction).

467

Page 446: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

9.2. Étude d’un vélocimètre

On se propose d’étudier un dispositif pcrmcttant dc mcsurcr la vitrssc d’écoulement laminaired’un fluide, ou plus exactement la vitesse de très fines particules en suspension dans ur1 liquide.

Le liquide s’écoule dans un tube cylindrique transparent au sein duquel on projette l’imaged’une plaque opaque dans laquelle il y a N trous de diarnhtrc a disposk sur une droite selonune progression arithmktique de raison 6. L’image de l’axe portant les trous est, parallèle à l’axedu cylindre contenant lr fluide (cf. Fig. H.3).

’ Canalisatiori dcl’koi~lemrnt

Lampe etcondensateur

Rlesurc

Figure H.3. Étude d’un vdoçimètre.

Pour des raisons de commodité, on supposera que l’image a lc grandisscment 1 en valeurabsolue. Notons que la plaque trouée peut être avantageusement remplacée par lme diaposhivesombre dans laquelle des points blancs jouent le rôle des trous. On éclaire le systhne avec unelampe alimentée en courant cont,inu afin d’éviter les modulat,ions parashes dues au courant,sinusoïdal.

En l’absence de suspension, l’intensité reçut par la cellule photoélectrique est constante etégale & 1,~. Le passage d’une Part)icule G devant> les trous va provoquer l’absorption dc lumière.On appelle u la vitesse de la particule dont on supposera que la taille est nkgligeable devant lataille des trous.

Montrer que l’intensiti: absorbée I,(t) peut être rcprkentée par la figure H.4, page ci-contre.On donnera les valeurs de Q et p port& sur la figure H.4, page ci-contre, cn fonction des

param@tres préckdcmment definis. Ensuite, on calculera formellement, J(V) la transformée deFourier de ICA(t). R.epréscnter alors J(V), soit en tabulant la fonction .I( v), soit en calculantnum&iquement la TF de I«(t) pour un nombre de trous donnés, de dimension et d’espacementdonnks. L’allure de la courbe est donnée figure H.5, page ci-contre.

a - Donner les expressions des quantités A; B et C’ portées par cette figure.

468

Page 447: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

Figure H.4.

Figure H.5.

t

n n

1 I .‘B c u

b - Comment concevez-vous l’appareillage du cadre « mesure » chargée du traitcmcnt dusignal?

Le parallélisme entre l’axe des t,rous et l’axe de déplacement des particules G doit êtrerigoureux. Comment réaliser ccttc opération à l’aide du dispositif et de l’appareillage ut,ilisés?

Dans la réalité, le nombre dc grains G est très élevé, et l’on recueillera sur la cellulephotoélectrique un signal formé de la superposition de signaux tels que celui présenté figure H.4,mais déphasé d’une façon aléatoire les uns par rapport aux autres. Dire pourquoi l’allure généralede J(V) ne sera pas modifiée.

9.3. Calcul numérique des transformées de Fourier pour un nombre de données N = b”

Soit f(x) UIC fonction appartenant à L2, et l’on désigne par v(t) sa transformée de Fourier.On ne considère par la suite que les fonctions échantillonnées normalisées. Pour chacune desfonctions, on dispose de N échantillons complexes (uniformkment répartis) notés fin et yak avec(k, m) = 0, 1,2, . . , N - 1. Au besoin, on peut 6crirc fTrb = f; + jf7, et pk = cpi + jy~i.

La transformée de Fourier discrète s’écrit :

cpk = ; Ny fmWN”L 27ra v e c WN=exp jN

m=o ( >

4 6 9

Page 448: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Ou silppow (1uc ,Ir est une puissarlcc dc trois : N = 3”. Morltrcr que vh c,st, une comhiuaisonlin6airc~ du trois trausformtks dc Fourier comprenant chacune N/3 kharlt,illons ; soit :

Morltrcr que les transformks de Fourier Ak, Bk ct Ck peuveut être calculks par lc mêmeprocétli! ct, aiiisi tic suh:.

On suppose s = 2. Donner l’ordre dans lequel doivent î:trc disposées les donn~cs pour mcncrà bien lr calcul utilisant cet algoritlime.

Dans lc cas où N = 2” nous savons que la donnke no k doit être d6plack au rang j, valeulqui est donni:c par :

Montrer comment doit, Ctrc modifiCc cette relation pour l’adapter au cas N = 3”. Vérifier surl’excniplc N = 9 la validitb dc la relation proposée.

Montrer comment ou peut gbhaliwr ce procédé de calcul des t,ransforméw de Fourier au casoù N = 0” où 0 est, uii ciiticr positif supérieur ü 1.

10. Introduction aux méthodes de Monte-Carlo

Générateur de nombres pseudo-aléatoires

Rkaliser un générateur de rlomhcs psclldo-aléatoires A distribution rectangulaire (ou uniforme)selon lc procédk tic Lchmcr. Tester ce génkrateur.

Réaliser un générateur de nombres psclldo-aléatoires à distribution gsussicnnc CII usant duthéorème central limite.

Cette dernière façon de prockdcr peut c’trc mtdiocre si les queues de distribution jouent unrôle important. On prf?fkrera, :

II e t & @tarit d e s nombres psciido-aléatoires iridépendants, à distribution rectanguhire etappartenant à (0, 1). Tcstcr ce procbdé.

Comment obtenir des nombres psciitlo-alCatoircs indépendarits et gaussicns dc moycnncdorinCe ru et d‘kcart type c‘?

a - Calculer r par un(~ mkt,llode de Monte-Carlo.

b - Calculer quclqucs intégrales dkfinies par une mkthode de Monte-Carlo.

c - Rhoudrc localcmcnt 1’C:quation de Laplace par une méthodr de Monte-Carlo. On rcprcndrale prohlhe concernant lc calcul des isothermes d’un rkfrigbratcur et l’on comparera les difkentsrbsultats (rxcrciw du chapitre 14).

470

Page 449: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

11. Éléments de calcul des probabilités

11.1. L’ordre s ta t is t ique

crjr4 est la plus pctitc clcs valeurs <i et, :x:77 (rI) ,‘d p us g-mn&:. On atlnict que les iilf?gnlitk sont,1

strictes en probabilitk car F(z) est continur.On dispose de 71 urnes nuni~rotCes de 1 à 71, et l’ou place: cha~unc des valeurs :zk’ tlms l’urur

(II)k: corrcspondaut au rarlg k attribue par lc classement. zk est uw wrriablc alkdoirc.On cffcctuc le tiragr des coniposantcs d’un nombre de vecteurs V aussi g,r;rnd que l’on veut.

toutes les coniposautes de tous 1~s vcct~curs Ctant des variables &atoires iri<~i:r>c,iid;Liitc,s ticnlêirie rCpartition F(.r). Pour chaqiw vcctcwr V on cffrctuc le classemeut puis 1~ rmiplissagc~ des71 urnes. On se propow d’6tudicr la. statistique des élimcnts conttnus dans chacune &Y+ urnes,ct plus prkiséineiit lrur distributioii.

a - On désigne par IV,, (CII) 1 c nombre de coiriposmtrs <j (lu vcctcur V qui sorit iiif~rirwrcs 5un nombre donn6 :z qui opp’tr$;nt, 5 (-XI. +~XI). Moutrer que S,,(T) = N,, (x)/T) est la fouctionde répartition des variables zk , pour wla on cxplicitc les intervalles tk d&iit,ioii dc .I; pourles diverses wrlrurs discrCt,cs susceptibles d’atre prises par S,, (XI). On iiotc: qiw. pour 31 fixé,7j = S,,(z) mt une variable aléatoire car si les valeurs prises par S,,(X) sont ~~oiiniics. 011 rie sait,pas pour quelles valeurs dc nr ces valeurs sont prises. S,,(z) s’appelle r6partit,ion mipirique desxp.

b - Donncr~ cn fonction de F(z), l’cxprcssion dc la probabilité P(& < x). c’est,-à-dire laprobabilité que la composante & soit iufkieure au nornbrc a: kmqué au 5 a. Puis rnontrcr queP(& < z) = constante = p. quelle que soit la. coniposant,c~ d’intlicc lî (k = 1, 2; . . 71,).

c - 011 se propose de calculer la probabilité que S,,(T) prcnnc l’une des valeurs possibles. soit,/n/u, donner son expression en fonction dc F(X) (c)u p) : 1mur cela. on reniarquc qu’il doit yavoir m coinposantes du vcctcur V qui sont inf~rieurrs 5 z (6vtnt,uellenlrnt une @.$c A X) ct(n ~ ~rrt,) qui sont sup~ricurcs à .z’. 011 justifiera l’usitge dc la loi birioinialc.

(il) .d - À prCscrit, on s’intéresse à la distribut,ion tic la variable aléatoire: .r;,j (’ (3,-kdire de tous

les E,, (de chaqw vcctcur V) tombés dans l’urne j. On désigne par 9:“) (CI;) la probabilit6 que

T(“’ soit inf@rieur à un noinbre 2, c’mt-à-dire p(z:‘“) < CT).

L’événement I~(X,?’ < z) a lieu quand au nioins j coinposantcs dc V sont, inf6ricurrs à 5.Montrer que l’k&wment E (S,, (~ )E(x:")

.ï n’est pas plus petit, que 6) est ~quivalmt, 5 l’~v~ncinent~

< XT). E n tfkluire q u e Q>,‘“‘(x) = c:;,_j P[S,,(x) = y. puis tlonncr l’c~xpwssioii de

Qi”’ (3~) cn fonction de F( 3~).

e - Montrer que :

F(z)

sFI(1 ~ t)‘j+.’ dt.

0

471

Page 450: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

pour ce faire, on réalise une succession d’intégrations par parties de cette dernicrc expression.En déduire la fonction de distribution .f:‘“‘(~) de la variable z appartenant à l’urne j, puis

donner l’expression de la valeur moyenne (CT?‘) des Ei dc chaque vecteur V qui sont tombésdans l’urne j.

Application numérique - La fonction F(z) est la loi uniforme :

0 pour 5 5 0 ,F(x) = x pour 0 < z < 1,

1 pour 5 2 1 .

et l’on s’intéresse à la statistique d’ordre n = 5 (il y a 5 urnes). Donner l’expression de la densitéde probabilité, puis calculer la valeur moyenne des & tombés dans chacune des urnes. Vérifierque les résultats sont symétriques.

12. Lois (Binomiale, Poisson, Gauss-Laplace)

12.1. La loi Binomiale

Approximation de n! au moyen de l’approximation de Stirling : log,,(r~!) = nlog,(~n) - n.Application numérique : calculer n! pour n, = 50 puis 60, 70, 80, 90 et 100. Quelle erreurest commise sur ces approximations?

Approximation de n! au moyen de la formule de Stirling :

n! = nn exp( -n)&G( 1 + E,)

avec TX, 4 1/12 quand n croît indéfiniment. Reprendre les calculs précédents.

12.2. La loi de Gauss-Laplace

Effectuer un sous-programme qui réalise le calcul des trois intégrales suivantes :

f(x) = & /exp (-z) d t

0

s(x) = 14 - f(x)

h(x) = fi]exp (-T) dt.

0

12.3. Loi du x2

Effectuer un sous-programme qui réalise le calcul du x2 a m degrés dc liberté :

4 7 2

Page 451: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PR.OBLÈMES ET EXERCICES

00I-(z) =

.Iexp( -t)t*-r dt

ryn + 1) = :I!( n+; ) 1r .3. 5 . . ~.

( 2 n 1 )=2 ”

6.

12.4. Loi de Student

Effcctucr un sous-programme qui réalise lc calcul de la loi de Studcnt à m degres de liberté :

12.5. Loi de Poisson

Effectuer un sous-programme qui réalise le calcul de la loi de Poisson :

Pk: = $ exp(-A).

On donne X = 30, par quelle courbe de Gauss peut-on approcher cette loi? Donner le sup dumodule de la difference entre ces deux fonctions.

12.6. Loi de Poisson. Distribution de Cauchy

On considère la variable aléatoire < obéissant a la loi de distribution

p(z) = kexp -a121 pour z appartenant à (-00; +oo)

expression dans laquelle u. est un paramètre strictcmcnt positif et k une constante de normali-sation.

a - Calculer la constante k.

b - Rappeler la définition de la fonction caractéristique 4(t) d ,lP a variable aléatoire < et donnerl’intervalle de définition de cette fonction. Calculer effectivement 4(t).

c - Calculer la moyenne m ainsi que l’ecart quadratique moyen D de la variable aléatoire [.

d - Rappeler l’expression de la distribution i(m, z) de Student à m degrés de liberté d’unevariable aléatoire 7 et donner son expression dans le cas où m = 1; on désignera par q(z) cettedistribution particulière.

e - Donner l’expression Q(t) de la fonction caractéristique de la variable aléatoire q.

f - Soit z = i ~~‘, Q la moyenne arithmétique de ré variables aléatoires ‘rjk indépendantes etdistribuées chacune selon la loi Q(Z). Donner l’expression de la fonction caractéristique Q(t) dela variable z, puis en déduire sa fonction de distribution.

473

Page 452: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Quelques résultats utiles - La transformle de Fourier

12.7. Loi binomiale négative. Loi de Poisson dont le paramètre suit une loi du x2.Urne de P6lya (1887-1985)

Page 453: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

b - En réalité, X est uue variable aléatoire qui suit une loi du ,y” dorlt l‘expression s’kcrit, :

3. - On considère UIC urne qui contient 0 houles noires et, r houles rouges. Après chq~w tiragecffcctu6, mi remet dans l’urne la boule tirée plus c boules de la rriêirir couleur-. (Il s’agit diuntirage contagieux dans ~IIIP urne de Pdya.)

a - Donner l’expression de la. prohl~ilité IITLIT12 de tirer d‘abord nl hiiles noires puis 112 lmulrsrouges. Moutrrr que, quel que soit, l’ordre fixb du tirage de srt,1 hulw noires et (1~ ~12 l~oul~~s ro~~gcs.la probabilité est toujours la rrihe et vaut II,,, ,12.

b - Donner l‘cxprcssion de la prolzhilit+ P(TI,~. 71) de tirer ni hules uoircs pa.rmi 7) tiragrIs

c - On pose :

d - Lorsque 77, i cx ct, que p et, fy tendent vers xCr0 de telle sortr que :

1

rriontrcr que la distribution asynlpt~otique étudi& t,end vers la loi horriialr riCy+tiw :

c,, + cy:,Jl +P)“I.

ct, enfin que :

Page 454: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUE

Quelques résultats utiles - Coefficient du binôme, n est un entier positif :

(1 + z)” = 1 + nIc + ‘. +n(n ~ 1) t.. (71- k + 1)

k!+ . . + 27~ = 2 cj$”

k=O

(y = crr-p =n! n

n n p!(n -p)!) = p0

Coefficient du binôme gkkralisk, cv est un réel quelconque positif :

(1+ 2)” = 1+ cY2 +. ‘. +~(c-l)..+-k+l)~,+,

k!

(1 ~ z)-(y = 1 + ayn: + . + da + l) -;‘* + k ~ 1) y+ +

= 2 c;+,J? = 2 (y) (-l)%“.k=O k=O

,..=

~ E C!,,(-x)”k=O

La fonction factorielle :cc

r(x + 1) = 2! =J’

7Lz exp(-u) du.

0

quand nz est très grand devant l’unit&

12.8. La loi binomiale négative (reprise et applications)

Une urne contient P boules blanches et Q boules noires (P et Q strictement positifs). On effectuedans cette urne des tirages non exhaustifs, c’est-à-dire que l’on procade à la remise dans l’urnede la boule t,irke avant d’effectuer un autre tirage. On note p la probabilité de tirer une bouleblanche et 4 celle de tirer une boule noire (p + Q = 1). On appelle succès lc tirage d’une bouleblanche et échec le tirage d’une boule noire.

On s’intéresse aux suites de n tirages notées S;i telles qu’un 7~’ tirage fournisse le F succès quiclôt la suite, T 6tant un nombre entier positif fixé à l’avance. Pour cela. on poursuit l’expérienceaussi loin qu’il le faut. ré étant aussi grand que l’on veut. Les suites Si se tcrmincnt toutes parun succès qui est le Y’. Comme n 2 T, il est préférable d’écrire n = T + k avec k = 0, 1,2,. .

a - On note f(k: ~,p) la probabiliti: que le re succès ait lieu au tirage T + k. Au cours des T + kt,iragcs, montrer que la probabilité d’avoir tiré exactement k échecs qui précCdent le tirage dure succès est aussi f(k, r,p).

b - On appelle événement A la réalisation du Te succès au tirage T + k, événement B laréalisation de k échecs au tirage T + k ~ 1, et enfin 1’CvSnement C la réalisation d’un succèsau tirage T -+ k. Écrire la relation entre les événements A, B et C. Calculer la probabilité de laréalisation de 1’CvCnement B en fonction de T, k,p et 4.

476

Page 455: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

c - Donner l’expression de f(k, r,p).

d - Plus généralement, pour 1111 réel T > 0 fixé et pour 0 < p < 1, la séquence {f(k, rT p)} aveck = 0, 1,2, . . est appelée distribution binomiale négative.

On montre que pr (1 - 4t) pT est la fonction géneratrice des moments non centrés. À l’aide decette fonction génératrice, calculer ml la moyenne de la variable aléatoire entier? p qui suit ladistribution f(k, r;~), puis rn2 le moment du deuxième ordre. En dcduire la variante c2.

e - Sur six pommiers d’un verger tirés au hasard, on a prélevé sur chacun 25 feuilles toujoursau hasard, puis, on a dénornbré les rnites rouges sur chacune des feuilles. Les résultats obtenussont présentés dans le tableau H.l d’après C.I. Bliss, Fitting the negataw bin,omiul distribution

to bioloyical data, Biornetrics, juin 1953 p. 176.

Tableau H.l.

Nombre de mites Nombre de feuillespar feuille observées

0 701 352 1 73 1 04 95 36 27 1

8 et plus 0

Calculer la moyenne m, et l’écart type 0: de cette distribution expérimentale.

f - Pour rendre compte de cette distribution expérimentale, on envisage l’hypothèse d’unedistribution de Poisson de paramètre A. Donner la valeur de A. Calculer les diffcrents Pk puis lex2 correspondant. Peut-on retenir l’hypothèse d’une distribution de Poisson‘?

g - On fait l’hypothèse que la loi expérimentale est la loi binomiale nkgative. Calculer T, p et4 prkédemment définis. Puis calculer la probabilité théorique que le nombre de mites sur lesfeuilles soit m = 0, 1,2, . , 7.

h - Calculer le xL correspondant. Peut-on retenir cette dernière hypot,hèse?

Quelques résultats utiles - Coefficient du binôme, n est un entier positif :

1C*l = C;i-” = lx. n

p!(n -p)!) = P0

477

Page 456: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M~NIJEJ, DE cucul, NLIMÉRJQCJE ,~PPLIQIJ~~

12.9. Loi de Poisson. Durée de vie d’un système simple (fiabilité)

1. - Chaque .jour uu cycliste parcourt, la rnêrnr: diskmce. L’c~xpkienw lui a appris qu’il survientune crf3mison de six bicyclette cn inoyrnnc tlciix fois par mois.

a - Calmlcr la probabilitb qu’il survienne cxa.ctrnicnt~ une crev;km rri une scrmiric (1 mois ~4 scrnadrirs).

b - Calculer la probabilitk qu’il survirnnc cxact,emcnt une cwv;kmn en 1111 mois.

c - Calder la probabilit,é qu‘il nc survienne aucunc~ crevaison en un mois.

d - Calmlcr la, probabilité qu’il survicririe trois crevaisons ou plus mi un mois.

e - Ckdciiler la probxhilité qu’il survirnnc c~xactrrncnt, quatre crcva.isons mi tlriix mois.

2. - On SC propose tl’écriw cxpli<itenicnt la loi dc Poisson m fonction du temps 1 ct, l’on dkipepar X le rlombrc rrloycn d’év&mncnt,s par unit,6 de temps. Donrwr l’expression de la, loi dc PoissonPh: (t) donnt\.ut~ la probabilit,6 pour qw X: 6v~ncmcnts survicuncnt durmt. lc tmips t.

On d6sigrie p:u t,, la siiit.c tliscr~tk: dc la date des 6vkmncnts cpi arrivwt s~qlicrit,iellcmc~nt a11cours du kmps. La silitc t,, s’a,ppdlc flux d’~v~iirriir~nts. ct mi rappcllc que les temps d’apparit,iondes 6vikmrrks sont, ind4?pcrdmk les ii115 des aut,res.

On désire kt~udirr la stat,ist,iquc de 13 variable al&oire [ = t,+l - t; qui est, lc tcnips quis’koulc crkre deux év6ncrnents consécutifs. AIm?s avoir rcnmrqu6 que [ est une variable ;~l~atoirccoutinuc. dculcr la. probabilit,@ F(t) = P(c < t) 1 3 1( ut R wuiablc al&~t,oirc [ soit plus petik> que f.

Pour cela on calculera d’abord l;t probabilit,@ pour que. dans un iritcrmll~~ t d6biit~arlt 5, l’inst~aritti ~ il n’y ait itiicun évtncmcnt. En dkliiire la rlciisiti~ de probabilit6 .f (t) à 1;qiicllc~ ohkit lavariable al6atoirr <. Calculer la nioyennc~ n tic < ;rinsi que sa, variancr 0’.

4 7 8

Page 457: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICISS

On ctésignc par A 1’évt:nrment < > 7, B l’h+nement < - T < t.À l’aide du thtorèrnc des probabilités co~nposées, donnc~r l’expression dc P(A L3) ; en d6duirc

l’cxprcssion de 4(t) en fbrlction tic P, A et I3. Montrcr que l’h+nenlerlt A. B pmtj aussi s’écrire :

r<c<t+r,

c~xprcssiorl dont on calculera la rbpart;itiorl en fonction dc F, t et 7.Donner à pr6smt l’c,xpression de 4(t) CII fonction de F. t ct, 7.Rcmj~l;wer F par l’expression dmlée au 5 1, ct montrer yuc F(t) = 4(t)

12.10. Durée de vie d’un système. Loi de Weibull (1887-1979). Fiabilité

La dur& dc vie dhn systèrnr pliysicjw est inesiiréc par la va,ria,lde aléatoire <. On se j>roposctl’ktwlkr la rkjmrtit,iorl F(t) dc ccttc, variad~le~ soit, : F(t) = P(< < t).

On tlésignc par X(t) 1 c c:orfficirnt~ des cl6faillanws eii fonction ~111 temps t qw l’on dc%init dela fac;oii suivaritc :

X(t) =n(t) ~ n(t + At)

at n(t) '

n(t) ft,ant lc nombre de syst,èrries ayant vki1 jusqu’à l’instant t, At étant un intcrvallc de tempsjwtit (infiriiirierit~ petit du prcmicr ordre).

a - Montrer que F(t) 1 xiit SC: mettre sous la fornw :

'n(t)F(t) = 1 ~ n où n = n(O).

b - Donrlcr 1’Cqnation cliffhcnti~lle du prcnkr ordre ii. laqucllc obht la r&wtition F(t) cnfmhiori de X(t). 0 ii cxploitcra lc fait, que l’ori pciit, bcrircx :

X(t) = n(l) ~ ,n(O) + n(0) - n(t + at)At n(t)

puis qiic At rst, iii1 infîriirricnt petit dii premier ordre.

c - En intbgrant~ 1’6quation diff6relltirllt~ ol~tcnuc:, doimrr l’c~xprc3sion cl<> F(t) mi fonction de

X(t).

d - Uricl classe int,kwss;r,nte de coefficients dr défaillance A(t) est, doriri& par l’cxprcssiori :

X(t) = A&~*-’ avc<. A(] > 0 rt 0 > 0,

donner alors 1’expmGon dc F(t) ahsi que cc~llc dc f(t).

e - Calciilcr la rrioyeririe a clc < ainsi que sa variancc~ a2.

f - Ccttc loi est wiinw sous lc nom de loi dt Wddl et, trmvc son rrnploi mi t~h6oric~ de lafiabilitb. La dmsit6 dc prolml~ilitk f(t) ( ou la r@partitiori) btahlie à la qiicstion 11 du pri-c~Cdmtprol~lhc cd un cas particulit~r (1~ la loi de Wcilmll, donner dors la valmr de (1 qui corrcqmidX cc cas pa’ticiili~r.N.B. - Or1 tlonnc :

oc

.ryz+l) =.i

1x1 exp-- PI) d71.

4 7 9

Page 458: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

hfA.WJEL DE CALCUL NUMÉRIQUE APPLIQUÉ

12.11. L’inégalité de Kolmogorov (1903-1987)

Soit X une variable aléatoire continue de moyenne nulle E(X) = 0, d’écart quadratiquc cr2 etde fonction dc dist,ribution f(z). On considère un nombre arbitraire t positif.

a - Rappeler la demonstration de l’inégaliti: de Bienaymé-T(:hehycheff’ :

où F’ désigne la probabilité, et l’on prkisera le domaine de validité de t.

b - À présent, on suppose que ]X/ a une borne supérieure désignk par I3. Montrer que :

expression dans laquelle a est compris entre 0 et B. En dcduire que

wy > a) 2 E(X2) - 2B2

Cette expression s’appelle inégalité de Kolrnogorov.

12.12. Loi quasi normale

a - On considère une variable aleatoirc Y de moyenne nulle E(Y) = 0, d’écart quadratiquemoyen E(Y”) = g2 et obéissant à une distribution gaussienne. R.appelcr, au besoin en lesdémontrant, les expressions des moments centrés d’ordre trois et quatre.

b - Par définition, nous dirons qu’une va,riable aléatoire X obeit à une distribution quasinormale lorsque :

E(X:‘) # 0 e t 23(X4) = 3[E(X2)]?

On se propose de calculer les paramètres a et b de la loi :

de telle façon que f(z) soit une loi quasi normale. On montrera que f(z) est bien urlc densitéde probabilité, puis on calculera E(X), E(X’), E(X”) ct E(X4). Enfin, on déterminera n, et b.

Une fois les conditions établies, donner l’écart quadratique moyen a2 dc la loi normale dontles moments deux et quatre coïncident avec ceux de la loi quasi normale envisagce.

13. La fonction caractéristique

13.1. (%)’ tend vers une gaussienne quand n croît positivement

a - Soient deux variables aléatoires indépendantes <r et (2, qui sont toutes les deux normales(gaussiennes) centrées ct réduites. Calculer la fonction caractéristique de chacune d’elle, puis lafon&on caractcristique de la variable rl = <r + &. En déduire la fonction de distribution de q.

4 8 0

Page 459: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE N. PROBLÈMES ETEXERCICES

b - Les variables indépendantes sont toujours gaussiennes mais ne sont plus centrkcs réduites.On désigne par rn,l et rn2 les moyennes respectives et par 01 ct CT~ les écarts quadrat,iques moyens.Donner la fonction de distribution de r/ = El + <2.

c - Gknéraliser le calcul du C; b en considkrant la variable

puis cn déduire le théorème d’addition des rnoyennes et le théorème d’addition des variances(écart type klevé au carré).

d - On considère une variable aléatoire < à distribution rectangulaire. c’est-à-dire uniformémentrépartie sur l’intervalle (-0.5 ; O)S). D onner la fonction caractérist,ique Q(t) de cette variablealéatoire, puis la fonction caractéristique de la variable aléatoire E/n. ct enfin la fonctioncaractérist,ique Q(t) de la variable aléatoire :

où les & sont des variables aléatoires indépendantes à distribution rectangulaire uniformkmentréparties sur l’intervalle (-0,5 ; 0,5).

Au moyen d’un développement limiti: au deuxième ordre dc loge P(t), montrer que la fonctioncaractéristique tend vers une gaussienne quand n tend vers l’infini. En déduire la loi dedistribution dc IL quand n devient grand devant l’unité.

Déduire dc cet exercice le comportement asymptotique de la fonction :

f(z) = (F)”

Effectuer deux prograrnmes qui permettent la vérification expérimentale de conclusion obte-nue. L’un effectuera les auto-convolutions successives de la fonction de distribution, l’autre lecalcul direct de la fonction caractéristique.

À partir de quelle valeur no de n peut-on admettre l’approximation asympt~otique?

14. La loi du x2 et la loi de Student

14.1. Le test de Pearson

On désire montrer que le paramètre de Pcarson

7’ (Y - np,)2x2 = c

pl nPq

obéit, à une loi du x2 à (r - 1) degrés de liberté.On considère une variable aléatoire X dont on se donne u11 échantillon constitué dc n. ékments

notés X1, X2,. , X,.On réalise une partition de l’axe réel en T intervalles notés 11: I2, . 1,. et l’on désigne

parn,p2,..., p, les probabilités théoriques que X appartienne respectivement aux intervalles11,12, . . , I,. (Rkalisation d’un histograrnme.)

481

Page 460: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUM~~RIQUEAPPLIQUL?

Soit 21,22, . . ,2,, une réalisation dc l’~ch;i.nt,illoll. On note: par y , lc Il~oIIllm dc v a l e u r sz;1,22,. . , 2,, qui sppartienncnt à l’intervalle 1, avec 4 = 1, 2, . . . , T.

yq est la valeur d’une variable akatoire Yc, obtenue pour ladite ré;i.lisation. (Ici. 1~ majusculesXk, Yk, . . sont, des variahlcs aléatoirm tandis que les rninusculcs :ck: cyk, . sont les rcialisationsde ces variables alCatoires.)

Pour parvenir à nos fins, nous montjrerons que xL est la somme dc carri-s dc variablesgaussienncs cerltr6s. réduites (au stris large) ct iudépendantcs ohkissant cependant à 11116 relationlinkaire.

a - On rappelle que la fonction caractCristique d’iinc variable albatoire a II din~er~sions (ouvecteur akatoire) X = (Xl, X2, . : X,,) est l’espérance niatli6rnatiqiic clc la varial)lc corriplexc

w[.j(tlXl + t2xa + ‘. + 6,X,,)],

soit :

c$(t1, t2.. ) t,<) = iv {cXp[j(tlXl + t2x2 + ‘. . + LX,,)]}

où I!J { } est l’opkateur espi‘rance rnath6matique portant sur chacl11Ie des variablesMontrer que le rnornent du prernier ordre de la variable X est tlorm~ par :

et celui du deiixièrne ordre par :

b - 011 désigne par PA, la probabilité théorique que la variable X,, appartienne à l’intervalle Ik.Montrer que les variables Y1 , Y2, . , Yr obéissent à une loi dc probabilitk nniltinorriiale :

P(Yl = 121, Y2 = n2,. . Y,. = n,.) =?L!

721!n2! . TL,.!p?,L$” . . .p;fr

c - Nous allons obtenir, par voie directe, la fonction caractkristique de cette loi rnlllt,irlorrlialc.Pour cela., on considère une suite de vecteurs aléatoires indépendants et dr niêrne dist,ributionnotée (Zl, Z.j, . (27) avec y = 1,2, . , ‘n.

Ces coniposantes prennent la valeur 0 ou 1, et l’on pose :

P(Z,/ = 1) = pJ ct “(2.4 = 0) = 1 -7l.j

Montrer que (Y,, Yz, . . , J$) = ~‘~=, (Z:, Zi, . . , 2,4), puis donner l’expression de la. fonctioncaractéristique : q!q(tl, ta, . , t,,) de (Z:, Zz, , 27). En déduire, a11 IIloycIl dl1 tll6or?!IIle

concernant la fonction <:Hractérist,i<luc d’une sonirne de varial,les irld~pcri<la.rltcs, la f0nct,ioncaractéristiqiic :

&q(tl, t2,. , t,,) de (K, K, . . , x.1

d - En utilisant les relations étahlics au 5 a, calculer le mornent du prernier ordre ‘rnlcl ct, lernornent du deuxikne ordre rnzq des composantes x1 du vecteur alfatoirc: (Y1 , Yz, : Y?).

4 8 2

Page 461: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

e - On tl6sirc ttudier le comportement asymptotique de la loi multinomialc quand rl tend versl’infini. Pour cela, il faudra transformer les composantes I$ cn wmposantcs centrées réduites.Montrer que le changcmcnt de variables :

rCpond 5 la question car la nouvelle variable U, lie tl6pcnd pas de 71,. Montrer que la fonctioncaractéristique du vecteur U = (UL, Uz, . . , U7.) tend vers la fonction

qui est la fonction caractéristiqw d‘une loi normale (dégtkkrkc). Pour y parvenir, mi eflectucrades cl~vclopperrierits linlit,& à l’ordre deux..

Montrw que ci=I UII& = 0.

f - Dkluire des ri:sult;tts prkédents. que la variable alkatoire

ob6it A iinr loi du x2 à (r ~ 1) degrés dc liberte.

Remarque : On rappelle un résultat 6lémentairc d’analyse : lim (1 ~ t)‘” tend vers cxp(-s)quand n. tend vers l’infini.

14.2. Le test de Student

Ou considkc une population parcnte gaussicnnc dont la rnoycmw théorique est rr~, et, l’écart typethkorique g. On extrait de cette population mi échantillon de 72, individus. On dkignc~ par :E lavariable caractkrisant la mcsurc sur la population et par :c, la variable associk au ae individu.

On sc propose d‘ktudicr l’kart cntrc la moyeniic dc l’échantillon (z) = A C:‘, z; et lamoyenne théorique nb, c’est-à-tlirc la probabilité P(( (z) ~ 7111 > I), 1 btant 1111 intervalle qu’onse fixe 5 l’ma~xc ~ ou encore on peut se fixer la probabilité P ct l’on détermine l’intervalle deconfiance 1.

Pour se fixer les idées, il s’agit d’un &hantillon de 20 individus dont on a mesuré la taille z.On a trouv6 cxI>~rirrieritalcmr:nt : II" = 170,% cm et (T = 3,&5 cm.

On souhaite que 1 (z) - d apparticnnc ’ 2 un intjcrvalle de confiance où il y ait, 90 chances sur100 de trouver la valeur de (z) donni:e par 1’Cchantillon.

ire approche - Calculer 1 cn utilisant l’inégalit6 tic Bicnaym~-Tchchycheff’. Realiscr l’applica-tion numérique.

2 approche - On suppose que, comme c’est, le cas dans cet exemple, lc uombrc d’individusn’est pas très grand, et l’on se propose tl’ktuclier la rkpartition dc la va.riablc alkrt,oire :

483

Page 462: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

a - Montrer que

b - Sur les variables centrées (zj ~ m), on effectue 1x1 changement de coordonnées orthogonalesau moyen de la matrice orthogonale A d’éléments (ui,) :

Montrer que

-g CE/; = -& - m)2..j=l .j=l

c - Montrer que (x) - m = 3

d - Montrer que

e - Montrer que les variables xi sont centrées, normales, indépendantes et, de même variante.

f - Montrer alors que t est une variable de Studcnt dont on précisera le nornbre de degrés deliberté.

g - On désigne par P( ltl > to) = l-a la probabiliti: que Itl dépasse une certaine valeur positiveto. Déduire la relation entre l(x) ~ ml, a, tu et n.

h - Effectuer l’application nurnérique. On donne :

t”.os(19) = 1,729 to.05(20) = 1,725 t0,05(21) = 1,721.

3 approche - On suppose que la variable t définie au 5 14.2 est gaussicnne. Effectuerl’application numérique dans ces nouvelles conditions. On dorme :

1,640

& J’exp(-5) dt=l-0,05.

0

Commenter les trois résultats obtenus, ct en déduire la valeur de la répartition de Studenth,O5(~).

484

Page 463: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

15. Systèmes à plusieurs variables aléatoires

Système linéaire sut-déterminé. Matrice de corrélation

Dans 1111 document à caractère historique de 1321 on trouve le tableau H.2 d’imposition.

Tableau H.2.

No Nombrede la famille de personnes

Quantitédétenue

Impôt

1 3 4,5 1,52 4 3,8 23 3 3,l 2,14 5 0 L15 7 7,7 46 3 4:l 27 4 3,2 28 2 5,o 3169 6 1,5 1;61 0 3 6.0 2,5

On désigne par 2 la variable aléatoire associée au nombre de pcrsonncs, par 11 la variablealéatoire associée à la quantité détenue et enfin z la variable akatoire associée A l’impôt pcrc;u.Ensuite, on désigne par R le nombre dc familles. Par ailleurs on notera (q) la- moycnnc dc lavariable aléatoire q et par 0: sa variante.

1. - Dans l’hypothk raisonnable de dépendances linéaires, calculer les coefficients de corréla-tion suivants :

a - T,, entre le nombre de personnes et l’impôt payé,

b - T:~~ entre lc nombre dc personnes et, la quantitk détenue,

c - ryz entre la quantiti: d@tcnuc et l’impôt payé.

2. - Quelles sont les liaisons dc corrélation qui sont fondées ou significatives ? On donne unextrait de la table de Student :

h.ns(8) = 1,860 h,m(9) = 1,833 to,os(lO) = 1,812.

16. Critères de conformité

16.1. Exercices du cours

a - Faire un programme qui rkalisc 1111 histogramme. Les données faisant l’objet du classementseront fournies par le générateur de nombres pseudo-aléatoires de Lehmcr.

b - Vkrificr que les nombres générés obéissent bien à une loi de distribution uniforme.

485

Page 464: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - Soit {E,} une suite de nombres pseudo-aléatoires fournie par le générateur de Lehmer.Montrer que la suite dc nombres pseudo-aléatoires :

obéit à une distribution gaussienne de moyenne 50 ct d’écart type 0.

d - Cette façon d’obtenir des nombres aléatoires à distribution gaussienne présente 1111 dkfaut :les queues de distributIion II~ sont pas bonnes. On propose d’étudier un autre générateur denombres gaussiens qui rcspccte les queues de distribution :

% = L-2 log&)]“2 cos(27r<, ,1)

V~+I = [-2 10g,(&)]1i2 siri(27r<i+l)

Vérifier que cc g6nérateur fournit des nombres akatoires ü distribution gaussicnne.

16.2. Étalonnage d’un appareil de mesure

L’étalonnage d’un appareil dc mesure a porté sur 400 mcsurcs dont nous nous proposonsd’ét,udicr les incertitudes : celles-ci, évaluées en nkkrcs, sont regroupées dans le tableau H.3;où mi est le nombre de mesures tombant dans un intervalle donné d’après H. Vcntsel.

Tableau H.3.

ci (m) 20 30 40 50 60 70 80 90 1 0 0mi 2 1 72 66 38 51 56 64 32

On cherche à reprksenter cette distribution expérimentale par une distribution rectangulaire :

;[zzi 1 O/(h ~ u) pour a < z < h:> ailleurs.

a - Pour déterminer a et b, on SC propose de calculer la moyenne rn et l’écart quadratiquc moyeno’, ce qui fournira un système de deux Cquations à deux incormues. Donner les cxprcssions dc~1 et c2 en fonction de a ct b. Vérifier que (L et b jouent un rôle symétrique.

b - Calculer a et b en fonction de rr~ et c2, puis num6riqucmcnt m, a2, a et b. Calculer laprobabilitk th6oriquc dc tomber dans chacun des intervalles dc classement figurant dans letableau.

c - Calculer le x2. Quel est le nombre de degrés de liberté‘/ Qucllc est approximativementla probabilité de dépasser la valeur du x2. Peut-on retenir l’hypothèse d’une distributionrectangulaire?

16.3. Tests d’hypothèse

Étude de la distribution d’une hauteur d’arbres. On a effectué l’étude d’une population parented’une C~~?CC detcrminée d’arbres, et en particulier, on s’est intéressé à leur taille. On a trouvéles résultats présentés dans le tableau H.4, page ci-contre, d’après P. Dagnelie.

486

Page 465: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

Tableau H.4.

h (m) 1 8 20 22 24 26 8 30 3 2 34 36fréquence 2 3 9 1 2 27 1 6 7 2 2

a - Calculer les deux premiers moments 1*1 et D puis l’écart type 0.

b - Doit-on regrouper un certain nombre d’intervalles ? Le cas échéant, proposer mie solution.

c - L’hypothèse H est la loi normale. Calculer les probabilités par intervalles de regroupement.

d - Calculer le x&.

e - Peut-on raisonnablement conserver l’hypothèse H? Justifier votre réponse.

f - Le test de Kolmogorov donne-t-il une confirmation du résultat obtenu au # e? On détailleratous les calculs.

17. Étude des dépendances dans le cas linéaire

17.1. Test d’indépendance stochastique des résultats d’observations

a - Générer 1000 nombres pseudo-aléatoires à distribution gaussienne. On se propose de vérifierles tests usuels d’indCpcndance stochastique sur cet échantillon.

b - Effectuer le test de la rnédiane.

c - Effectuer le test des suites ssccndantc ct dcsccndant,e.

d - Effectuer le test de la somme des carrés des diffkwuzes successives.

17.2. Homogénéité d’une suite de variante

Dans le cadre du schema de régression, on désire vérifier l’homogénéité d’une suite de variantes.À cet effet, on fabrique deux séries dc données sur lesquelles on se propose dc retrouver lescaractéristiques. Pour 5 valeurs de l’abscisse 2, on détermine 5 valeurs de l’ordonnée y selon laloi y = ux + b. On affecte un indice aux points zi, yic avec i = 1,2,. . : 5. On choisira tous lespararnètres comme on l’entend. . .

a - Pour chaque yio on prend 10 valeurs obtenues a partir d’un générateur de nombres pseudo-aléatoires gaussiens d’écart type ~7 ; on les note yy, elles sont centrées sur yLu et ont la variantec2. Il s’agit du même écart type pour les 50 nombres tirés.

b - Pour chaque xi on choisit un écart type a different tel que les 0: obéissent a une loi crédibletelle que :

CT” = a;h”(z&

Effectuer le test de l’homogénéité des suites de variantes sur les deux échantillons. Tenter detrouver une fonction qui soit différente de h”(zi) mais qui en soit une bonne approche.

4 8 7

Page 466: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

17.3. Test d’indépendance stochastique du tirage d’un échantillon

On considère lc jeu de pile ou face dura.nt lequel on note la succession des apparitions. On noteA l’apparition de face et B l’apparition de pile, la prohahiliti: de prkenter l’une des deux facesest 0,5.

On appelle chaîne de longueur n, la suite des A et B obtenue durant l’cxpkricnce, dans l’ordredc leur apparition, au moyen de n tirages conskcutifs. On appelle sous-chaîne une suite constituéeuniquement dc A (ou dc B) limitk à droit? ct k gauche par un B (resp. A). Nous nous proposonsd’étudier quelques caractéristiques des chaînes et des sous-chaînes.

Partie 1. a - Montrer que la probabilité T de tirer une sous-chaîne constitube de 11, éléments(sous-chaîne de longueur p contenant pA ou p1B) est égale à ( 1/2)IL. On bnonccra lc thi:oremc,sur lequel se fonde le calcul.

b - Calculer rn la longueur rnoyenne et 0 l’écart type des sous-chaînes.

c - On effectue le tirage de K sous-chaînes. Donner XK la longueur rnoyenne des chaînescontenant K sous-chaînes.

d - Dormcr la probabilité P d’obtenir au moins une sous-chaîne (parrni les K), dont la longueurVI soit supérieure ou égale à une valeur arbitraire positive A& (on pourra éventuellement calculerla probabilitk contra.ire). On énoncera le théorème sur lequel se fonde le calcul.

Applicat)ion numérique : K = 10; UC, = 8, calculer P.

e - On souhaite que la prohabilitk P d’obtenir au moins IIIE sous-chaîne dc longueur supbricurcou égale à I& soit inférieure ou égale à 0,05. Donner alors la relation cntrc A)& et K: puis donnerIIIE cxprcssion approchée de IL& en fonction de la longueur ‘n de la chaîne (011 prendra n = 2K).

f - Ce résultat peut ctrc utilisk comme test no 1 servant & vérifier l’indépcndancc stochastiquedes résultats d’observation (test fondé sur la mi:diane de l’khantillon). Effcctucr l’applicationnum&iquc pour une chaîne de longueur nj = 100, et comparer le résultat avec celui obtenu àpartir de l’expression approchk donnée dans le cours.

Partie 2 - On suppose que le nombre K de sous-chaînes est, grand devant l’unit&, v6rificrqu’il en est de mCmc dc XK. On SC propose d’étudier la variable aléatoire [ (désignée par nprécédemment,) qui est la longueur d’une chaîne constituée de K sous-chaînes de longueur l,j :

a - Calculer C l’écart type de la variable <. Rappeler le thkorème central limite. En déduire ladistribution dc la variable aléatoire <, puis donner l’expression de la probabilité P(c < L/O) pourque < soit plus petit que la valeur arbitraire ~0.

b - En choisissant le seuil de signification Q = 0,05, donner l’inégalit6 à laquelle obéissent, < etK .

On donne :

0,05 = & iexp (-c) dt.

1:ii5

488

Page 467: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXFXGICES

c - Si l’on se domle la taille <> de la chaîne, montrer que le nombre de sous-suites K (fonctionde <) doit être plus grand qu’une certaine limite li‘Inin pour ne pas tomber dans la queue dedistribution (1,96 ; CO), cas des évi:nements peu probables.

d - Montrer que ce résultat peut, servir dc test no 2 des skies fond6 sur la médiane del’écharkillon. Effcctucr le calcul numérique pour UIK chaîne de longueur [ = 100, ct comparercc résukat à celui obtenu avec l’expression approchée donnée dans le cours.

Montrer que la limite du module de la différence de ces deux derniers tests (t,cst no 2 ct testdu cours correspondant) est 1/2 quand la longueur de la chaîne tend vers l’infini.

e - Quelles critiques de principe peut-on former concernant l’application simultani:e de cesdeux tests numérotés 1 et 2? (Il s’agit du strict point de vue de la rigueur.) Montrer brièvementcomment on pourrait pallier ces incomknicnts.

Quelques résultats utiles

(l+a)” = l+r~a s i 101 < 1 .

17.4. Loi F(m, 1). Étude du rapport de deux variantes :loi de Fisher (1872-1962) - Snedecor (1881-1974)

On considerc mie population parente sur laqucllc on prélève un khantillon tic 72. individus. Cesn individus font chacun l’objet dc la mesure de deux grandeurs physiques dont, les résultats sontnotés (5,: 7/,): % = 1,2, . . , m.

Les mcsurcs des grandeurs z et y sont CII realitt des variables aléatoires [ et rl dont une étudeprkalable a montré qu’elles vérifiaient les critères d’applicabilitk du schéma de régression si bienque 1’011 peut krire :

Y(z) = CL + b(z ~ 5”).

On appelle variante empirique ,25 la moyenne empirique des carrés des rksidus, soit :

a: b et s2 caractérisent cntièremcnt la régression étudikc.On considkrc un autre échantillon de taille n, différente ou non de VL, qui fournit mie autre

droite de r@ression :

Y’(x) = a’ + b’(z ~ z?$).

489

Page 468: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL LIE CALCUL NUMÉRIQUE APPLIQUÉ

à laquelle est associée la variante empirique .s”.Imaginons que les échantillons aient été prélevés à des époques différentes, mais que a et a’

d’une part puis b et b’ d’autre part soient grosso modo les mêmes (ce qui néccssitcrait une étudeen soi). On dksire savoir si au cours du temps on a bien affaire à la même population parenteou non. Autrement dit, est-ce que la diffkcncc entre les deux droites peut s’expliquer par lesfluctuations aléatoires des échantillons?

L’ktudc du rapport des variances empiriques v ’ = s2/s” qui obéit, à une loi que nous noteronsF(rn, TL) permet de répondre oui à la question dans le cas où :

Q étant lc seuil de signification usuel. On SC propose d’établir la loi dc distribution F(m:n)appel& loi de Fisher-Sncdccor.

1. - On désigne par <’ la variable :

la somrnc des carrés de m variables gaussicnnes indépendantes, de moyenne nulle et, d’écart. type0. En opkrant d’une fac;on tout à fait semblable à la méthode utilisée pour établir la loi du x2.donner la loi dc distribution dc E”.

2. - On désigne par v2 la variable :

la sornme des carrés de TZ variables gaussiennes indkpcndantes, (ind6pcndantes entre elles etégalernent des <?) de moyenne nulle et d’kart type CJ.

a - Écrire la loi de distribution de rj2.

b - Rappeler la dkmonstration du t,héorèrne concernant la distribution du rapport de deuxvariables aléatoires indépendantes o/ = ~/4. T et 4 ayant respectivement pour fonctions dedistribution ~I(T) et ~2(4).

E2c - Déduire la distribution du rapport des deux variables y = 2.rl

d - Calculer la moyenne de 2/ notée (y)

e - Calculer l’écart type de L/ note (ci”).

f - Préciser les degrks dt liberté 1 et k dans la loi F(I, k) en fonction de ‘WL et n. Justifier laréponse.

1g - Montrer que FI-,(k,I) = ~.

F,,(l, k)

490

Page 469: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

Quelques expressions utiles

18. Analyse de corrélation

18.1. Le coefFicient de corrélation. Schéma de corrélation

Il nous faut ici encore fabriquer un lot dc données que l’on se propose à la suite d’étudier. Lavariable II: est aléatoire à distribution gaussienne d’kart type CT. Dans ur1 prcmicr temps; oncalcule ime valeur z = (~5 + 0 après avoir tir6 z = <. 011 choisira les paramrtres comme onl’entend... À z on ajoute une variable gaussienrie 6 de moyenne nulle et d’écart t,ypc fl’. Il fautveiller à ce que 6 et < ne soient pas corrélées. Comment s’en assurer ou y parvenir‘!

Remplir un premier fichier de 50 à 100 couples dc donnks selon ce procCd6 CII choisissantCJ’ = a/lO.

Remplir un deuxième fichier de 50 à 100 couples de données en choisissant, (7’ = CT.Remplir ur1 troisi+me fichier de 50 à 100 couples de donrlérs ?II choisissant n’ = 100.Calculer chacun des t,rois coeflicients dc corrtlation T. Examiner ~vcntllc:llerrlerlt l’hypothèse

1’ = 0.Calculer l’intervalle de confiance associé à chacun des coefficients de corr6lation pour un seuil

dc signification donné 0.

18.2. La distribution gaussienne à deux dimensions. Coefficient de corrélation

On considerc une population parente sur laquelle on a préleve un Cchant,illon de taille 71 tr&grand devant, 1. Chaque individu est caractkrisé par deux grandeurs [ et rl qui sont des variablesaléatoires. On désigne par rn,c ct m,, les moyennes, par $ et fli les écarts quadratiqucs moyensrespectivement de < et rl.

a - On appelle x et TJ les variables centrées réduites associées à x et y. Donner les expressionsde 2 et y.

Une analyse appropriée a rnontré que la fonction de dist,ribution des va.riat>les :r ct 71 btait dela forme :

expression dans laquelle A, Q et ,3 sont dts paramètres.

b - a)(~, TJ) i:tant une densité de prohahilitk, exprimer A cn fonction des autres paramètres Qet /3. Pour effectuer lc calcul, on écrira que X2 ~ 2nzy + y2 = (2~ ~ ay)” + (1 - (Y’)?/‘. puis oneffectuera un changement de variables : attention au jacobien...

491

Page 470: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALGIJL NUMÉRIQUE APPLIQUÉ

c - Donner l’expression de la fonction de répartition des variables 5 et y notée 9(x! y). On saitque la repartition de la variable z est as(z) = 9( 2, w). Calculer la fonction de distribution dela variable 5.

d - Qucllc relation doivent satisfaire les coefficients Q et /3 pour que az(z) soit la loi normaleréduite. Montrer que, dans ces conditions, la fonction de distribution de la variable y notéeay suit aussi une loi normale rkluite.

e - Calculer Krry la covariance des variables z et I/, en déduire le coefficient dc corrélation ‘r,ry.Dans lc cas où u = 0; donner l’expression de a(~, 11) cn fonction de @,E(z) et @g(7/). Peut-ondkduire que la non-corrklation entraîne l’indépendance des variables II: et y? Argumcntcr.

f - Dans le cas on Q # 0, donner l’expression de la droite de régression de y en 2.

g - Calculer la fonction caractéristique de a(~, y).

18.3. Analyse de régression. Distribution de Student

Reprendre les fichiers fabriqués au cours des exercices 17.1 et 17.2.Calculer les coefficients dc la droite de régression y = ni: + 0 dans chacun des difkents cas.Estirner la prkision sur chacun des coefficients a pour un seuil dc signification donni: cy.Donner l‘intervalle de confiance concernant y pour UIC valeur donnke 20 dc la variable z dans

chacun des cas typiques.

18.4. Étude d’un changement de phase

L’étude d’un changement de phase permet d’effectuer la mesure d’une grandeur thcrmodyna-mique Y en fonction de la ternpératurc X. La représentation graphique dormCe par la figure H.6montre que les points expérimentaux se disposent selon deux scgmcnts de droite désignks parSI c t sz.

xc, X- Figure H.6. Étude d’un chengement de ph,nsr.

Expkrimentalement; on sait que l’incertitude sur chacune des mesures effectuées (Yk), qu’ils’agisse des points du segment SI ou des points du segment 5’2: correspond au même kart type(7. Les incertitudes constituent une variable aléatoire dont la moyenne est nulle. De plus, on

4 9 2

Michaël 2 Sévrain
Michaël 2 Sévrain
Page 471: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ETEXERCICES

admettra qu’il n’y a aucmle incertitude sur les valeurs (X,) du paramèke X. Une extrknitédc SI et une extrkmitk de Sz correspondent à la même abscisse X0 qui est, bien détcrmirkeexp~rimentalcment. On s’intércssc à, la transition au point X0, c’est-k-dire à la grandeur H =Y2 ~ Y1 où Y1 ct Y2 sont représentk sur la figure.

a - Sachant que le segment 5’1 est déterminé par NI mesures ct le segment & pa.r Nz mesures,indiquer de quelle manière on pourra estimer la grandeur H. On justifiera l’option retenue.

b - Estirner l’incertitude sur la dktermination de H, il s’agit bien sfir d’une dktcrminationstatistique.

c - Rkaliser l’organigrarnrne des opérations conduisant, au traitement correct, des dorm~csexpkrirnent alcs.

18.5. Mesure d’une température par spectroscopie

L’cnregistrernent d’une bande Clcctronique kmise par une molécule diatomique permet , dans lamesure OUI l’kqllilibre thermodynamique local est atteint, de dtterminer la ternpkrature de latlitcmolécule.

Lc principe est lc suivant : la bande est constit,uée dkne suite de raies dont on peut mesurerpour chacune la surface: laquelle est proportionriellc à l’intensitk relative 1.7 (~veiit,~iellemcr~taprks avoir tenu compte de la correction due à la fonction d’appareil), ct a,uxquellcs on peuta,ffectcr un nombre cnticr J appelé nombre quantique de rotat,ion.

Sans entrer dans les d&&, pour de nombreuses rnoléculcs diatomiqucs. la théorie permetd’et,ablir la relation suivante :

1.Jlog, ~

( 12Jfl+JJ;l)

OU 1 est l’intensité relative de la raie ,I (donnée expérimentale), A est une constante calcul&(donnée considérée comme rigoureuse), B est une constante calculée (donnk considérk commerigoureuse), T est la ternpératurc absolue que 1’011 cherche à Cwaluer.

a - Sachant que l’on dispose de N données cxpkimentalcs Ik, cornmcnt dkterrnincr T?

b - Quelle est la précision statistique de cette détermination?

c - Rkaliser l’organigramme des opérations décrivant, le traitement autornatique des donnksexpérimentales.

18.6. Solubilité du nitrate de sodium dans l’eau

Voici le tableau H.5 de résultats, obtenus par MendGev (1834 1907). donnant la solubilité ydans l’eau du nitrate dc sodiurn en fonction dc la ternpkrature T. soit y = f(T): les grandeursy et T étant exprimées en unités arbitraires.

Tableau H.5.

Y 66,7 7 1 76,3 80,6 85,7 92,9 99,4 113,6 125,lT 0 4 1 0 1 5 21 29 36 51 68

-..

493

Page 472: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M A N U E L D E C A L C U L N U M É R I Q U E A P P L I Q U É

Peut.-on approcher la loi de solubilité par 1me relation linCaire? On justifiera la réponse puis oncalculera les coefficients de la droite de régression de y en T: cocfficicnts obtenus par la méthodedes rnoindres carrés.

On désire connaître la solubiliti: pour la valeur T = 40 laquelle ne figure pas dans le tableau.Donner alors la valeur correspondante de la solubilitk ainsi que l’intervalle de confiance de cettedétermination pour 1111 niveau de confiance dc O;9.

On donne ml extrait de la table de Student :

to.os(7) = 1,895 t0.05(9) = 1,833 to,1(7) = 1,415 toJ(9) = 1,383.

19. Les fractions continues

19.1. Calcul d’une fonction donnée sous forme d’une fraction continue

On dit que la fonction ?I(X) est donnkc sous forme d‘une fkction continue lorsqu’elle s’écrit sousla forme :

Y(X) = Ao + ~

Al +

On SC propose de la calculer à l’ordre TL. Pour y parvenir, on forme une suite (l’approxirnatiorlsEL EL u, ,.,Qi'Qz'Q3'

, 2 qui sont respectivement à l’ordre 1, à l’ordre 2, . à l’ordre ~1,.

a - Au moyen d’ml raisonrlement par récurrence, démontrer les relations suivantes :

En+-I(Z) = A,,,P,,(~) + (x ~ ~~,-i)~m-i(~)

Q,rr+~(x) = AmQrn(z) + (ix ~ c~r,~)Qm-, (21) avec Pn = 1, PI = Au, Q,, = 0: QI = 1.

b - En supposant que f( ) , tII: es une fonction continue indéfiniment dkrivablc sur WI intervallecontenant II: et ~0, on SC propose d’étudier le développcmcnt de la fonction f(z) au voisinage dela valeur Q de la variable CC qui est de la forme suivante :

Donner les valeurs de Ao et de Al en fonction de f(z) et de ses dérivées

k+l ~ k-lc - On montre que les Ak obéissent à la relation de récurrence ~ ~A&i- 1 n,., + 2. Donner

la valeur de As en fonct,ion des coefficients ck = &.f(k)(~O) avec k = 0: 1,2,.

d - Donner le développcmcnt de log,, (1 + X) en fraction continue, puis calculer numériquementla valeur dc log,, (2).

494

Page 473: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE H. PROBLÈMES ET EXERCICES

e - Rappeler le développement de log, (1 + z) en skie de MacLaurin, puis calculer mnnkrique-ment la valeur de log,(2) en retenant les quatre premiers termes.

f - Estimer l’erreur entachant les résultats obtenus aux $ d et e. Expliquer pourquoi ledkvelopperncnt en fractions continues présente un avantage sur le d&cloppemcnt en skie deMacLaurin.

20. Éléments de traitement du signal

20.1. Détermination d’une constante de temps

On dksire réaliser l’ét,ude expérimentale de la décharge d’ur1 condensateur C à travers unerésistance R. Pour cela on mesure la tension V; aux bornes du condensateur à des temps t,. Lesrésultats obtenus sont prkentés dans le tablrau H.6.

Tableau H.6.

t (SI 0 1 2 3 4 5 6 7 8 9 1 0v (volt) 100 7 5 55 40 30 20 1 5 1 0 1 0 5 5

On SC propost d’étudier ces dormécs selon deux approches diffkrcntes. rnais avant dc passeraux applications numériques, on établira des relations générales obtenues en considérant que :

1. les données sont numkotées de 0 à N:2. les t,cmps ti sont en progression arithmétique de raison At.

Rappeler l’expression analytique de la tension V en fonction du temps t.

Approche no 1 - Montrer qu’au moyen d’une transformation convenable, on peut se ramenerà un problème linéaire dont on dktermincra les constantes au moyen dc la rnéthodc des moindrescarrks. On dCsigne par a l’inverse dc la constante de temps. Donner la valeur nurrkrique de aainsi qur l’intervalle de confiance & da dCfini de telle sorte qu’il y ait 70 chances sur 100 que lerésultat réel tornbc à l’intkricur de cet int,ervallc.

Approche no 2 - On recherche V(t) sous la forme suivante :

V(t) = A + B exp(b . t),

et l’on se propose d’obtenir A, B et, b par la rrkthode des moindres carrés. Pour se faire, onpose :

‘1L = exp(b . At)

e t p, = exp(D t2) = exp[b(to + iAt)].

Donner l’expression de V, en fonction dc A et pi, puis celles de y,+, , V,+, . cn fonction deA, p.7 et U.

Si l’on note AV, = yy+, - Vj, donner alors les expressions de AV,, Ay,+ etc.Éliminer pk entre deux AV, conskutifs et donner l’kluation qui les lie. Combien obt,iendra-t,-

on de ces kquations? On désignera par K cc nombre. Résoudre ce systCme de K kquations à, une

4 9 5

Page 474: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCIJL NUMÉRIQTJE APPLIQUÉ

inconnue par la mbthode des moindres carres et en dkduire la valeur dc 0. Donner l’expressionde l’erreur yuadratiqur correspondante EU.

Il reste à dCterminer A et B. Montrer comment les obtenir pa.r la. m6thodc des moindrescarrés: donner leurs expressions ainsi que l’écart quadratiyuc correspondant Ez,.

Calculer numériquement les valeurs dc A, B et b.Que concluez-vous quant à l’utilisation de ces deux méthodes?Puisque les valeurs de u et h sont difkentes, donner l’intcrvallc de confiance minimum Au

permettant d’encadrer la valeur b. Donner alors la prohahilitk dc tomber dans lhtcrvallc ainsidéfini.

496

Page 475: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

1 Corrigés des problèmeset exercices

1. Généralités sur le calcul numérique

1.1. Calcul du nombre d’or

La suite U,, est formée de termes strictement positifs pour 12 > 0. La suite k,, est evidcmmentminorée par 0, il suffit dc mont,rer qu’elle admet une limite supérieure, pour cela: il suffit dcremarquer que U,, = U,,-r + UTLPz et d’écrire la relat,ion de définition de k,, :

k:,,,x3L++5zE1+p.G-1 n 1 un-1 v. 1

Le dernier terme est plus petit que 2 car la suite U, est strictement eroissantc ct, positive; onen conclut que k, est compris entre 0 et 2 quel que soit n > 2 ct que la suite k,, admet doncimc limite.

D&@ons par y cette limite: on écrit alors : Un+1 - U,, - UTzpl = 0 et, l’on divise chaque termepar U,-r qui est différent de zéro pour n > 2. On obtient donc :

Quand n tend vers l’infini la dernière équation devient : y2 - y - 1 = 0; dont, la racine positiveest :

1+2/5Y= 2~ = 1,618033989.. .

Sur le plan du calcul numérique de y au moyen de la suite dc Fibonacci, OII remarque quek,, est lc rapport dc deux entiers Un et UTL-l lesquels admett,cnt une représentation sans crrcur(pourvu qu’ils possèdent, moins de 16 chiffres significatifs en notation décimale si l‘on envisagel’usage du langage C en double précision). La seule erreur sur k,, est donc l’erreur liée a ladivision. Si l’on sc ramène à l’erreur relative, il sera inutile de poursuivre les calculs apri:s quedeux valeurs consécutives de k, seront égales a la précision relative E, donnée par la machine(et le langage utilise) ; cela se traduit par l’Égalité :

Page 476: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL IIE CALCUL NTJMÉRIQUE APPLIQUÉ

Cette condition donne l’erreur relative la plus petite sur le calcul de y. mais le procédé estcoûteux en temps de calcul. Le calcul direct de y donne par la résolution de l‘équation dudeuxieme degré fournit une erreur relative plus grande : il faut tenir compte de l’erreur sur laracine cari& puis de l’erreur sur la soustraction suivie de l’erreur sur la division...

Remarque : Sur le plan de la programmation, il ne faut pas réserver un tableau pour la variableindicée k,,, seules deux valeurs consécutives sont nCcessaircs et suflisantes, et l’on fera 1111 dkalagechaque fois que l’on calculera une nouvelle valeur. D’ailleurs, o11 nc connaît pas la taille de cctableau.

1.2. Les polynômes de Tchebycheff

Posons 1~ = arccos( puis écrivons la relation de définition pour TrLpi (XT) et T,,+i (x) :

T,,+l(x) = COS[(~ - l)y] = cos(ny) cas(y) + sin(ny) sin(v)

TT1+l(x) = cos[(n + l)y] = cos(ny) Cos(y) - sin(ny) siri

additionnons ces deux relations :

T,,,l(Z) + TTLpl(X) = 2cos(ny) COS(Y)

enfin retournons aux anciennes variables en remarquant que 2 = COS(~/); soit :

C’est donc une relation de récurrence entre trois polynômes consécutifs. Pour l’utiliser, il suffitdc connaître les deux prerniers polynômes T~(X) et T~(Z) à savoir :

T”(Z) = COS(O) = 1,

e t T~(Z) = cos[arccos(z)] = z

Ici encore, il ne faut pas utiliser de tableaux sauf si l’on désire effectuer IIIE représentationgraphique dc ces polynômes.

Il existe une source de difficultés qui va affecter la precision : le second membre de la relation derecurrence est une différence, il s’ensuit que, si les deux termes sont sensiblement les rnêrnes, uneerreur importante pourra surgir et qui se propagera au cours des calculs. Il est donc intéressantde comparer les résultats obtenus avec l’utilisation directe de la fonction arccos en cherchantà rnettre en défaut l’algorithme. Il s’agit de faire ses gamrnes...

1.3. Calcul des fréquences de la gamme naturelle et de la gamme tempérée

Une des façons de fonder la garnme naturelle consiste à calculer les fréquences au moyen desquintes qui se situent sept demi-tons majeurs au-dessus de la note précedcnte : le rapport desfréquences est trois sur deux. Ce processus permet de déterminer les dicses. Pour ce qui concerneles bemols, ils sont déterminés par les quintes qui se situent sept demi-tons majeurs au-dessousde la note précédente, les fréquences sont dans le rapport deux sur trois. Une manière sirnpled’opérer consiste à ecrire les douze demi-tons de la gamme puis à les calculer successivement.Si la fréquence d’une note sort de la gamme à detcrminer, on la divise par deux s’il s’agit desdièses ou on la multiplie par deux s’il s’agit des bémols. Cornmençons à partir du la3 (440 Hz)par définir les dièses.

4 9 8

Page 477: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

La quinte du IIL est la note mi dont, la fréquence est 440 x 3/2 = 660 Hz. On note que 660 Hzse situe bien dans l’intervalle (440 Hz, 880 Hz). Calculons à présent la frequence de la quintedc la note mi, il s’agit dc la note sa : 660 x 3/2 = 990 Hz, cette fréquence n’appartient pas aubon intervalle puisqu’cllc est supérieure à 880 Hz, c’est l’octave de la note dont on cherche lafréquence. Il suffit de diviser par deux la valeur de la fréquence pour se rarncncr dans le bonintervalle, soit 495 Hz. En poursuivant ainsi, on trouve les notes et les fréquences présentéesdans le tableau 1.1.

T a b l e a u 1.1.

440 Hz ré+ 626,48 Hz660 Hz l(L# 469,86 Hz495 Hz fa 704,79 Hz742,5 Hz do 528,59 Hz556,88 Hz SO1 792,89 Hz835,31 Hz r é 594,67 Hz

En poursuivant ainsi, on calculerait les doubles dikes. Maintenant, calculons les notes quivont éventuellement être affectkcs d’un bémol (cf. Tab. 1.2).

Tableau 1.2.

la 440 Hz mat, 618,05 Hzr é 586,66 H z ht, 412,03 H zSO1 782,22 Hz 6 549,38 Hz

.y: 521,48 695,31 Hz Hz SOlb si 488,34 732,51 Hz HzSir, 463,54 Hz mi 651.12 Hz

En contimmnt de la sorte, on peut d&nir les doubles bémols. Quoi qu’il en soit on voitaisCment que les diffk-entes tonalités ne poss&lent pas les mêmes notes, ou plus exactement,les mêmes notes ne possèdent pas les mêmes fréquences. Autrement dit, une fois l’instrurnentaccordé dans une tonalité, il n’est pas possible d’en sortir (modulation) sans avoir le sentimentque l’instrument joue faux. La gamme naturelle propose un do# à 557 Hz et un r.éb à 549 Hz.La gamme tempérée, due à J.S. Bach (1685 1750), propose d’accorder la rnêrne frkquence à cesdeux notes. Autrement dit, l’intervalle d’octave sera divisé cn douze dem-tons d’égale valeurdans une échelle logarithmique.

Donc le rapport du logarithme des fréquences de deux notes consécutives, séparées alors parun demi-ton, est une constante quelle que soit la fréquence initiale dc la gamme rctcmle, elle vaut(1/12) log,(2) = 0,057 762. On établit très facilement la table de la gamme ternpérk (~5 Tab. 1.3,page suivante).

On note que le do# et rkt, ont la même fréquence de 554 Hz qui est intermédiaire entre lesdeux précédentes valeurs. Pour terrniner, disons qu’il existe bien d’autres gammes et de façonsde les concevoir et que l’accord d’un piano se rapproche de la gamme tempkrk mais en diffèrepar dc petites mlances qui donnent du relief, du volume, de la profondeur k l’instrument.

4 9 9

Page 478: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANIJEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Tableau 1.3.

440,OO H z771%466.16 Hz mi # o u fa493,88 Hz fa]+ ou SOlb523,25 Hz SO1

554 37587133

H7 J sol~/r 011 lU(,

Hz la622,25 Hz

659 25 Hz698146 Hz739,99 Hz783,99 Hz830.61 Hz880,OO Hz

1.4. Calcul de la constante d’Euler (1707-1783)

Avec mie machine qui cffcctue les calculs avec une précision relative de 10-q. on obtient, laprécision optimale lorsque deux valeurs consécutives de la suite des ~k seront égales à la prkisiondc la représentation. soit :

En admettant que yk soit minore par 1/2, on obtient l’équation transcendante qui donne k enfonction de y c’est-à-dire :

1 Ic+1~ - loge 7k+1 ( )l c=z 2 10-9

Sachant que k est t,res grand devant l’unité, on peut se livrer aux approximations commodes :

il s’ensuit :

de là on tire une valeur approchee dc k FX J1/2 109/“. En utilisant mie représentation de16 chiffres significatifs, il faut calculer environ dix millions dc termes ce qui est évidemmentprohibitif s’il existe d’autres méthodes. Estimons néanmoins l’erreur risquant d’affecter lerksultat, dans le cas le plus pessimiste évidemment. Écrivons la relation de rkcurrence entredeux valeurs conskutives de -yk :

1%+1 = yhY + ~

k+1kS1

- log,, 7( 1il faut rkaliser à peu près 2k a.dditions (soustractions) qui introduisent une crrcur absolue del’ordre de 2.10-” dans le pire des cas. On ne pourra donc compter que sur 7 ehiffrcs significatifsaprès tant de calculs...

Il n’y a pas de difficulti: majeure à programmer la relation faisant intervenir les nombresdc Bernoulli, il s’agit d’un dévcloppcment asymptotiquc qui est divcrgcnt mais qui donne

500

Page 479: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERC~~ES

d’excellents résultats si l’on tronque habilcmcnt la série. Lorsque l’on rkglige les termes aprèsle rang IL, on commet sur -y wic erreur strictement mathématique inférieure à 2B,,/(2p~rn2~“).

Fixons m 2 la valeur 100 par exemple et regardons quelle doit etre la valeur de p pour obtenirla meilleure prkcision rnathématiquc. R.aisormons encore sur les erreurs absolues nous pouvonsécrire :

Il n‘y a pas d’autre solution que d’effectuer une tabulation pour p = 1,2.3, Rkalisons cetteopi‘ration pour /L = 4 et 5, on obtient rcspcctivement pour le membre de droite :

11OK”

5120 100s cz e t 660 l()()lO = 10-22.

En conclusion; CII choisissant m = 4; l’erreur de troncature strictement mathkmatique estinfkrieure à la précision usuelle de 10V1”. Il convient d’kvaluer les erreurs liées à. l‘exkution descalculs, elles seront majorCes par 4mlOVl’ avec m = 100. autrement dit on aura rnieux que13 chiffres significatifs.

1.5. Calcul numérique des dérivées d’un polynôme à coefbcients réels pour la valeur x = r

a - Le schéma de Horner (1786 1837) est un algorithrne qui permet de calculer la valeur d’unpolynôme au moyen d’un nombre minimum d’opérations en utilisant un système de parenthkscs :

,IPr?,(x) = CU& =

k=O{. . [{ [(a02 + Ul)X + aa]z + u:3}x + u,] II” + . . }x + arr

Pour z = T, on calcule donc la suite :

vo = ao?Il = ‘Uo7’ + (11va = l!lr + CL2. . . . . .lik+l = IlkT + C&+l. . . . . .VT7 = Y,,-l7- + CI,, = P, (7”)

b - On écrit la suite des polynômes :

PT,(X) = (x ~ .)P,,-r(x) + R,p,,-r(x) = (x ~ 7-)Pc2(z) + RT,-1

ii-,$j’- (x ~ r)~rl-,-l(21) + R,-,. . . . . .fi(x) = (.x - ~)I’“(X) + RI.

On krit P”(x) = R. car P ( ) ‘.t0 x C,s I une simple constante.

C - Le polynôme prend la forme :

PTT(x) = (x - T)“R~I + (x - r)“-lR1 + t.. + (x ~ T)‘~-“R~, + . . + (CE - r)R,,p, + R,,

501

Page 480: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCIJL NUMÉRIQUE APPLIQUÉ

d - On écrit lc développement en sbric de Taylor :

cxprrssion dans laquelle on a rrmplact: h par (x - 1.). Par identification avec l’expression du $ c,on obtient :

e - Pour calculer effectivement les Rk:, il sufit, d’appliquer le schéma de Horner aux coefficientsde P,,(x) puis à ceux de Pr,-I(:L) et ainsi de suite jusqu’à celui de Pu(x) = Ro. Désignons parh, les coeficients de PyLpl(x) ; on les calcule en fonction des CL~ de la façon suivante :

bo

bl. . . . . . . . . .

ht = uk + bkplr. . . . . . . . . .

RTL = un, + b+17.)

on poursuit les mêmes calculs pour le polynôrne P+z(x) cn notant toutefois que l’on perd u11erangée. Ensuite on opère dc la même manière pour PTL-s(z) et ainsi de suite jusqu’à l’ohtcntionde Ru.

1.6. Calcul numérique de la fonction c de Riemann

a - On a : 1 = SIX 5 dn: et deux cas se présentent selon que s = 1 ou s # 1 :

si s = 1 on obtient 1 = [log,(x)]F qui diverge,

et si s # 1 on obtient 1 = [- 1x ~1~~ cette expression est finit

1si s > 1 et alors on a : 1 = ~

S - l

b - L’erreur ek: est comprise cntrc skm & dz et ,fkyl F’ dz, on cn dkduit alors les inégalitéssuivantes :

ce qui s’kcrit encore :

1&(s) + ~ .

1s - 1 (k + l),-1 < <(,y) < G(s) + ,‘1 &y

502

Page 481: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

Prenons 1111 exemple : ((2) = g(= 1,644934): on calcule alors Sl00(2) = 1,634 983 903 puis ondkduit que :

1.634983 + & <C(2) < 1,634983 + &>soit encore : 1,644 88 <c(2) < 1,644 98.

Il existe deux programmes dzeta0. c et dzetal . c qui réalisent ces algorithmes.

1.7. Recherche d’une tangente commune à deux courbes

a - On a yf = f(zf) et ,j(~,f) - yo ~ (of ~ zo)f’(z,f) = 0 p our la prcmi@re courhc ct pour laseconde : yy = ,q(xg) et Y ~ yo - (J.~ ~ XO)~‘(:Z~~) = 0.

En général il faut rechercher la racine d’équations transcendantes (voire implicites) quidonnent Xf et XT1 puis on calcule yf et y,. Pour cela, on utilise mie des mCthodes itkrativesproposées dans le cours.

b - Passant par le point A, il existe cn gbéral deux tangentes à la courbe CI ct à la courbeCz. Il faut donc choisir la tangente la plus pctitc cri module.

c - On désigne par Al un point de la droite z = .ro dont l’ordonnée est, supbricurc au plusgrand des deux extremums de CI et Cz, et par AZ mi point de la droite z = ~0 dont l’ordonnéeest infkieure au plus petit des deux extremums de Cl et C,.

011 considCre la fonction Q = Yf ~ ~Y, ~ Y0

menées de A aux deux courbes..Xf - 20 xg ~ 50

qui est la diffkrence des pentes des tangentes

Quand A parcourt le segment A1Az la fonction Q ni: s’annulequ’une seule fois, et c’est pour cette valeur prbcisément que l’on obtient la tangente communeaux deux courbes. La dichotomie, par exemple, peut nous permettre d’obtenir cette valeur deyo. On examine le signe de cette fonction en Al puis en (Al + AZ)/2 ct ainsi de suite. Si lalongueur A1Az est de l’ordre de quelques unités, alors en une cinquantaine dc tours d’itkrationnous aurons obtenu la valeur de yo par où passe la tangente commune avec WC précision dr,l’ordre de 10pl’.

À condition que les fonctions f(x) et g( )n: soit calculables dc façon semblable, pour avoir deserreurs semblables sur les calculs dc z f et ICI, et une bonne précision sur la fonction @, il fautchoisir x0 approximativement au milieu de l’intervalle (of, :rg).

d - Dans le cas de fonctions implicites, on a Q’(zf. y,f) = 0. La tangente à CI s’écrit :

dyd’ofI: -‘$!Ldz

pour .T = Xf et y = yfY

Yf - Y0On écrit encore : ~ %Zf - 2 n

= -F pour z = of et y = yf. Donc, pour connaître les valeurs :xz.~

et yf, il faut résoudre le système &n linéaire de deux Cquations à deux inconnues par une desméthodes itératives proposées dans lc cours. On opère de la môme façon pour l’autjrc tangentepour laquelle on écrit :

503

Page 482: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

ct :

On regle le probkme du point A de la rnkne rnani&e qu’au paragraphe précédentOn fournit, lc prograrnmc tangent. c concernant cette prockdure.

2. Algorithmes accélérateurs

(Voir le cours chapitre 2)

3. Les développements asymptotiques

3.1. Développement asymptotique

Une prernikre intégration par parties donne :

En poursuivant ainsi les calculs on trouve :

x

,f(x) = k - LJ + $ - ; +. . + (-l)TQ& + (-l)""(n + l)! tFp2 exp(n: - t) dt..x .r

.,

Cett,e skric diverge quand n. tend vers l’infini puisque le terme gkkral devient infini quel quesoit 2. Calcul de l’crrcur Erg lorsque l’on tronque la sPric après le terme d’ordre n + 1 :

E,(Z) = (n + l)!.I

t-‘Lp2 exp(z - t) dt

mais @tant donni: que exp(rc - t) < 1 car z > 0 et t > .z on peut écrire l’inégalitjk :

et pour 71. fixé, ou voit que l’erreur tend vers z6ro quand z croît indéfiniment.

La fonction (p(n) =71!

71+1 est une fonction stricterncnt, positive quels que soient n et 5 : pourIII” 1

l’étudier, il est comrnodc de lui associer la fonction @(n) = log,. [Ci] :

44171) = nlog,(n) ~ r1 - (n + 1) logr(z)

dont la dkivke s’écrit, ainsi :

F = log,(n,) - loge(z).

504

Page 483: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLEMES ET EXERCICES

elle 5 im minimum pour n = N = 2 ; cela signifie que la fonction cp(n) a aussi un minimum. Onva voir que c‘est le même minimum. Pour II” fixé, l‘crrcur sera minimum pour urlc valeur de TL()qui est approximativement dom& par l’égalité :

soit encore :

N! (N + l)!&V+I ,p+2

ce qui donne no = x ~ 1. Ce résultat n’est pas CII contradiction avec ce qui prk?de, en effet xest mie variable rkelle tandis que ré est une variable entière. On aurait rnasqui: cette remarqueen krivant l’itgalité E,,l-l (.z) = EIL,,(x) car OII aurait, trouvk 120 = .r. On aurait tout aussibien pu hirr E,(,-1(2) = Eng+l(z) qUI aurait donné encore un résult,at kgèrement diffkrcnt :cL=JmTL() r~() + 1 qui a une racine approchée dc l’ordre de TL() = z ou 7~0 + 1 = 2.

a - Application de Iépsilon-algorithme - Le dkveloppcment asymptotique étant u11 pI’cJhIl-

gcment analytique, on peut s’attendre à ce que la convergence se rktlise même si la conditionprécédente n’est pas vérifiée. Dans la rnesurc dc la << calculabilitC effective » : 011 doit, trouver desrkultats corrects aussi bien pour des pctit,es valeurs dc .z que pour dc grandes valeurs dc n.C’est ce que nous avons vérifik.

b - Cas de /a fonction erreur - Pour ce qui concerne la fonction :

cerf(z) = 1 - 0(z) = 5 /exp(-t’) dt.

.I

011 effectue une suite d’intégration par parties ct l’on obtient :

cerf(z) = 1 ~ Q(z) =exp( -z”)

i

1 . 31-b+--

1.3.5~~ 22&

-+...‘p,Tfi

+ (-l)+’1.3.5...(2n-3) +,,,

y-ln/2rr-21

_

4. Résolution des équations numériques

4.1. Voir le cours

4.2. Voir le cours

4.3. Calcul de la fonction arctan

Comme 20 ~ arctan(z0) = 0, on peut, ajouter cette quantité à, l’équation 2 = arctan( soit :z = arctan + 50 - arctan ou encore : z ~ 20 = arctan ~ arctan expression que l’ontransforme ainsi :

arctan[tan(z - x0)] = z - 20 = arctan ~ arctan

505

Page 484: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

M~NTIEL DE CALCUI, NUMÉRIQUE APPLIQUÉ

puis en &veloppant l’expression de tan(n: - IC”), soit :

d’où :

tan(z ~ 50) =tan(z) ~ tan(q))

1 + tan(z) tari

arctan[

a ~ tan(q)1 + n tari 1 = Ic - “’

puisque l’on connaît, a, = tan(z).Cette dernière expression peut s’krirc forrnellernent :

z = 20 + arctan[F(q)] = ~0 + arctan(

On dheloppe la, fonction arctan, on obtient :

le rayon dc convcrgerice est IFo / < 1.

On se propose de calculer arctan avec .Q = 0,8. Donc :

= -0.283661987,

ce qui perrntt, de calculer la valeur numérique de

entachée dbne erreur absolue de 2 1OF qui est lc prcrnicr terrrie abandonni: de la skie alternéefournit par le développ~:mcnt,.

4.4. Racine d’une équation f(x) = 0

a - L‘kquation de la tangente en Ao s’krit : y = f(zo) + (X - q~),~‘(zq). L’k~uation de la droiteorthogonale à cct,te higente et passant par BU s’écrit : y = -(x ~ zo)/f’(zo), on en déduit lacoordorin6e du point d’intcrscct,iori :

À partir de :1*1 on peut, calculer 22 et a,insi de suite, d’une faqon générale on aura :

506

Page 485: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXER.CICHS

b - on a e,, = X ~ z,, il s’ensuit que cc,)+1 = Q(X ~ e,, ) expression que l’on va développer ensérit de Taylor au deuxième ordre :

et comme Q>(X) = X, on obtient au premier ordre :

d@CE,+1 = x - e,, -.

ch

soit encore :

Pour que ce processus it&atif fonctionne, il faut que les extremums relatifs dans A n’existent,que sur la frontike de A, ct, f(x) doit, d ont être monotone dans A. En outre, il faut que f(:r)soit continue dans A et qu’elle n’ait pas de tangente verticale (on dit qu’tlle est lipschitziennc).

c - Calculons k = $. En rappelant que f(X) = 0 (ou B(X) = X), a près quelques calculs on

1trouve : k = ~

1+ y2ce qui rnontre que k est toujours plus pct,it que 1 ct donc que le processus

est tolljours convergent à condition de ne pas sortir du domaine A.

d - Ce processus est un processus du premier ordre. tt). du point, de viic dv la vitesse deconvergence, il est moins rapide que la méthode de Newton qui est, un processus du deuxièmeordre. En revanche, au voisinage d’une tangente horizontalc, la mbthode dc Newton devientinstable cn rejetant très loin la valeur numérique de la suite des .z,). La m6t,hode proposée ncprésente pas ce dCfaut en offrant une grande stabilité, cependant si l’on utilise cette mbthode cnparticulier, il faudra plus que ,jamais terminer lc programme par le calcul dc .f(:~,?) ct vérifier qu(’cette valeur est suffisamment pro& de zéro. En effet: en examinant la formule tic rkurrenccque nous avons ktablic, on peut s’apercevoir que çctte expression permet aussi de calculer leszi:ros de la dérivée f’(x) . . .

4.5. Racines d’un polynôme à coefficients complexes

11 s’agit là d’un exercice très proche de la méthode de IJairst,ow. On kcrit :

Pn(Z) = (fio + jao)ZrL + (01 + JB)z”-’ + (a2 + jpz)Zn-2 + ‘. + (a, + j/$>)

= o~(z)Qw~(z) + (a + jQ) = [z - (p + ja)](yj + ~s,,)z’~-’ + (rl + jh,)~~

+ (y2 + js&P3 + + (rn-* + js,-1) + (Q + .jq).

L’identification des terrnes tst immédiate, on obtient :

507

Page 486: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCTJL NUMÉRIQTJE APPLIQUÉ

Bien cntcndu, comme dans la méthode de Bairstow, Q et !P sont des fonctions dc p ct 0; et,nous voulons obtenir p et cT tels que :

@(~,a) = 0 et, Q(p,a) = 0.

Connaissant une prcmikc approximation p. et CT() on va chercher ü calculer h ct 1 C I Idéveloppant Q et Q au premier ordre :

La résolution du système linCaire donne h et 1 :

ces valeurs %ant, toutes calculées pour p = po et <T = (ru.Le problknc consiste donc à obtenir : a7 9: 3, g, g et g. Il reste à, calculer les dérivées ;

OII calcule enscmblc les dérivées par rapport à p puis les dérivées par rapport 2 (7. On a donc :

On pose :

cc qui permet d’écrire :

avec to = -yo ct 210 = 60. Ces relations aboutissent à :

Dc la rnême manière, on calcule les dbivks partielles par rapport A c :

Page 487: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

cc qui permet d’krire :

En partant de p = pu et CJ = (~0, on va calculer la racine 20. Une fois wt,te racine comme onest cn mcsurc de calculer les coefficients du polynôme Qr,-l (z) 1 ,uis d’en calculer urlc racine.On aboutira à, la fin du calcul au produit dc dcllx monômes dont on calculera 1~:s racines.Attention au calcul de la dernière racine car le dernier monôme se prhcntc dc la fac;on suivante :(Y0 + .Y&))~ + (71 + 55).

4.6. Résolution d’un système non linéaire

a - On peut tou.jours tcrire ce système sous la forme :

x 1> = @,(x1, x2, z:~; . ,x,) avec: p = 1,2> 3,. . , n.

pour cela il suffit d’ajouter zp dans chaque membre de l’équation :

F,(Zl, x2,2:3;. . )X7,) + xp = x1> = ~p(z~,:~2, x3,. . ,x,) avec q=l.2,3 . . . . .‘II.

b - Oil a les équations :

x(k) ~ Q>P

xw) (k-1) (k-1)~ p 1 7.33 ,.x3(

(k-l),...rxn > .

dont, la solution exacte notée avec une étoile s’écrit :

.xp* = QI, (XT, x;, xi, . ) x;)) = Q>,(xy) + El, xp + <a, 2$’ + tf:<, . . > x(f) + &,

>Le dhcloppcment au premier ordre des fonctions ap conduit au rksultat suivant :

,l.xp = ap (

(k) (k) (k)x1 > .x2 ) xtj ) . . ) xi,? +> c.f=l

tj2 = ,:+11+ -p<j!s,j=i 3x.j

(k+l)&, est l’erreur sur xp au tour k tandis que :x; - x2-’ est l’erreur au tour k + 1. Dksignons cette

erreur au tour k par ep:‘. Nous avons la relation entre les erreurs :

que nous pouvons écrire en fonction dc la matrice jacobienne :

j++l) = AI@)E(“),

Il faut faire attent,ion au fait que les matrices A&(“) voient leurs valeurs changer au cours descalculs. Cependant lc processus sera convergent si toutes les matrices Mk) ont tous les modulesde leurs valeurs propres inférieurs à 1. Il n’est pas aisé de réaliser ccttc condition.

Pour améliorer la vitesse de convergence, on peut ut,iliser l’cpsilon-algorithme vectoriel quandbien même la suite des vecteurs Eck) divergerait.

509

Page 488: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUILIÉRIQUE APPLIQUÉ

4.7. Résolution d’un système non linéaire

a - Si (X, Y) est solution du système :

f(x, y) = 0 e t ,y(~: y) = 0,

il l’est 6galement de la forme yuadratiyuc :

@(x, Y) = f2(x, ?/) + .92(x, Y)

car on a f(X,Y) = 0 et par conséquent f2(X, Y) = 0 ct d c mCme pour la fonction g. Unerernaryue s’impose si (X, Y) annule @(z, y). (X, Y) n’est pas obligatoircmcnt solution du systèmeprimitif, car CD’(z, y) = 2ff’ + 2.99’ et ceci rnontre que l’on peut avoir d’autres racines que f = 0et g = 0 et yuatrc combinaisons sont possibles avec les dérivées. Il faudra donc bien vérifier cepoint cn reportant lc couple (X, Y) dans les équations de départ.

b - Partant d’une approxirnation (20, yo) on va chcrchcr d’abord 5, arnéliorer la valeur de IL: etl’on écrit :

On cherche le minimum en krivant que g = 0 ; cette relation impose que :

d’où la valeur de < :

par ailleurs, on peutde < :

toujours effectuer un calcul direct des quantités figurant dans l’expression

aa‘

-=2fg+zg$dX

d2Q>et (y22-=2,~+2,~+2[gf]‘+2[g$

On sait donc calculer 21 = x0 + <

c - Rien de fondamental n’est changé et il suffit de remplacer J: par y et < par q dans leséquations :

LB

avec :

On sait donc calculer y1 = y0 + q.

510

Page 489: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLEMES ET EXERCICES

d - On recommence l’ensemble des opérations avec les nouvelles valeurs 51 et ‘yr qui sesubst,ituent aux valeurs 20 et c/o. On calcule d’abord 52 puis yJ> mais rien n’ernp&zhr de fairel’invcrsc. On poursuit les calculs jusqu’à obtention de la précision pcrrnisc par la machine sansomcttrc dc rCintroduire les dernières valeurs dans les Cyuations primitives.

4.8. Ordre d’un processus itératif

La rrkthodc dite par it,érations fonctiormc dircctcrncnt sur le scli~ma propos6 : zk+r = Q(zk).La rnéthode de Newton est un peu moins directe : ~l”k+~ = zk ~ (a(z,)/(a’(z,) = 9(zk) rnais leschkrra fonctionnel s’applique sur la fonction Q(zk) a.ssociée.

On écrit e,,+r = X ~ .zn+r = X ~ f(zrl). Il convient de faire disparaître z,, de cette relationpour répondre à la question posée en notant que 2,, = X ~ eTL ; ainsi on écrit :

En développant f (, .)L au voisinage de la racine X, on obtient alors :

l’expression se simplifie en remarquant que f(X) = X3 soit encore :

e d.f e;? d2f en d:jf“““=+~.~-~-gy+jg$

ek d”f+ . + (-1)k+12& . * + (pour zc = X),

qui est bien un polynôme en e, dont les coefficients sont :

df 1 d2f 1 d"f-dz '=-! dz2 Y = $j dz"~ p o u r 2 =X.

1. Application à la méthode de Newton

a - On a C~?(Z) = 0 et f(z) = 5 - [Q(z)/@‘(z)] et, 1 ‘on calcule les cocflicients Q, p ct, -y.

qp - <P@i”Qz-

w2+l=?E

w2pour 32 =X, donc (1 = 0 car <D(X) = 0.

1 a”= -gF p o u r z =X.

D’où l’expression de l’erreur :

b - L’application sera contract,ante si

511

Page 490: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2. Généralisation de la méthode de Newton - On a :

f(x) = :1: -g(zpD(z)

g(z)W(z) + Il(~)@(X)

Après quelques calculs qu’il convient dc mcncr aw: soin7 on ohtierd les rkdtats suivants :

(if(rx-=O(1X

px-$.J!& -i ($+:) p o u r x=X.

Le prwessus sera du troisihe ordre en choisissant les fonctions h et, g dc tcllc sorte que lecoefficierlt b soit anridé, c’est-à-dire lorsqw @‘/a’ = -2h/g.

4.9. Résolution d’un système de deux équations à deux inconnues.Méthode de Kacmarz (1937)

1. a - Les coordonnées du point AI(X~~ y1) sont donnhs par les 6quations :

al(yl - yo) - b,(x1 - 2”) = 0 e t UlZl + blyl + Cl = 0

dont la rk3oliition donne :

6 - Par le même prockk, on obtient les coordormées de A~(Q, ~2) :

a2R2

2. - On linéarise les équations comme il a été montré dans lc cours. on krit, :

f(xo + h, y0 + b) = f(Z”, y”) + lLg + lg = cl

d”0 + h; y0 + b) = g(q), :y”) + h$ + i- = 0?J

et par identification 011 obtient :

De même que ulzg +blyo+cl # 0 si le point (x0, yo) n’est pas la racine? de même f(~, yo) # 0si le point (20, y”) n’est pas la racine. On continue de désigner par RI la valeur de f(xo, yo) :Rl = f(zo,yo). R:ien n’est changé pour l’indice 2. On a les relations :

512

Page 491: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIG& DES PROBLÈMES ET EXFXCICES

Exemple

f(x, y) = x2 + 4;~” ~ 36 = 0g(x, ?/) = x2 + yy2 - 12~ + 27 = 0

On calcule aisément :

8.fbl = - = 8?J

?Y

5. Éléments de calcul matriciel

5.1. Voir le cours p. 70

5.2. Voir le cours p. 378

5.3. Résolution d’un système linéaire volumineux

La matrice Al possède 11 lignes et kl colomws, la matrice A2 possède II lignes et N - kl colonnes,la matrice A:i possède N - II lignes et kl colonnes et enfin la matrice A,$ possède N - bl lignesct N ~ kl colonnes. Les vecteurs X1 et BI sont à II lignes: ct les vecteurs XL> et & à N - Illignes.

Pour que l’opération propos& soit possible, il faut que 11 = kl: donc que les rnatriccs Al etA4 soient, carrées. La premitirc Cquatiorl donne :

X1 = A;I [I?l ~ AzX2].valeur que l’on substitue dans la seconde équation :

A:<A;l[B1 - A2X2] + A4X2 = Bz.Cctk kquation peut encore être transformée de la manihe suivante :

[Ad ~ A:sA;‘A2] X2 = B2 - A3A;%ou encore :

[A~A;~A~ - Ad] x* = A,yA;lBI - B2.Pour calculer XL; on rkalise la suite des ophkions :

1. Inversion de Al en Al’,2. Multiplication dc Ai’ et A2 soit ALlAz,3. Mult,iplication de AZ3 par lc résultat, prkcédent, soit A:jA;lAz,4. Soustraction dr: la matrice A4 au rkultat prkkdent, soit A:jAF’Az ~ Ad:5. Inversion de la matrice précédente, soit [A:jA;‘A2 - Ad]-l,6. Calcul de AFIB1,7. Multiplication de A:( par lc rhultat préckdcnt, soit A:IA;‘Bl:8. Soustraction dc B2 au résultat précédent; soit A:sAF’Bl - B2.9. Multiplication du résultat précédent par le résultat du 5.

On obtient X2, et l’on peut donc calculer A2X2, expression que l’on rc%ranclle dc Bl. il nereste plus qu’à multiplier Al1 par cc dernier rksultat pour avoir la valeur dc Xl.

Le programme grosys . c effectue les calculs proposks par cette procédure.

5 1 3

Page 492: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

5.4. Résolution d’un système linéaire par la méthode itérative de Jacobi

a - Transformation de la matrice A’. On divise chaque ligne par l’element qui est sur sadiagonale, si un des Ckments de la diagonale est nul, il suffit de perrnutcr deux lignes pourréaliser l’opérat,ion : elle est toujours possible puisque la matrice A’ est inversible, sinon celavoudrait dire que le déterminant est nul. Apres cette transformation, désignons les Cléments deA par alk et l’on a : QL~ = ail,/& si 1 # k et ull = 1. On obtient la matrice M aiskncnt, seséléments sont : rnik = a/~ si r! # k et m// = 0. Les composantes de B s’écrivent simplement :bl = bila;,.

b - On a la relation : [I ~ M]X = B, soit encore X = B + MX expression qui se transformeen processus itératif, à savoir :

Xlr+1= B+MXk

que l’on peut initialiser avec X0 = 0. On obtient la suite :

Xl = B,x2 = B+MX1 = B+MB= [I+M]B,X3 = B + MX2 = B + MB + M”B,. . .X n+1 ~- B + MX, = B + MB + . . + M’“B = [I + M + + P]B.

Si n est infini ou simplement très grand, on peut alors écrire que :

i+ M + . . + &f” + . = 1’12,

et si l’on désigne par 2 la limite de X,,, on retrouve naturellernent que :

[I-M]Z=IB=B,

rnais 2 ne sera la solution effective que si l’algorithme est convergent, c’est-à-dire si les valeurspropres de M sont de module inférieur à 1. Ceci n’est pas tout à fait exact: car même si la suitedes X, diverge, OII peut néanmoins faire appel à l’epsilon-algorithme vectoriel pour ramener leschoses en l’ordre. C’est ce que realise le programme jacobi0. c.

5.5. Résolution d’un système linéaire dépendant d’une matrice symétrique(méthode de Choleski)

1. a - On écrit : A = LS, la décomposition étant explicitée dans le chapitre 5.On obtient : AX = LSX = B d’ou SX = Lp’B = Y.

b - L’explicitation dc la dernière equation donne :

1 SI2 S13 SI4 . x1

0 1 s2:3 s24 . . z2

00 1 sgq . . 2:s0 0 1 . 24. . . . . . . . . . . . . . . . . . . . . .

514

Y1Y2

= y3

Y4. .

Page 493: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

A NNEXE 1. CORIUG~~S DES PROBLÈ M E S ET EXERCICES

On obtient les valeurs successives de 5,,, x,-~, zn-a ct ainsi de suite jusqu’à 21 en écrivant :

c - On écrit sans difJiculté :

111 0 0 0 . 0

121 122 0 0 . . 0

kl 132 k3 0 . 0.

141 142 143 144 . 0. . . . . . . . . . . . . . . . . . . . . . . . .

Y1

Y2

Y3

Y4.

h

b2

= h

b4

.

d’où l’on déduit :

d - On écrit simplement :

1 0 0 0 . . .11 0121 122 0 0 . 0

131 1:32 133 0 . 0.

1 142 14:< 144 . .‘41 0. . . . . . . . . . . . . . . . . . . . . . . . .

ce qui pcrmct d’écrire :

1 0 0 0 . 0x21 1 0 0 . . . 0

h x32 1 0 . 0.

x41 x42 x43 1 . . 0. . . . . . . . . . . . . . . . . . . . . . . . .

111 - dll, 121 = hdll, . lj, = Xjldll.

En définitive, la colonne 1 est divisée par dl1 = 111, la colonne 2 par dz2 = 122 et ainsi de suite.On r&crit la matrice A de la façon suivante :

A = LS = (hD)S et comme D est diagonale, A = h(DS).

2. a - Puisque la matrice A est symétrique, nous écrivons que la matrice A est égale à satransposée, soit : A = AT. À partir de A = LS = A(DS). on écrit la matrice transposée de A :AT = Sï‘DAT ; car DT = D. On en conclut que : A = ST et que AT = S.

b - Puisque A = ST, on en déduit que : A = AT = STDS = ADAï’. On peut encore écrire :A = AmfiAT = MMT en posant M = Afi et on a également : 6,, = fi, pour 1 =

1,2,3, . . , 12.

515

Page 494: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL BE CALCUL NUM É RIQUE A P P L I Q UÉ

c - L’équation A = MM” donne les relations suivantes : mT1 = a11 puis m21m11 = u12 et plusg&6ralement : *rrL/lmll = n,l/ pour r! = 1, 2, . , n. Dc là nous d6duisons la première ligne et lapremière colonne :

a11ml1 = *z/cI,11 p u i s 7n,rl = ~ pour I=2,3,4 ,..., n.71111

On passe % la dcuxitime ligne et la deuxième colonne au rnoyrn des équations suivantes :rr& = a22 - m& et plus généralement : mk2rn22 + mklrn,zl = a2k pour k: = 1,2, , n, dont nousdkduisons :

Ce calcul se g&&alisc aisément :

d - Après avoir calculé les rn/k on calcule les ~1; du paragraphe c en écrivant : Y = MplB.On résout ensuite X = M-‘Y en faisant, usage des relations établies au paragraphe b. Bienentendu, dans les relations établies aux paragraphes b et c, on remplace les S~J par les rn,kl etles 1kl par les mk..

On trouve sur le Wcb (*) 1 c programme choleski . c qui réalise l’algorithme: 6tudiC.

5.6. Résolution d’un système linéaire par la méthode du gradient conjugué

Nota - Pour éviter de comrncttrc quelques confusions, tout au long de ce probltimc; les vecteurssont no& en caractères gras.

1. - Soit ei une base orthonormale à N dimensions,

N - l

le vecteur p dc composantes pk s’écrit : p = C r>,ei2=0N - l

de mêrne le vecteur q s’kcrit : q = C q;e;i-0N-lN-1

lc produit Aq s’écrit : 4 = c c wwl1=0 k=O

et le produit scalaire s’écrit :

N - I N - 1

(P, Aq) = c c UZk’?kPI = (9, AP) = (AP, q) = (Aq, P)..l=O k:=O

2. a - Cornme A est une matrice définie positive. (Apj, pj) > 0 si pj # 0 ct, (Apj, pj) = 0 sipj = 0.

*http://www.edpsciences.com/guilpin/

5 1 6

Page 495: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

b - Les {Pi} sont linéairement indépendants et forment une base de l’espace à N dimensions.En effet: (Api, pj) = 0 si i # j et (Api, Pi) > 0. S’ils étaient linéairement dépendants, il existeraitau moins u11 k qui donnerait (Api, pk) > 0 ce qui est contraire à l’hypothèse.

c - h étant un vecteur de l’espace à IV dimensions qui est solution du système AX = B, il peuts’exprimer comme u11c combinaison linéaire des vecteurs de base Pj :

N-l

h = C cipi.i=o

Calculons les ci :

et donc on a :

cB>pk)

Ch = (APk,pk) ’

C o m m e

N-1 (B,Pk)h=xkzo (APk, Pk) Pk’

on forme la suite de vecteurs xj+r = xj + cjPj en commençant par q, = q,p,,

3. a - On a (APO,PI) = 0 = (mApI) avec PI = vl + ~10~0, soit encore : (po, Avl + ~~~~~~ =0 = (po, AVI) + c~lo(po, Apo) car pa = vo. On en déduit :

(PO, A~I)ci10 = -(PO, APO) .

Plus généralement, le procédé d’orthogonalisation consiste à écrire :

k

Pk+l XVk+lf~~k+l,.~Pj>J=O

ici encore les produits scalaires : (Apk+r, Pj) = (Pk+r, Apj) = 0, avec j = 0,1, . , k, permettentde calculer les (k + 1) coefficients CQ+~,~ et l’on trouve :

Ensuite, on peut écrire tout simplement que vk est une combinaison linéaire des Pj pourj = 1,2, . . , k : vk = E:T0 dk;,fPj, il s’ensuit que :

(Vk,APl) = (AVk,pl) = & dk,j(Apj, PI) = 0 si j > 1,3 =o

car les {Pi} sont A-orthogonaux.

517

Page 496: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Si A = 1, alors les vecteurs A-orthogonaux deviennent orthogonaux, car :

(APk,Pd = (Pk,Pd = 0 Si fi # 1.

Ensuite, on pose :

k-l

PL+1 = Pk + ~-fk+l,jP; + %+l,kVk+l.j=o

Dans le cas où j < k + 1, le produit scalaire (pk,,, pi) s’exprime ainsi :

d’où :

(Pk+l,Pji) =O=Yk+l,j(Pjl>Pj)+Ylc+l,lc(Vk+l,Pj),

?k+l,j = Yk+l,k(vk+l> Pj'>

(Pjl,Pjl> .

On obtient yk+i,k en faisant (pk+,,pk) = 0 = (&&) f%+l,k(Vk+l,Pk), soit :

(1.1)

de là on tire l’expression de yk+i,j :

?k+l,j =(&p;) h+ld’jl) .

(Vk+l>P;) ’ (P;>Pji>

4. a - La suite {ri} est orthogonale. Posons : vk+i = Apk et pk = rk, puis remplaçons dans

l’équation (1.1) :

6

rktl = rk + (Al%, rk)c (APkrrj)rj _ APk

j=. (rj, rj)

mais la somme est nulle puisque k > j. Par conséquent :

7-2rk+l = rk - APk cAPk, rkI >

qui constitue bien une suite orthogonale puisqu’elle obéit au processus de formation de l’équa-tion (1.1). Par un procédé analogue, on démontre que la suite des pk est A-orthogonale. Pourcela, on pose dans l’équation (H.7 p. 457) vk = rk puis partant de :

Pi+1 = Vi+l + 2 W+l,jPj, avec i + 2 < N, e t ai+i,j = -(Avi+l, Pj)

j=o (APj,Pj) ’

on obtient l’expression :

i (Ari+l, pj) iPi+1 = ri+1 - C c

(ii+1 1 Apj)

j=. (APj,Pj) ‘j = ri+1 - j=. (Apj, pj) ‘j

518

Page 497: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

Montrons que (Ari,pk) = (Apk,ri) = 0 si i > k + 1 :En effet, la suite des {pi+r} est construite par A-orthogonalisation de ro, rI, r2, . , laquelle a

été construite par orthogonalisation de ro, Apa, Apr,. . , Api. Comme cette dernière suite a étéformée à partir de l’expression (H.8 p. 457), alors l’expression (vk, Api) = 0 avec i > k est vraieen faisant A = 1 et en remplaçant vk+r par Apk et pi par ri ; on peut écrire alOrS :

(Vk+l>APi)=O s i i>k+l soit enCOre (vk+l,pi) = 0 et (Apk,ri) = 0,

soit en définitive :

Pi+1 = ri+1 -(ri+l, APi)(APi, Pi) pi

b - Le maximum de tours d’itération est N, ordre du système linéaire.

5. a - E2(x) = [A(h - x), h - x] q ru n’est rien d’autre que le carré A-scalaire du résidu donccomme A est définie positive, cela entraîne que E2(x) > 0.

b - Développons le calcul de l’erreur :

E2(xj + Zjpj) = [A(h - xj - ljpj), h - xj - ljpj]= [A(h - xj), h - xi] - [A(h - xj), Ijpj] ~ [A(ljpj), h - xj - Ijpj]= E2(Xj) -Ij[A(h-xj),pj] -Ij(Apj,h-xj -Zjpj).

Puisque Ah = B, on pose rj = B - Axj = Ah - Axj, il s’ensuit que :

E2(Xj + Ijpj) = E2(xj) - 2Z,(rj,pj) + l$(Apj, pj).

Dérivons cette dernière expression par rapport à 1, pour obtenir le minimum de E2 :

dE2(xj + ‘jpj) = -qrj,pj) + 2l.(Ap. p.) = 0dl, 3 J,J )

on obtient alors la valeur de lj :

Crj, Pj)l’ = (Apj,pj)

Explicitons le dénominateur :

(rj, Pj) = (B, Pj) - (xj> APj).

Montrons que le dernier produit scalaire est nul; en effet, xj est une combinaison linéaire des{pi}, donc (rj, pj) = (B, pj), et l’expression des lj devient :

CB, Pj)lj = (Apj,pj) = ‘j’

On voit que chaque itération j rend E2(x) minimum selon l’axe des pj passant par le pointx~j. Le minimum minimorum est atteint pour x = h et alors E2(x) = 0.

519

Page 498: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALGUL NUMÉRIQUE APPLIQUÉ

6. - Dans le cas où la matrice n’est pas définie positive, alors on peut multiplier à gauche lesdeux membres de l’équation Ax = B par la matrice transposée AT. Ainsi :ATAx = ATB, dans la mesure où la matrice A n’est pas singulière, on est ramené à l’étude

précédente.La procédure présentée est concrétisée par le programme gradconj . c.

5.7. Calcul direct des coefFicients du polynôme caractéristique

a - Nous avons :

il s’ensuit que :

c\ik = mo) .k!

b - À présent, dérivons l’expression P,(X) = [XI, - A]. Nous avons :

expression dans laquelle on fait X = 0, soit :

ensuite, on a :

c - Cette expression se généralise de la façon suivante :

pour aboutir aux expressions terminales :

où l’on a noté par alk les coefficients de la matrice A

d - Par un examen direct de (H.10 p. 459), on peut écrire :

‘@l(O) = 1.72.

520

Page 499: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

e - On obtiendra les valeurs propres de A après avoir obtenu les coefficients du polynômecaractéristique. Pour obtenir ceux-ci, il peut être habile de confectionner un programme récursif(mais cela n’est pas indispensable) puisque le calcul d’un déterminant d’ordre n est unecombinaison linéaire de n déterminants d’ordre n ~ 1.

5.8. Calcul des valeurs propres d’une matrice réelle et symétrique par la méthode de Jacobi

a - On a AX = XX puis on fait X = TZ cc qui donne AT2 = XTZ. Multiplions à gauchecette derniere équation par T-l : T-lATZ = TP’XT2 = X2. On voit que la matrice TplAT ales mêmes valeurs propres que A mais pas les mêmes vecteurs propres.

b - Puisque A est symétrique, ses valeurs propres sont réelles, donc A est diagonalisable.

c - T est symétrique par construction, T-l est symétrique aussi car (T-l)i, = K,ij/a où KtJest le cofacteur et le A déterminant qui se réduit à un déterminant d’ordre deux :

COS(P) sin(cp)sin(cp) -COS(P)

donc qui vaut -1. On verifie bien que TT = I (matrice unité d’ordre n).

d - Écriture des éléments de (AT), seules les colonnes p et q sont changees dans la matrice A :

colonne p colonne qulTl Cos(p) + ulq sin(p) . alp sin(cp) - alq COS(V)a2Tl Cos(p) + cbq sin(p) . . ~2~ sin(cp) - ~2~ COS(P). . . . . . . . . . . . . . . . . . . . . .uzp Cos(p) + uzq sin(p) . uzp sin(cp) - azq COS(P). . . . . . . . . . . . . . . . . . . . . .unp Cos(p) + annq sin(cp) . . . a7,.11 sin(<p) - anq COS(P)

e - Les éléments de (TAT) sont les mêmes que ceux de (AT) à l’exception d’une part deslignes p et q qui sont remplacées respectivement par la colonne p et la colonne q et des élémentsà l’intersection des lignes p et q et des colonnes p et q d’autre part ; ces derniers deviennent :

bpp = upp COS~(~) + upq sin(p) COS(~) + uqp sin(p) COS(~) + uqq sin2(p)

b,, = upp sin2(cp) ~ upq sin(cp) COS(P) - uqp sin(cp) COS(V) + uq4 COS~(P)

bpq = app sin(cp) COS(P) - upq cos2(‘p) + upq sin’(cp) - uq4 sin(cp) cos(‘p)

b,P = b,,,

puisque A est symétrique, B = (TAT) est aussi symétrique.

f - On veut que b,, = bpq = 0. Soit : (upp - uq4) sin(cp) COS(P) = upcl [COS~ (cp) ~ sin2 (cp)], ce quidonne :

tan(2cp) = 2%UPP - %4

r, l’angle ‘p appartenant à (-;> f) .

Il convient à présent de calculer sin(cp) et COS(P) en fonction de T. Nous avons :

sin(2cp) = 7 cos(2cp)

521

Page 500: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

que nous élevons au carré et nous obtenons :

sin(2cp) = ~ e t cos(2cp) = ~ avec E = signe de 7,

de là on tire :

g - Comme la matrice B reste symétrique, on peut opérer sur elle au moyen des transformationsTBT dont le résultat est toujours une matrice symétrique.

Adoptons une notation pour simplifier l’écriture : Bk+l = Tp,B~qT,, pour p < q, q variant de2 à n. k est l’ordre d’itération, en effet, ayant réalisé ?ne fois l’opération « la nouvelle matriceB » n’est pas diagonale et l’on doit réitérer l’opération jusqu’à ce que les éléments non diagonauxsoient suffisamment nuls à une précision définie à l’avance. La fin des itérations dépend aussi dela matrice A et de son ordre.

Dans le cas particulier où uPP = aq4, la méthode ne tombe cependant pas en défaut, car oncalcule directement la valeur des fonctions trigonométriques :

COS(~) = G2

avec E = signe de 7.

h - Convergence de la méthode - La somme des carrés des valeurs propres de A est uninvariant dont on sait calculer la valeur :

k=l k=l 1=1

on cesse les itérations lorsque la somme des carrés des éléments diagonaux de la matrice B” estsuffisamment proche de S2.

i - Nous avons les relations :

bqq + bpp = app + aqq (14

bPP - bl = (%P - uqq) cos( 29) + 2a,, sin( 2p) (1.3)

2bq = (app - uqq) sin(2cp) - 2a,, COS(~~) (1.4)

puis on fait (1.3) au carré plus (1.4) au carré et l’on obtient :

(bpp - bqqj2 + 4$, = (app - aqr112 + 4azq,

et l’on combine cette dernière équation à (1.2) élevé au carré, puis en tenant compte du fait queb,, = 0, on peut écrire :

b&+b&,=a~g+a&+2a~,

2La somme des termes diagonaux augmente de 2a,,. Mais, comme la somme de tous les termesau carré est une constante, la méthode provoque l’accroissement de la somme des carrés deséléments de la diagonale et la diminue hors de cette diagonale de la même quantité. La méthodeest donc convergente sans condition.

Le programme jacobil. c met en œuvre cet algorithme.

5 2 2

Page 501: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

5.9. Calcul des valeurs propres d’une matrice par la méthode de Souriau (1948)

a - Nous avons :

B, = A4 + alAqpl + a2Aqp2 + . . . + aql

B - Aq+l + alA + a2Aq+l - q-1 + . . . + a,+11 = A(Aq + ~A4-l + azA q-2 + ‘. + uq) + u,+1I

d’ou la relation de récurrence : B,+l = AB, + u~+~I, et si q = 0, B1 = ABo + aIl, avec larelation de définition qui impose : Bo = I.

b - La démonstration est dans le cours. On a :

Uk = -; [sk + u1s”-l+ up9k-2 +. . . + Uk-lS1] ,

avec S” = 2 XT = Trace (A”),j=l

où les {Xj} sont les valeurs propres de A. Donc :

uk = --i {Trace (A”) + ulTrace (A”-‘) + u2Trace (Akp2) + . . . + uk_rTrace (A)}

= -iTrace {A” + alA”-’ + u2Akp2 + . . . + Q-d}

= -iTrace {A(A”-1 + alAkp2 + u2Akp3 +. . . +u~-~I)} = -;Trace {AB~-~}.

Remarque : B, = A” + ulAn-l + u2Anp2 + . . . + a,1 = 0 d’après le théorème de Cayley-Hamilton.

Le programme souriau. c exploite cette procédure.

6. Interpolation

Les exercices proposés sont traités dans le cours p. 89 et suivantes.

7. Intégration des équations différentielles dans le champ réel

7.1. Étude d’un pendule de longueur variable

a - Appliquons le théorème du moment cinétique, nous obtenons :

+-(1’19) = -gl sin(B),

d’où :

1% + 22~ + gsin(8) = 0.

5 2 3

Page 502: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Lorsque 19 est petit nous pouvons écrire :

et comme Z = lu + ut, nous pouvons exprimer l’équation différcnticlle en fonction de la variable1 (dl=vdt):

$+;$+&H=o:

sur le plan numérique, on est amené à résoudre le système :

df9-xdl ’dp-ZZZdl

avec les conditions initiales au tcrnps t = 0 : 0 = & rd et $ = 0 rds-i. Le programme

penduleo. c realisc ccttc proccdure.

7.2. Système électromécanique dépendant d’une équation de Mathieu (1835-1890)La charge q(t) sur le condensateur obéit à l’équation diffkcnticllc classique :

soit, en effectuant le remplacement de la valeur de C :

LC,$ + RCof$ + y[1 + Esin(tiit)] = 0.

Il suffit de poser :

dq-=idtdi R. 1-=d t -La - LCo

-[l + Esin(wit)].

Il convient de choisir le pas temporel h petit devant les periodes Ta = 27ra et T’i = 27r/wi.Compte tenu des grandeurs numériques proposées, on doit trouver un courant oscillant qui croîtindéfinirnent. Il ne faut pas croire que les principes de la thermodynamique sont violés, le moteurqui fait varier le condensateur fournit l’énergie.

On trouvera le programme mathieu. c qui concrétise cet algorithme.

7.3. L’équation de Van der Pol (1889-1959)Il s’agit d’une importante équation de la physique concernant la synchronisation des systcrncsoscillants. Elle présente aujourd’hui toujours un intérêt dans la mesure où c’est une équation nonlinéaire. Son étude s’effectue dans l’espace des phases (l’abscisse est la coordonnée d’espace etl’ordonnée la dérivée par rapport au ternps de la coordonncc d’espace) et l’equation différentielles’écrit :

d’ydt2

2&(1~ yz)$ + y = 0

524

Page 503: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

On dccomposc cette équation du deuxième ordre en un système de deux équations du premierordre :

dy = CE et dxdt

- = 2&(1 - y2)x - y.dt

Au temps tu = 0, on se donne 50 et yo quelconques, valeurs que l’on fournit au programme demanière conversationnelle car il convient d’observer les courbes de l’espace des pha.ses pourdifférents couples de ~0 et ya ainsi que pour differentes valeurs de E. Il suffit d’utiliser lesprogrammes proposés dans le cours en choisissant convenablement le pas dt ; il est nécessairede l’adapter pour chaque valeur de E.

On doit observer que, pour une valeur fixée de E, quelles que soient les conditions initiales (~0et yo), toutes les trajectoires admettent le même cycle limite, que le point figuratif initial (20 etyo) SC situe à l’intérieur ou à l’extérieur de ce cycle limite. Cela signifie que, si un système obéita cette équation diffkcnticllc~ au bout d’un certain temps (transitoire), ses oscillations serontsynchrones.

Le programme vanderp . c realisc les calculs proposés.

7.4. intégration d’une équation différentielle du premier ordre par une méthode itérative(prédiction-correction)

a - L’équation différentielle suivante :

dy/ dx = f(x> Y)

pour x appartenant à (n, b) admet une solution unique qui prend la valeur yo pour la valeur20 = u si les conditions des thcorèmes d’Arzelà et dc Cauchy-Liptchitz sont vcrificcs (c,$ lecours).

b - Lc résultat est immédiat : y,,+1 = yYmPr + 21Lf(s,,,, yym).

c - On pose :

y = .f(xo, Yo)

et l’on obtient : y1 = y0 + :(u + 4w + w)

d - On écrit la relation de définition :

Yna+l - Ym(2) - (1) + ; [f (x rn, Y!!,‘) + f (Gn+I > Y%)]

pour m > 1. On obtient la formule d’itération :

e - On cesse les iterations lorsque :

1OF” éta.nt la prkision relative retrmie.

525

Page 504: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

f - Éventuellement, dans le voisinage du point z,, on adapte le pas h de telle sorte que larelation h < 2/M avec Al = sup ]af/13 z soit vérifiée. On peut estimer M de deux façons, la1première consiste à dériver formellement la fonction f et la seconde à calculer numériquementla valeur de la dérivée.

g - Pour la prédiction on écrit :

(k)%n+1 Zm+l

s

dy = y(& - y:), =

sfb> ~(~11 dz.

Y(? “m-1m 1

Il reste à calculer l’intégrale de droite, que l’on désigne par I?,,, et l’erreur que l’on commet surl’estimation. Pour simplifier l’écriture, on pose cp(~~) = f[~,, y(~~)], on a alors I, E 2hp(z,)qui est l’approximation donnée par la formule de prédiction. Développons-la autour du pointG-1.

L z 2hcp(z,-l + h) = 2hp( x,-l) + 2h2p’(z,-1) + hfd’(z,-1) + . . .

Désignons par @(x) la primitive de C~(Z), son introduction va nous permettre de calculerl’erreur sur 1. Pour cela écrivons l’expression rigoureuse de 1 puis effectuons le développementde l’expression trouvée autour du point z,-i :

In, = @(z,-~ + 2h) ~ @(x~-~) = 2hp(z,-l) + 2h2p’(z,el) + ;h”q”(z,el).

Maintenant on obtient l’erreur e, sur Im :

avec < appartenant à (2,-i, x,+1). C omme d’habitude, on cherche une majoration de If”(z)1dans l’intervalle considéré. Pour ce qui concerne l’erreur de correction, on a :

Ym+l = Ym + ;I/(z,,,. Ym) + f(Gn+1, Ym+dl,

et l’on reconnaît la formule des trapèzes sur laquelle nous avons déjà effectué le calcul d’erreur :

e& = ~fY~>,

avec < appartenant à (x,-i, x,+1). On note que les deux erreurs sont localement en h3.Le programme predcor . c réalise cet algorithme.

7.5. Étude d’un phénomène transitoire obéissant à une équation différentielle du premier ordre

1. a - On trouve tout de suite la solution particulière y = l/lO, puis la solution de l’équationsans second membre y(t) = aexp(-50t), et enfin la solution générale :

y(t) = aexp(-50t) + A,

et la condition initiale permet de déterminer a, soit : a = l/lO, ce qui donne

y(t) = $[exp(-5Ob) + 11,

quand t varie de 0 à l’infini, y(t) varie de 0,2 à 0,l.

526

Page 505: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

b - La méthode d’Euler s’écrit simplement : yk+r = yk + hf(yk, tk) soit encore :

yk+r = -1,5yk + 0,25 puisque h = 0,05.

Pour t = 1, on obtient y = 332,63 et pour t = 2 on trouve y = 1 105 733,3 alors que le calculdirect de la solution analytique donne la valeur 0,l pour t = 1 et t = 2; il s’agit de la valeurasymptotique de la solution. Pour obtenir une valeur numérique raisonnable, il faut prendre unpas h petit devant la constante de temps T = 1/50, disons par exemple h = -r/lO = 0,002. Alorspour t = 1, on trouve y = 1,000000005 X 10-l.

2. a - On obtient :

t2 t2

s

t2

y’(t) exp(Dt) dt = -D/’

y(t) exp(Dt) dt + s(t) exp(Dt) dt.

t1

J’t1 t1

Intégrons par parties le premier membre, il devient :

t2

s

t2

y’(t) exp(Dt) dt = [ y ( t ) exp(Dt)]iT - Ds

y(t) exp(Dt) dt,

t1 t1

il s’ensuit que :

t2

y(b) exp(%) - y(tl) exp(Dtl) = J s(t) exp(Dt) dt,

t1

ou encore :

t2

Y(h) = y(tl) exp[-D(t2 - tl)] +J’

s(t) exp[D(t - t2)] dt,

t1

qui est l’expression recherchée.

b - À présent,

N (t - t1)”s(t) = C k!pk ak avec p = t2 T tl.

k=O

Alors 1 s’écrit :

ak exp[D(t - h)] dt = e ak 1t2 (t-t )‘”

,!,k exp[D(t ~ h)l dt,

k=O tl

et en posant

@ - tl)k exp[D(t - tz)] dt,k!p”

t1

5 2 7

Page 506: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCULNUMÉRIQUEAPPLIQUÉ

on a :

On calcule immédiatement CU :

t2

CO =1

‘exp[D(t ~ tz)] dt = $[l - exp(-D/L)];

t1

puis on Ctablit la relation de récurrence entre les Ch:: en intégrant l’expression de Ck par parties :

k!p’Ck =s

( t - tl)” exp[D(t - ta)] dt

t1

en posant PL = exp[D(t - tz)] et dv = (t ~ tl) dt. Tous les calculs faits on trouve :

Étude du cas N = 1 - On a Tl = t2 et TO = t a ~ (ta - tl) = tl, il s’ensuit que nous avonsalors :

Par ailleurs nous pouvons écrire : SO = S(T~) = ao et sl = s(Tl) = ao + ai7 relations quidonnent ao et a1 en fonction de sg et s1 : ao = su et a1 = SI ~ SO, on obtient en définitivel‘équation (1.5) :

z/(Tl) = ~(TOI exp(-DP) + (CO ~ G)~O + CISI. (1.5)

Application numérique : CO = 0,01836 ct Cl = 0,012 66, puis y(l) = 0,099955.

hode du cas N = 2 - Comme on a Tz = t2, Tl = tI et TO = 2tl - ta, il s’ensuit que nouspouvons écrire :

s(t)=ao+-ta - tl u1

Les calculs étant menés comme précédemment on obtient :

uo = s1 et a1 = (Sa - SO)/2 e t CL2 = sa + SO - 2s1,

d’où l’équation (1.6) :

cl(T2) = y(Tl) exp(-DP) + SO + (CO - 2Cz) SI + -52. (1.6)

528

Page 507: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

3. Généralisation de /‘équation (1.6) - On reprend la relation (1.5) dans laquelle on effectue lechangement SI = S(T~) = s[y(Tl),Tl]. On fait dont d’abord s1 = su pour obtenir :y(Tl) que l’onreporte dans l’expression de ~1. Alors, on peut itérer jusqu’à ce qu’on obtienne une prkisionsouhaitée à l’avance 1OF” par exemple en erreur relative. On connaît donc Tj et y(Tl) à l’issuede ce calcul. On va poursuivre de la mCmc façon avec l’expression (1.6) pour obtenir t2 et y(Tz).

Au départ, on choisira sa = s1 et l’on calculera alors y(Tz), valeur qui sera reportée dansl’expression de sz. On poursuivra les itérations de la rnême manière que ccllc indiquee au débutde ce paragraphe.

Description de /a procédure d’itération - On établit une plate-forme de calcul avec larelation (1.5) que l’on itCre suffisamment, puis on continue les calculs en itérant la relation (1.6).

7.6. Problème de la poursuite

Désignons par z(t), y(t) te vo les coordonnks cartésiennes et la vitesse du jardinier, puis parX(t), Y(t) et V 10 es coordonnées cartésiennes et la vitesse du chien. Nous pouvons krirc :

d’où :

dXdt

ainsi que :

Par ailleurs, nous savons que le chien se dirige en permanence vers le jardinier, nous pouvonsalors écrire :

dY Y - Y dY Y - y dX--T ~ = ~ ~ .dX X - X

d’ofldt x - x dt

On écrit l’équation horaire du jardinier :

X = a cos[f(t)] et Y = b sin[f(t)]

dz- = -af’(t) Ski[f(t)]dt

e t $ = bf’(t) cos[f(t)]

d’où

[$J2+ [+y’ = u; = f2(t)[a2 + b2].

De là on tire que f’(t) est une constante et par conséquent que f(t) = wt + cp, ce qui donne :

et (o = 0 (condition initiale). Donc, à t = 0 : y = -bcos(wt) et x = asin(Il faudra prendre garde au signe de dY/ dt ainsi que celui de X dans l’exécution des calculs

et l’on devra prévoir des tests pour affecter les bons signes.

5 2 9

Page 508: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

8. Intégration des équations aux dérivées partielles

8.1. L’équation de Laplace, les isothermes d’un réfrigérateur

Le travail ne présente pas de réelles difficultés, et l’on trouvera un programme qui traite ceproblème et qui s’appelle refrig. c.

8.2. Refroidissement d’une sphère homogène

Le problème admet la symétrie sphérique et nous employons donc l’équation de Laplaceen coordonnées sphériques dans laquelle nous ne conservons que les termes qui dépendentuniquement de la coordonnée spatiale T. Une remarque importante s’impose : nous ne pouvonspas calculer directement la valeur de la température au centre de la sphère car une discontinuitéartificielle est introduite par le formalisme. En effet, le champ de température est parfaitementcontinu, mais le choix du système de coordonnées introduit une discontinuité au centre puisquel’équation fait apparaître un terme en l/r. On pallie cet ennui en choisissant pour T(0, t) lavaleur obtenue à l’instant t - 6t au point adjacent (premier voisin), soit T(0, t) = T(0, t ~ dt),6t étant le pas dans le temps.

9. Les transformées de Fourier

9.1. Étude d’un vélocimètre

Pour des particules se déplaçant selon l’axe du réseau à vitesse constante, le spectre en fréquencede la lumière transmise, appelée I(z), est le produit des transformées de Fourier de la fonctiond’éclairement d’une part et de la fonction d’absorption d’autre part.

Il s’agit donc dans un premier temps de calculer la transformée de Fourier d’un réseau de Ntrous alignés et équidistants. En choisissant l’origine au centre du réseau et en appelant F(k) latransformée de Fourier d’un trou, on aura :

I(z) TF) Q(x) = F(x) C exp(27rjkXb) a v e c : F(X) =sin(7rXa)

,N

“x

expression dans laquelle a est le diamètre du trou. Tout le calcul fait :

sin(7rXa) sin(7rXbN)Q(x) = nk . sin(7rXb) ’

on retrouve l’expression classique des réseaux, et grosso modo, dans l’espace de Fourier, le terme[sin(-irXMV)]/[sin(7rXb)] 1é e v é au carré donne un « spectre de raies » et le terme [sin(7rXa)]/[.irX]élevé au carré donne l’image de l’enveloppe de ces raies. Rappelons que X est un nombre d’ondes(inverse d’une longueur).

En réalité, ce qui nous intéresse est le signal dépendant du temps t et de travailler dansl’espace de Fourier correspondant qui est celui des fréquences V.

Dans notre problème, comme les longueurs sont parcourues à la vitesse constante V, il estcommode d’effectuer la transformation sur le plan dimensionne1 : [Z] = w[t] et comme [X] =

WI = ll(4tl) = [ v w11 d ans l’équation donnant (a(X) il suffit donc de remplacer X par V/%I, endésignant par Q(V) la nouvelle fonction on obtient alors l’intensité de l’éclairement :

Q(u) = 10[

sin(7rva/v) sin(7rvb/vïV) 27ru~u . sin(7rvb/v) .1

5 3 0

Page 509: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ETEXERCICES

L’examen de cette expression permet de répondre aux questions :

1. Le premier minimum nul de la modulation existe quand sin(7wa/v) = 0, c’est-à-dire lorsqueu = V/a.

2. « Deux raies » consécutives sont séparées de la distance a déterminée par deux maximumsrelatifs et consécutifs de la fonction « raie », elle est déterminée par la différence de deuxvaleurs consécutives qui annulent le dénominateur, on a donc :

a = v/b.

3. La finesse des raies, c’est-à-dire la largeur à mi-hauteur, est inversement proportionnelle à IV,elle est donc de l’ordre de ca/N, et quand N est grand devant 1, c vaut &.

9.2. Calcul numérique des transformées de Fourier pour un nombre de données N = bS

On envisage le cas où le nombre de données est une puissance de trois : N = 3”. On écrit ladéfinition de la TF :

puis on regroupe les termes en trois sommes partielles :

Qk = f,,W; + f3Wik + &jWN” + . . (= A/J

+flw~+f4W~k+f7W~k+‘.’ (=BkW;)

+f2wN+fsw~k+f8w~k+... (=ClcWN)

d’où on tire : @k = Ak + Bk IV; + C’~CIV$~. Ces expressions s’écrivent encore :

Qk = fow$j + f3W&, + fdv‘q, + . .

+ -t fi WN-,, + f4W&9 + f7y+ + . . > WN

+ { .f2w; + f& + fs WN” + . . . } WN”.

On voit que Ak, Bk et Ck sont les transformées de Fourier de trois fois moins de points quen’en comporte l’échantillon initial. Cependant, les dernières relations ne peuvent être utiliséesque pour k = 0, 1,2,. . . , ïV/3 - 1, reste donc à régler les problèmes de périodicité :

CD k+N,3 = Ak + BkWFN13 + CkW,$k+N’“),

équation qui se transforme de la manière suivante :

un calcul analogue donne :

@k+ZN/3 = Ak + BkW;((&)+<*ll*r(-;+j$).

La formule d’adressage des données s’écrit :

j = RN(~) = R~(lc - 3’) + & avec 34 5 k < 3 ‘+‘et RN(o) = 0.

531

Page 510: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Dans le cas où N = b”, on cornbinc linéaircmcnt b transformées de Fourier de b foismoins de points que dans l’échantillon initial. La première relation permet les calculs pourk = 0, 1: 2, . i N/b. Il reste à établir les b ~ 1 relations pour obtenir une transformk complètece qui ne présente pas de diRicult6. La formule d’adressage devient :

Nj = RN(~) = R~(lc - b”) + b”ltl avec b4 5 k < b4+l et &T(O) = 0.

10. Introduction aux méthodes de Monte-Carlo

Les cxcrcices sont traites dans le cours p. 287 et suivantes.

11. Éléments de calcul des probabilités

11.1. L’ordre s ta t is t ique

a -

s,, x - si xk<x<xk+l avec k=l,2,3 ,... ;n,-1,

S, = 0” si 2 5 51,

S, = 1 si x > 5,.

S,, prend des valeurs sur (0,l) et c’est une fonction non décroissante dc x. C’est bien lafonction de répartition de la variable aléatoire 2.

6 - P(&<x)=F( ) p2 e x ression qui est vraie pour tout ci. Il s’ensuit que P(<~C < x) = p pourtoutes les composantes.c-

Cette expression est donnée par la loi binomiale car toutjes les composantes obéissent à la mêmedistribution (rkpartition), cllcs sont toutes équiréparties (idem les faces d’un dé), et S,,(z) estla fréquence de succès; toutes ces conditions sont celles du schéma de Bernoulli.

d - Il suffit de placer 5 dans la série des X?I. Ainsi, P(xJ”) < x) est la probabilité pour qu’il yait au moins j composantes de V inféricurcs à x. Cela revient au m&ne de dire que S,,(x) peut

prendre les valeurs - ~{

j .i+1n’ n “‘.’

11

ou encore que S, (x) ne peut pas Etre inférieur à $.

Ici encore la probabilité d’obtenir la valeur i est donnée par la relation :

P (S&) = ;) = Cy,[F(X)]~‘[l ~ F(x)]‘“?

mais de plus, j prend les valeurs de j à n. Les événements étant indépendants :

soit encore :

532

Page 511: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

e - On part de l’intégrale :

F(z)

Jt+(l - t)“-j &,

0

que l’on va calculer par une succession d’intégrations par parties. Pour cela posons :

du = t.-l dt

d’où :

u = 4, puis v = (1 - t)“-” d’où dv = -(n - j)(l ~ t)npJpl dt,

on obtient alors :

C!$‘(x) = CJJF(x)]j[l - F(x)]“-,7 +

on poursuit l’intkgration par parties et l’on vérifie que l’on retrouve bien l’expression de <p,,(z).En dérivant cette dernière fonction, on obtient la fonction de distribution recherchée :

f(x)[F(x)]ql - F(x)]‘“--!

À partir de cette relation, il est facile de calculer la moyenne des {CC} qui tombent dans « l’urnej », soit :

+oO

(x!“‘) = ’3 (J - l)Y& - j)! J f(x)[F(x)]j-‘[l - F(x)]“-jx dz.

f - Application - F(z) est la loi uniforme, soit :

F(x) = x pour 2 appartenant à

f(z) = 1 pour z appartenant à

On utilise les dernières relations établies :1

(0,l) et vaut zéro ailleurs.

(0,l) et vaut zéro ailleurs.

(x(7”‘) =1

3 (.y - 1)2;n-j)! J xj-l[l - x]"-.fx dz.0(x’“‘) 1 = 1

6’

(x’“‘) 2 = 26’

(@) E 36’

(x4”‘) = 46’

On remarque que les valeurs sont « symétriques » par rapport à la valeur centrale.

533

Page 512: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

12. Lois

12.1. L’exercice est sans difficulté

12.2. L’exercice est traité dans le cours p. 320

12.3. L’exercice est traité p. 328 et p. 331

12.4. L’exercice est traité p. 336

12.5. L’exercice n’offre pas de difficulté

12.6. Loi de Poisson. Distribution de Cauchy+03 +C=

a - On doit avoir&l

-oo ~4x1 dz = k.I

exp(-alzl) dz = 1;-03

soit encore : 2lcs

exp-~1x1 dz = 1. D’où lc = a/2.0

s

+CCb - p ( t ) = exp(j27rxt)p(z) dx expression dans laquelle t appartient à (-00, +03). Soit

-03ici :

03$9(t) = ; J exp(j27rzt) exp(-alxl) dz = g /[exp(j27h) + exp(-j2nxt)] exp(-az) dz

-03 0

a2 1a2 + 47r2t2 = 1 ; 47r2t2

a2

c - Calcul de la moyenne :

+‘=C

m=a2 s

xexp(-alxl) dlç = 0

-DC>

car la fonction sous le signe somme est impaire. Calcul de la variante :

+03 DC,

Dz;s

x2 exp(-alzl) dz = as

x2 exp( -ax) dx

-03 0

On intègre deux fois par parties cette dernière expression, et l’on trouve : D = 2/u2.

d - La distribution de Student à m degrés de liberté s’écrit :

U(m + 1)/21 x2 -(m+1)‘2 pour z E (@). +m)‘m(x) = J%iir(m/2) ’ + ii[ 1 > ,

où I’(Z) est la fonction factorielle. Dans le cas où m = 1, on obtient :

(cette fonction s’appelle fonction de Lorentz).

5 3 4

Page 513: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

e - Ona

exp(-2nltl) Z51

n-(1 + x2)

expression donnée dans le cours à propos des transformées de Fourier. De là on écrit : Q(t) =exp(-2rltj).

f - Les variables aléatoires <. sont indépendantes et obéissent à la même fonction de distributione. .q(z) ; la variable aléatoire 3 obéit à une fonction de distribution q(z/n), ainsi, la variable

aléatoire z a sa fonction cadactéristique X4?(t) égale au produit des fonctions caractéristiques?lJ-(t) de toutes les variables indépendantes &/n. Nous avons donc :

$j(t) = Q@/n) = exp (-2rlt/nl),

ainsi : Q?(t) = fiexp (-2Tlt/nl) = exp(-2nltl).i=l

La fonction de distribution de z est donc

4(x) = l7r(l +x2)

g - Calcul de la moyenne de & :

+CCM=l ~

7r s (1 Jrî2) dx.-03

C’est une fonction impaire, donc on pourrait dire que M = 0 ; cependant, M = [log,( 1 +X”)]~E,la moyenne n’a pas de limite et n’existe donc pas au sens ordinaire. On dit que M = 0 en valeurprincipale au sens de Cauchy.

12.7. Loi binomiale négative. Loi de Poisson dont le paramètre suit une loi du x2.Urne de P6lya

1. a - La probabilité d’avoir tiré exactement k échecs qui précèdent le tirage du re succès estf(kr,p).

b - Nous avons A = B . C, et comme les événements B et C sont indépendants, nous pouvonsécrire : P(A) = P(B)P(C) avec :

P(B) = C&pT-‘pk = C;+k-lpT-lpk = C;-,pr-‘pk,et P(C) = p,

prpk.

c - Transformons l’égalité prpPr = p’(l - q)-’ = 1, on trouve : pr BAT, Ck+T-lqk = 1.

5 3 5

Page 514: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

d - Par analogie avec la transformation réalisée sur la loi binomiale, on remplace g par qt pourobtenir la loi de génération des moments, soit : f(t) = p”( 1 - qt) pT, que l’on développe encore :

i-(t) = PT 2 G+,-lwkk=O

expression à partir de laquelle on va calculer les deux premiers moments non centrés :

oc1

ml= f'(l)=pl'TqC-l =J)"E c,$+,r-lkqk,k=O

d’où : ml = rz .P

On poursuit les calculs :

f”(l) = prr(r - l)q2pPrP2 = p’ 2 Ck+,r-,k(k - 1)q’ = m2 ~ ml,k = O

ce qui donne :

de là on tire l’écart type :

9u2=m2-ml=,P

Pour mémoire, on rappelle que, pour la loi binomiale, on obtient le résultat :

g2 = npq.

e - On écrit : v(t) = M[exp(jkt)], M( ) r eprésentant l’opérateur rnoyennc, ce qui donne :

y(t) = p7’ 2 Ct+,,-,qk exp(jkt) = pl’ 2 C”k+T-l[qexp(.jt)]k = p’[l - qexp(jt)]pr.k=O k=O

2. a - On rappelle quelques résultats concernant la loi de Poisson :

P(< = k) = exp(k’x)Xk avec (6) = X et u2 = A.

b - Il convient de vérifier que sow g(z) dz = 1, pour cela calculons :

CO 03

1 =J'

CE"-xvel exp(-ax) dz = zr(u) r(u) J’

xv-’ exp( -ox) dz,

0 0

effectuons le changement de variable y = ox, on obtient :

536

Page 515: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

par ailleurs, l’expression sous le signe somme est toujours non négative, g(z) est donc bien unedensité de probabilité.

Calcul de00

II(< = k) =J’

exp(-X)$g(A) dX,

0

soit :

Xk+vpl exp[-(a + 1)X] dX = r(v+k) vk!Iyv) . (a! +al)v+k-)

0

soit encore :

en définitive :

Wl=k)= [(nsii]kcLy+y-l [cri--i,]”expression dans laquelle on pose : p = l/(a + 1) et 4 = o/(o + l), ainsi on aboutit a :

qui est bien l’expression de la loi binomiale négative.

3. a - Supposons que l’on ait tiré d’abord toutes les boules noires ensuite toutes les boulesrouges, la probabilité de ce tirage s’écrirait dans ce cas particulier :

bn --. b-te b + (nl - 1)” r r + (n2 - 1)cn1n2 ~ b+r b+r+c”’

. .b + T + (nl - 1)” b + T + nlc b + T + (ni + ns - 1)~ ’

Maintenant, en examinant cette expression, on s’aperçoit que l’on peut réaliser n’importequelle combinaison d’un des produits du numérateur et d’un des produits du numérateur sansque la probabilité soit changée; et, si l’on considère un autre ordre pour les nr boules noires etn2 boules rouges, le calcul reste le même, mais les termes sont arrangés dans un autre ordre.Donc pourvu que nr et n2 ne soit pas changés, toutes les séquences où figurent nl boules noireset n2 boules rouges ont la même probabilité quel que soit l’ordre de tirage des boules.

b - Par suite, la probabilité de tirer n1 boules noires parmi n = nr + n2 boules est donc :1 l b

P(nl,n) = C~lII,,,, = -II,,,, = 25 . ~ .b + c

nl!n2! nl!nz! b+r b+r+c”

b + (ni - 1)c r

‘b+r+( .

r + (n2 - 1)c. .

nl - 1)~ b+r+nlc b + T + (nl + n2 - 1)” .

On divise chaque élément binôme du numérateur et chaque élément binôme du dénominateurde II nIn2 par le nombre c, et l’on obtient :

c “1cn2

P(nl,n) =nl+b/c-1 n2+r/c-1 C”l-O/c cn2-1./c

‘:+b,c+r,c-l = ‘:b,c-r,c

537

Page 516: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - Le changement de notation donne :

cm1 cn2P(w,n) =

-PlY -41-r .

%,Y

d - Lorsque n + 03 et que p et y tendent vers zéro de telle sorte que :

np+X e t1

v-+ -)P

ce qui entraîne aussi que n2 » nr, c’est-à-dire que n2 est de l’ordre de n ; on peut étudier lecomportement des différents facteurs :

c n1-p,y + c:xp>par ailleurs :

[ 1*1

C n1-1lY

E ply I

7n2= cny1 + p]‘“’ )

ensuite on calcule l’expression suivante :

C n2 Cn& _ 4(4 + Y). . [4 + r(n2 - I)l .“+!LFF

-11-r -l,y (1+7)...Il+%n2-1)1

Cette dernière expression est plus délicate à étudier et désignons par ak le terme général dansle dernier membre :

q+-Yk 1- P-=ak= 1+yk 1+yL

ce terme tend vers 1 quel que soit k par valeurs inférieures à 1. Prenons le logarithme de W,nous avons :

log,(W) = 51 gj=l O e(l-$+gjf&ï&

1%,(W) z -p; log,(l + rn2) = -p log,Y ( >

1+;

or f = Xp, de là on tire : W = [ &]P’, en définitive, on aboutit au résultat :

P(nl, n) + C-,xn1 [/q [LJ.1 + p

12.8. La loi binomiale négative (reprise et applications)

Les questions a, b, c et d ont fait l’objet d’une réponse lors de l’étude du problème précédent.

e - Voici les résultats du calcul :

ml = g = 1,15, puis m2 = g = 3,597, et s2 = 2,282.

538

Page 517: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ETEXERCICES

Tableau 1.4.

k expériences Pk* Pk bk* -Pk)'/Pk*

0 7 0 0,467 0,318 0,475 x 10-l1 3 8 0,253 0,364 0,487 x 10-l2 1 7 0,133 0,209 0,434 x 10-l3 1 0 0,067 0,080 0,252 x 10-24 9 0,060 0,023 0,228 x 10-l5 3 0,020 0,005 0,45 x 1ow26 2 0,013 0,001 0,111 x 10-l7 1 0,006 0,000 1 0,6 x 10-2

8 et plus 0 04 04 04

f - Bien que mi et s2 soient notablement différents, envisageons la distribution de Poisson enprenant X = mi, on obtient le tableau 1.4.

Pour la valeur expérimentale du x2 ; on obtient 31, la consultation des tables du x2 à (9 - 1)degrés de liberté (attention la case k = 0 compte...) montre que la probabilité de pouvoirdépasser ce nombre est inférieure à 1 chance sur 1000. Force nous est de rejeter l’hypothèsed’une distribution de Poisson avec moins d’une chance sur 1000 de la rejeter à tort.

g - On a : p = mila = 0,5024, par suite q = 0,4976 et r = 1,158. Réécrivons la loi binomialenégative :

pT(l - q)-1‘ = PT c ci+,-,q” = 1.k=O

On calcule pT = 0,450 7, il reste à calculer les différents coefficients du binôme que l’onmultiplie par pr (cf. Tab. 1.5).

Tableau 1.5.

k expériences Pk* Pk lo3(Pk* - Pk)'/pk*

0 7 0 0,467 0,450 7 0,5811 3 8 0,253 0,259 6 0,1722 1 7 0,133 0,139 4 0,3083 1 0 0,067 0,073 0,5374 9 0,060 0,037 8 8,0665 3 0,020 0,023 0,456 2 0,013 0,014 0,0087 1 0,006 0,008 0,666

8 et plus 0 04 w 04

539

Page 518: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

En définitive, on trouve x2 = 1,618 à (9 - 3) degr és de liberté (on a calculé p; 9 et r). Si l’onregarde les tables du x2 on voit qu’il y a 95 chances sur 100 de dépasser la valeur calculée. Iln’y a pas de raison de ne pas conserver cette loi.

12.9. Loi de Poisson. Durée de vie d’un système simple. Fiabilité

a-

1 . X = 0,5 PI = 0,5 exp( -0,5) = 0,303

2 . x=2 PI = 2exp(-2) = 0,271

3 . x=2 Pu = exp(-2) = 0,135

4 . x=2 Pz = 2exp(-2) = 0,271 puis P = 1 - Po - PI - Pz = 0,323

5 . x=4 P4 = $ exp(-4) = 0,195.

b - Pk(t) = [(Xt)k/k!] exp(-Xt). 0 n écrit : F(t) = P([ < t), et la probabiliti: pour qu’il n’yait aucun événement dans l’intervalle de temps t débutant à l’instant ti est P”(t) = 1 ~ F(t) =exp(-Xt), ce qui donne F(t) = 1 - exp(-At) et la densité de probabilité f(t) = Xexp(-At).

Calcul de la moyenne

CL= tXexp(-Xt) dt,

après une intégration par partics on obtient : a = 1/X.

Calcul de u2oc

D =J’

t2Xexp(-Xt) dt = G,

0

d’où

1 1a2=D&x-.x2 x2

Une propriété remarquable - On écrit le théorème concernant le produit d’événements : P(A.B ) = P ( A ) . P(BIA), d ‘où la probabilité conditionnelle P(BIA) = P(A B)/P(A) = Q(t).Comme P(A . B) = P(T < < < t + 7) = F(t + 7) - F(r) et que par ailleurs :

P(A) = P(J > 7) = 1 - P(< < 7) = 1 - F(7);

on obtient en définitive :

a(t) =F(t + 7) - F(7) .

1 - F(r)

Enfin, remplaçons F(t) par sa valeur : Q(t) = 1 - exp(-Xt) = F(t).

540

Page 519: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

12.10. Durée de vie d’un système. Loi de Weibull. Fiabilité

a - Nous pouvons écrire :

F(t) = P(< < t) = no - n(t) = 1 n(t) (j’()ù : n(t)n”n0 ’

~ = 1 - F(t).n0

À présent ajoutons et retranchons no au numérateur de X(t) :

Wt)X(t) = -non(t) + no - n(t + At) = F(t) ~ F(t + At) ~dt

An(t) Atn(t) n ( t )

b - De ce résultat on déduit l’cquation diffcrcntielle du premier ordre a laquelle obéit larépartition F(t) en fonction de X(t) :

dF(t)dt + X(t)[l ~ F(t)] = 0.

c - L’intégration donne : log,[l ~ F(t)] = si X(z) dz, d’ou :F(t) = 1 - exp

d - À present, A(t) = XOcxtCYpl, il s’ensuit que : F(t) = 1 - exp (-Aot”), d’où la loi de Weibull :

f(t) = XOCvtapl exp(-Xot’“).

e - Calcul de ü; nous avons :

00

a=s

tAo&"-l exp( -A#) dt,

0

après une intcgration par parties on trouve :

Calcul de D moment non centré du deuxième ordre, il s’effectue selon le même procédé :

cc

D =J’t2XomY' exp(-Xot”) dt,

0

on en déduit :

La densité de probabilité établie au 5 b du problème précédent est un cas particulier de la loide Weibull dans laquelle il suffit de faire a = 1.

541

Page 520: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

12.11. L’inégalité de Kolmogorov

a - L’inégalité de Bienaymé-Tchebycheff est démontrée dans le cours.

b - Partons de l’égalité :

+CCE(X2) = J X”~(X) dz = J X”~(X) dz + J &(x) dX>-cc lzlla M>a

la première intégrale du second membre est majorée par a2 J, ,~ f(x) dx, d’où l’inégalitéz a

demandée :

expression dans laquelle a est compris entre 0 et B.Si 1x1 > a, il reste néanmoins que 1x1 < B. En désignant par F(x) la fonction de répartition

de la variable aléatoire x, on obtient les relations suivantes :

F ( x ) = 1 s i x>B

F(x) = 0 si x < -B,

on peut écrire la suite d’inégalités :

J X~~(X) dz < B2 J f(x) dz < B2 J f (xl dxa<lzl<B a<lzl<B M>ad’où il ressort que la dernière intégrale n’est rien d’autre que B2P(IXI > a). En remarquant

que : J,,I f(x) dx < 1, on en conclut que :z a

E(X2) 5 a2 + B2P(JXI > a),

soit encore :

P(IXI>a)>E(X2) - a2

B2 .

12.12. Loi quasi normale

a - On a E(Y) = 0 l’écart quadratique moyen E(Y2) = cr2, E(Y3) = 0 et E(Y4) = 3a4.

b - Ona:

f(x) = &(ax’+ bx - 3a)2exp (-$) :

542

Page 521: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

s

+oOoù f(x) est une fonction manifestement non négative, la condition f(z) dz = 1 impose la

-00relation : 6a2 + b2 = 1. Ensuite on calcule les différents moments :

E(X) = 6ab - 6ab = 0

E(X2) = 6a2 + 3b2

E(X3) = 12ab

,9(X4) = 24a2 + 15b2.

La condition E(X4) = 3E(X2)2 impose une autre relation :

24a2 + 15b2 = 3 (6a2 + 3b2)2 ,

à laquelle nous combinons la condition de normalité 6a2 + b2 = 1 pour obtenir :

36a4 - 14a2 + 1 = 0,

d’où nous tirons :

a2 = 0,295 ou encore a2 = 0,094.

On peut choisir entre les deux valeurs de a2, car b2 doit être positif, ce qui entraîne quea2 < 1/6 = 0,166 donc a2 = 0,094.

Dans ces conditions, b2 = 0,346 et g = 0,642.

13. La fonction caractéristique

13.1. (v)’ tend vers une gaussienne quand n croît positivement

a - La fonction caractéristique d’une variable gaussienne centrée réduite s’écrit :

dx = exp (-27r2t2)

c’est, bien sûr, une gaussienne.La variable v est la somme de deux variables gaussiennes, centréës, réduites et indépendantes,

alors sa fonction caractéristique est G(t) = p”(t) = exp(-47r2t2). G(t) est la transformée deFourier de 1/(2&) exp (-t2/4) et 1 ‘on retrouve bien le théorème d’addition des variantes :c2 = 2 (cJ chapitre 21).

b - À présent il suffit de faire une transformation linéaire x = (y - m)/a dans la fonction dedistribution, on écrit : +CCP(t) = & s exp(j2nyt) exp (-!“;;12) dy,

-cc

543

Page 522: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

et l’on pose z = (y ~ m)/ cr cc qui donne y = gz + m et dy = cr dz. On obtient donc :

dz

+CCexp(j2?rtm)

I’

2

6 &exp(j2x0zt) e x p ~T d z .

( 1

p(t) = exp(j2Ttm)cp(at) = exp(j27rtnl) exp(-27r202t2), (1.7)théorème dé,j& établi dans le cours.

La fonction caractéristique dc la variable 7 qui est la somme de deux variables gaussiennesindépendantes est donc le produit des fonctions caract,éristiqucs de chaque variable :

Q(t) = exp[j2 t(r ml + m2)]p(a~t)cp(o2t) = exp[j2&(ml + mz)] exp[-2T2t2(of + ai)]

on voit qu’il suffit de poser m = ml + m2 et CT~ = a; + a; pour retrouver l’expression duthCorCmc (1.7). Donc la distribution de 7 est :

f(Y) = l exp - [Y - ml - m212J27r(aT + c;) ( a(4 + a$) 1

c - La génkralisation n’est pas très difficile, on obtient, :

d - Il s’agit de la fonction fente et la fonction caractéristique s’écrit : p(t) = [sin(ntLa fonction caractéristique de la variable E/n donne : $(t) = [sin(-irt/n)]/(&/n) (attention, ilne s’agit pas d’une dilatation d’abscisse...) et la fonction caractéristique dc la variable aléatoire

7 = i 2 xk s’kcrit :

Développons

autrement dit, Q(t) = Aexp [-t2/(202)], ce qui veut dire que la densité de probabilité estgaussienne. Cela mérite un commentaire supplémentaire, en effet, on voit très bien que lavaleur 0 croît comme fi; mais cela est conforme au théorèrne d’addition des Q des variablesindépendantes. Plus la somme des variables est klevke, plus u croît. Il peut être alors utiled’effectuer un changement de variable pour conserver une échelle raisonnable.

Il résulte de ces calculs que l’on connaît le comportement asymptotiquc de la fonction[sin(x)/xln qui tend dont vers une gaussienne. Lorsque n est u11 ordre de grandeur plus grand que1, disons 10 environ, l’écart entre les deux fonctions cn valeur absolue est de quelques millièmes.Ce théorCme n’apparaît pas explicitement dans les ouvrages d’analyse. Le programme card0. créalise les opérations proposées.

544

Page 523: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ETEXERCICES

14. La loi du x2 et la loi de Student

14.1. Le test de Pearson

a - On développe la fonction caracteristique de plusieurs variables :

P(~I, t2,t3, . . , tm) = M[exp(j (tlX1 + t2X2 + t:3&, . . , t-t,,,&,>)]

en série de MacLaurin-Taylor, au préalable on s’intéresse au dévcloppcmcnt dc :

Xkexp(jt,X,) = f?J”$ti = lt j$tq x4 2

k=O .- +,+-.

puis au produit :

fiexp(.jt,X,) = fi iX2

l+.j~tq-$t;+-i

‘VL

q=l y=1= 1 + j c x,t, ~ ; 5 x;t; + . j

q=l

et enfin à la fonction caractéristique :

= 1 + jM[X&l + jM[x,]t, + '.

Nous avons le dcvcloppement direct de cp(tl, t2, t:j, . . . , tm) :

pour {tP} = 0.

Par identification, on obtient :

+- = jMLQ1 e t

a29at,

dt2 = -AJ[Xi] p o u r {tq} = 0 .

b - Si l’on spécifie l’ordre dans lequel les cas doivent se succéder :

P(Y1=n1,Y2=122 )...) YT=n+p;1p;2 )...) py,

En revanche, si l’ordre n’a pas d’importance, il y a ré! combinaisons de n éléments ; seulement,il doit y avoir 121 éléments dans Ii, na éléments dans I2, 12, éléments dans 1,. Il y a donc ni!combinaisons dans 11 et n,! combinaisons dans 1,. lesquelles ont déjà été factorisées dans n! ;donc le coefficient qu’il convient d’appliquer au cas où l’ordre est spécifii: est :

n!nl!n2!. . n,!

dc là on tire la loi dc distribution multinomiale :

P(Yl = 7x1, Y2 = 712, . , Yr = n,.) = n!n1!n2! . . n,!

pT’p;2,. . ,py.

545

Page 524: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

c - Nous avons Yp = Et=, 2: = nombre de fois que Xk appartient à Iq. La fonctioncaractéristique associée à cette variable s’écrit :

et Comme P (24 = 1) = pk et comme P(zz = 0) = 1 - pk, on peut écrire :

(pq(tl,t2,t3,. . , b) = Cpk ew(jtk).k=l

La fonction caractéristique d’une somme de variables aléatoires indépendantes est le produitdes fonctions caractéristiques de chacune des variables aléatoires, donc, ici, comme elles onttoutes la même fonction de distribution, on peut écrire :

(P(t1,t2,t3,. ..,h) = -&P[ k=l k exdh)] n

d - Il suffit de dériver la fonction caractéristique pour obtenir les moments désirés :

Pour {tq} = 0.

comme cLT1pk = 1, on trouve : mlq = np, (ce résultat aurait pu être obtenu directement).Ensuite, par le même style de calculs, on montre que :

d’où on déduit l’écart type :

u2 = nP,(l -PS)

a est proportionnel à J”pa donc U, est une variable centrée réduite indépendante de n.

e - Écrivons la fonction caractéristique de U, :

(P(tl>tz,t3,. . . , tr) = M ex[ P(+Jqtq)] =-[exp(3r;y~k)]

=w (-i~W%) A4 [exP(~$&tq)]

=ew (-jT;WK) [$%exP(j&)]n

= [-p (-jgbE) gpqexP (j&)]‘.

5 4 6

Page 525: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ETEXERCICES

Posons

puis développons chacune de ces quantités pour n tendant vers l’infini :

B q = p q 1+j-( 1 t2& - 5 n p ,

Q+...

)

ensuite :

Revenons au produit AB :

reste à élever ce dernier résultat à la puissance n :

on en conclut que la variable U (vecteur) obéit à une loi gaussienne.

-&uqfi=g yqJ-pq =n

q = l

+$Yq-di$Pq=+ [p-j =O

Remarque importante - Les variables U, obéissent donc à une liaison linéaire. Cela ne signifiepas pour autant qu’elles ne sont pas indépendantes; en effet, les probabilités sont théoriquescar les variables obéissent à une loi de distribution théorique, et l’apparition d’une variable nedépend aucunement de l’apparition de celles qui précèdent leur tirage.

f - Chacune des composantes indépendantes U, tend donc vers la loi normale, alors la variablex2 = xi,, Ui est bien la somme des carrés de variables gaussiennes, centrées, réduites etindépendantes (à une constante multiplicative près). Comme la loi statistique théorique imposeune contrainte c’est-à-dire que E;T1 U,& = 0 ou que Ci=, Yq = n, on perd un degré deliberté, il reste donc (r - 1) degrés de liberté.

14.2. Le test de Student

Papproche - L’inégalité de Bienaymé-Tchebycheff donne :

P(I(2) -ml > ta) I $,

et l’on désire que cette probabilité soit égale à O,l, ce qui donne t = a.Par suite : I(x) - ml = s&3 = 11,54 cm

547

Page 526: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

2eapproche - Nous avons :

et par ailleurs :

(Xi - (x))” = (Xi ~ rn)Z - m2 + 22, + (x)m2 - ~CC~(X),

enfin :

CT 2 = ,11 -&Xi - (x))” = ,’a=1

1[2(x7, - m)2 ~ n(m ~ (x))”i=l 1

Remarque : On a aussi a2 =

des zi, on peut aussi écrire :

n(x)“) et comme cr2 ne dépend pas de l’origine

m)’ - n((x) - m)2]

a - L’opération orthogonale s’effectue sur les vecteurs orthogonaux (XL -UT,). Il y a conservationdu carré scalaire, soit :

12. nxx: = X(xi - m)2.i=l a=1

b - La dernière équation de la transformation donne :

XL = & gcxt - m) = &(qx) - ML),2-l

d’où :

c - Comme

g2-- ,‘15 [(xi - m)2 ~ 7x((x) - m)2] ,i=l

on obtient :

d - Les variables (xi -m) sont normales, centrées, indépendantes et de rnême variante, il en estde même des variables xi obtenues par la transformation orthogonale qui conserve les longueurset les angles.

548

Page 527: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXER.CICES

e - Ona:

cette dernière expression est bien la définition d’une variable de Student à (n - 1) degrés deliberté (cf. le chapitre 22). Autrement dit, P[t < t,(n - i)] = o ou encore :

P[t > tcx(n - 1)] = 1 - (Y.

f - Puisque P( / t 1 > te) = 1 - cy, cela entraîne :

p

(

d4fx) ~ ml > t”

)=1-a,

u

soit encore :

p d4(x) - ml > t.( ) (= P I(x) - ‘1111 > t”s = 1~ a.u 1

La condition

a la probabilité (1 - cy) de se réaliser. Attention aux valeurs absolues qui doublent l’intervalle!

g - On veut que 1 (zr) - ml appartienne à 1 avec 90 chances sur 100, donc

P(I(x) -ml < 1) = P i(x) -ml < to,os(n, - l)% = 0, 1 0 .

3,65Comrne ta,as(19) = 1,729, on en déduit que 1 = 1,729-

m= 1,4 (il s’agit de cm)

3=approche - Si l’on admet que t obéit à une distribution gaussienne, nous avons :P(if < to) = û: avec to = 1,645, il s’ensuit que 1’ = 1,645 x 3,65/m = 1,34 (cm).

La morale de cette histoire tient en peu de mots : l’inégalité de Bienaymé-Tchebycheff convientpour toutes les lois de distribution c’est donc la plus pénalisante avec une erreur de 11,5 cm qui,il faut bien le dire, est peu significative ; le choix a priori d’une distribution gaussienne est trèsraisonnable puisque les données sont au nombre de 20, cependant, on va trouver une erreur unpeu optimiste (1,34 cm) car le nombre de degrés de liberté n’est quand même pas très éleve; lecalcul rigoureux effectué avec la distribution de Student donne le bon résultat : une erreur de1,4 cm ce qui est peu au-dessus de l’erreur gaussienne. Sans avoir recours aux tables, on peutd’ores et déjà affirmer que la loi de Student tendant vers la loi de Gauss quand le nornbre dedegrés de liberté tend vers l’infini donnera le résultat : t0,05(co) = 1,645. Au-delà d’un nombrede degrés de liberte de l’ordre dc 50, la distribution gaussienne remplit bien son office.

549

Page 528: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

15. Systèmes à plusieurs variables aléatoires

15.1. Système linéaire surdéterminé. Matrice de corrélation

Voici les résultats :

(x) = 4 u2 = 2,2

(Y) = 349 o2 = 4 26y(z) = 2,24 u; = 0175

a - Calcul de

on trouve -7,2 xizi = 9,06, d’où :i=l

rp = 0,078.

b - Calcul de

; g XiYi - (X)(Y)

rz=l

zy = 1UXUY

on trouve -:z: xiyi = 15,4, d’où :i=l

rq = - 0 , 0 5 2 .

c - Calcul de. n

fc GYi - (Z)(Y)

ryz =i=l

>UZfJ?J

ziyi = 10,17, d’où :

rq = 0,818.

Étude des liaisons de corrélation : on teste l’hypothèse r = 0, et l’on calcule :

Page 529: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXEI. CORRIGÉS DES PROBLÈMES ETEXERCICES

Si ct < t,(n - 2), on rejette alors l’hypothèse d’une liaison de corrélation avec la probabilité cy.de la rejeter à tort. On a ts,os(n - 2) = 1,86 d ont on accepte l’hypothèse d’une absence d’uneliaison de corrélation entre les variables z et z d’une part et 5 et z d’autre part. Seule la liaisonentre les variables y et z est significative. En clair voici ce que signifie cette étude :1. il n’y a pas d’impôt perçu sur les personnes ;2. la taille d’une famille n’est pas liée à sa richesse;3. les impôts perçus ne dépendent que de la quantité détenue.

16. Critères de conformité

16.1. Étalonnage d’un appareil de mesure

a - Calcul de la moyenne :b

puis calcul de :

m =s

&xdz = ;@+a),

a

d’où l’on tire :

g2-D~m2&&2 b - apuis 0 = ~

2J3’on remarque bien que a et b jouent des rôles identiques.

b - On obtient le système :

b+a=2m

b-a=c2&

sa résolution donne : a = m - afi et b = m + afi. Numériquement, nous trouvons :

m = 60,25D = 4079u2 = 448,93 et u = 21,19

a = 23,55b = 96,95.

De là on tire la probabilité de tomber entre a et b : f(x) = l/(b - a) = 0,013624 d’où letableau 1.6, page suivante, des probabilités théoriques.

Nombre de degrés de liberté = 8 - 2 - 1 = 5, les trois contraintes étant le calcul de a et bainsi que la normalisation de la distribution.

où K est le nombre de cases de regroupement.

551

Page 530: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

23,55 3 0 4 0

Tableau 1.6.

5 0 6 0 7 0 8 0 9 0 96,95

mi 2 1 7 2 6 6 3 8 5 1 5 6 6 4 3 2m& 35,15 54,5 54,5 54,5 54,5 54, 5 54,5 37,87

En consultant les tables, on trouve une probabilité inférieure à une chance sur mille de dépassercette valeur, on ne prend pas beaucoup de risques en rejetant l’hypothèse d’une distributionuniforme.

16.2. Tests d’hypothèse

a - Les résultats des calculs sont presentés dans tableau 1.7.

Tableau 1.7.

mi intervalles Pi* pi* cumulés var. c. r. Wx) A@(x)

1 82

2 03

2 29

2 41 2

2 62 7

2 81 6

3 07

3 22

3 42

3 6

0,025 0,025 0,014 5-2,185 0,014 5

0,037 5 0,062 5 0,045 6-1,154 0,060 1

0,112 5 0,175 0,118-0,923 0,178 1

0,15 0,325 0,208 5-0,292 0,386 6

0,337 5 0,662 5 0,250 10,339 0,636 7

0,200 0,862 5 0,197 20,970 0,833 9

0,087 5 0,950

0,975

14

0,099 41,601 0,933 3

0,025 0,053 92,232 0,987 2

0,025 0,012 8

-2,815 0,002 4

2,863 0,997 9

Notation - le terme « variable centrée réduite » a été abrégé en var. c. r. Par ailleurs, a(x)désigne la fonction de répartition. Pour évaluer les moments, on a pris le milieu des intervallesde regroupement.

On trouve alors : m = 26,92 m, puis D = 735 m2 et enfin CT = 3,17 m.

552

Page 531: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

b - Les deux premières cases de regroupement ainsi que les deux dernières ne possèdent pasassez de représentants, donc on va regrouper les deux premières cases en une seule d’une part,et les deux dernières en une seule case d’autre part.

c - Le tableau 1.8 donne les résultats des calculs.

Tableau 1.8.

Pi lApi 103 pz cumulés pi cumulés lA@1103mi intervalles Pi*

1 85 0,062 5 0,060 1 2,4 0,062 5 0,060 1 2

229 0,112 5 0,118 5,5 0,175 0,178 1 3

241 2 0,15 0,208 5 58,5 0,325 0,386 6 62

2627 0,337 5 0,250 1 87,4 0,662 5 0,636 7 2 6

286 0,200 0,197 2 2,8 0,862 5 0,833 9 2 8

307 0,087 5 0,099 4 11,9 0,95 0,933 3 1 7

324 0,050 0,066 7 16,7 14 14 w

36

d - XObs = 7?, &Ii - PZ)“/Pl = 4,24 où K est le nombre de cases de regroupement, K = 7.i=l

e - Comme la loi normale impose deux contraintes auxquelles il faut ajouter la contrainte denormalisation, le nombre de degrés de liberté est donc K ~ 3 = 4. La consultation des tables dux2(4) donne, par interpolation linéaire, environ 37 chances sur 100 de pouvoir dépasser ce seuil.Il est clair que l’on conserve l’hypothèse d’une loi normale car les données ne contredisent pascette hypothèse.

f - Le test de Kolmogorov donne : u = suplA@l = 0,062. Donc 1 = vfi = 0,555. La probabilitéque l’écart maximal entre les deux répartitions soit non inférieur à 0,555 est 92 chances sur 100.Ce test ne comportant pas de degré de liberté est notablement plus optimiste que le critèredu x2.

17. Étude des dépendances dans le cas linéaire

17.1. Test d’indépendance stochastique du tirage d’un échantillon

Partie 1. a - La probabilité de tirer une sous-chaîne de longueur p est : P = (1/2)/“, le théorèmede référence est celui des probabilités composées.

5 5 3

Page 532: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Calcul de la moyennecc 1 @

m = c 0p 2= 2.

p=o

Calcul de

d’où a2 = 2 et (T = fi.

c - Longueur moyenne des chaînes : XK = Km = 2K.

d - Soit P la probabilité que wj > Mo. Soit Q = 1 - P la probabilité qu’il n’y ait aucune chaînetelle que vj 2 Mo. La probabilité p pour que uj > MO est donnée par la relation :

pEk~o(@k= (;)“‘(,+;+;+...) = (;)“‘-‘,en faisant usage du théorème des probabilités totales. La probabilité pour que vj soit inférieureà MO est donc : q = 1 - p = 1 - (1/2) MO-1 Comme les K sous-chaînes sont indépendantes, la.probabilité de ne pas réaliser au moins un événement est donc : Q = (1 - P)~, d’où il ressortque :

P=l-Q=l-(l-p)K=l- l-[ (:)“-‘lK.

Si K est assez grand ou encore si (l/2)“o-’ est assez petit devant l’unité, on peut écrire que :

0

Mo-1P=K ; .

Application numérique - K = 10 et MO = 8, on calcule alors : P = 0,078 par la formuleapprochée et P = 0,075 4 par la formule rigoureuse.

e - Avec la formule approchée : P = 0,05 et Q = 0,95, et :

035 < [l- (9”“‘1^

ce qui entraîne que K(l/2)“O-1 < 0,05, et comme K = n/2, on obtient :

Avec la formule rigoureuse :

log,(O,95) 2 K~W, [b (:)““-‘1.

À partir de maintenant, pour obtenir MO il faut réaliser des approximations qui vont conduireau même résultat que celui précédemment obtenu.

554

Page 533: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ET EXERCICES

Application numérique - n = 100. On trouve alors Mo < 11. Avec l’expression donnée dans lecours on a Mo = 10.

Partie 2. a - Comme K est grand devant l’unité et que XK = Km = 2K, on en déduit queXK est grand devant l’unité.

Nous avons : < = ~~=r lj les lj étant indépendants, C 2 = Ko2 = 2K d’où : C = a. Lethéorème central limite nous dit que la distribution de 6 est gaussienne ; à partir de là on peutécrire la distribution de < :

f(x) = & exp [- (x $F’2] ,

d’où l’on déduit que :

VO1

P(J < vo) = ~C&G s [

e x p -(x - Ad22x2 1 <ix=-& 7 exp(-z) dz,

-cc -m

puis encore :

P(< > vo) = 0,05 = & 7 e x p (-f) dz,

VO - 2Krnin

dzz

d’où il ressort :

La résolution de l’équation du second degré donne une seule racine positive :

Kmi, = (-1,65 + ,,‘2,723 + 4~~)~

8 ,

par conséquent on doit avoir K > Kmi,.

Application numérique - n = 100. On trouve alors Kmi, = 42. L’expression donnée dans lecours fournit le nombre 41. Soit d la différence numérique entre les deux tests :

avec a = 1,65 en effectuant les développements usuels :

Page 534: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Chacun des deux tests a fait l’objet d’un calcul concernant l’exploitation d’une certainedistribution. Si les deux tests sont utilisés ensemble, il faut alors calculer la probabilitéconditionnelle de la réalisation du second test sachant que le premier s’est réalisé. Les chosespeuvent être corrigées dans le sens suivant : on sait, à présent, que toutes les chaînes ont unelongueur inferieure à MU. Approximativement: la moyenne est donnée par l’expression :

Pour &Ja > 16, l’erreur est de l’ordre de 5 10W4 par rapport à la solution asymptotique. Parailleurs, on calcule le moment du second ordre :

0=2+4Mu - si@ J!r;

~ ~21Lf,)-l 22Mo-2

À partir de là, on retrouve le thcorème central limite, et l’on peut effectuer les développementstraditionnels.

17.2. Loi F(m, 1). Étude du rapport de deux variantes : loi de Fisher-Snedecor

1. - Distribution de t2 = l/( m ~ 1) x’& <,F, chaque [z indépendant obéit à la distribution :

ml(x) = l x2-exp -~ ,LTfi ( >2&J

chaque <: obéit à la distribution :

P(Y) = & exp Y(>2

si y > 0 et p(y) = 0 si y < 0. Calculons la fonction caractéristique de <L

+‘X +oO

J’ pk(x) exp(jtz) dz = ~

0

x-‘/’ exp(-z) dz = I’(1/2) Ivqïzgj = (1 ~ 2jt)-‘/2

Il s’ensuit que la fonction caractéristique de la variable aléatoire (m - l)r2 s’écrit :

a(t) = (1 - 2jt)-““‘2 pour t E (-00, +oo).

Pour obtenir la fonction de distribution, il n’est pas utile de calculer la transformée de Fourierinverse, pour cela il suffit de remarquer que :

+CC

As

,w+1 exp exp(jtx) dz = (1 ~ 2jt)-““/2,0

Page 535: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES ETEXERCICES

A étant un coefficient de normalisation. Donc la densité de probabilité de la variable aléatoire(m - l)<” s’écrit :

p(z) = A~("'"/~)~~exp pour z E (O,+co).

avec

A= 12"'/T(rn/2) .

d’où l’expression :

Nous avons donc :

1

p(x) = ‘p/2qm/2)x(4+1 exp -: .

( >2

1

2'+T(m/2)&42)-1 exp -5

( >2L!T) (1 - 2jy4.

La fonction caractéristique 4(t) de 1 a variable aléatoire t2 s’exprime en fonction de CC~~C de(m - 1)c2, c’est-à-dire :

Q(t) = @ (A) = (1 - 27;;;1=i)pm’2 pour t E (-co;+oo).

Il suffit d’appliquer le théorème de dilatation d’abscisse sur les transformées de Fourier pourobtenir la densité de probabilité p(z) de la variable t2 :

avec u = (m - 1)) ce qui donne :

cm - w2 pn/Z)-1R(z, m) = 2”“/2q42)

2. a - La loi de distribution de TI est immédiate :

(n ~ w2 ,(~,~,/a)-1pTJ(z, n, = yt/2r(n/2)exp (pp)

b - La distribution de w = u/u qui est le rapport de deux variables positives et independantesu et v de distribution pu(u) et pu(u) est donnée par l’expression établie en cours :

cc

P,(x~)P~(x)x dz.

c-

557

Page 536: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

avec

B = (n - w2 cm - lF2 Jm/2)-1

2”/T(n/2) . 2”/T(m/2) .

En poursuivant les calculs :

pZ(z) = B2(“/2)-1 m,b42)-1 exp (_ (m -21)zx) r&d2)-1 exp (_ (n ; ‘lx) x dzJ0

= Bz(“/2)-1 J p/2+(n/2)-1exp { -;[n - 1+ (m - l)z]} dz,

0

alors, en posant r = (2/2)[n - 1 + (m - l)z], on obtient

2rdz =

2 drx= n-1+(m-1)z

etn - 1 + (m - 1)z

puis :

= B&‘+-1 [(n - 1) + (m _ l)z,-v (2)vM (m+n)J r2-1 exp(-r) dr

0

soit encore :

pz(z) = Bz (m+n)WW[, - 1 + (m - l)z]7 (2)(“+“)/2r .

Réécrivons tous les termes :

Nous allons encore nous livrer à quelques petites manœuvres en posant y = (m - l)/(n- l)z,mais attention aux changements de variables dans les lois de distribution cardy/ dz = (m - l)/(n - l), en définitive, on trouve :

p (y) = (n - l)“/+rL - l)“@ 72 - 1 (m’2)-1z

w2)r(~/2) ( >m - l

x yw2)-yn - l)-qyl+ y)-y r(F)(s).

soit encore :

r(y)pdy) = r(n/2)r(m/2)y

f-y1 + y>-v

5 5 8

Page 537: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ET EXERCICES

d - Calculons la moyenne de y que l’on note (y) :

(Y) =r (yq

r(nPPYmP) J

CUÿypyl + y)-lEp mydy=B(~+l+)=-

0

n - 2

e - Calcul de

r (=+$yD(y) = r(n/2)r(m/2)

dy = B (7 + 2,; - 2)

0

m(m + 2)(n - 2)(n - 4) ’

d’où l’on tire

2m(m+n-2)f72 = (n - 2)2(n - 4) .

f - Le nombre de degrés de liberté : chaque variable a m et n degrés de liberté et il fautdénombrer les contraintes; il y en a une par variable pour le calcul de u2. Donc la loi est à(m - 1, n - 1) degrés de liberté.

g - Montrons que Fr-,(m,n) =1

Fa(n, m)(attention m et n ne jouent pas des rôles symé-

triques) :

r (v) Oo yy-l(l + y)-@$? dy,

dy = r(n/2)r(m/2)BmaxJ

après avoir abandonné le coefficient devant le signe somme qui n’es: d’aucun intérêt ; effectuons

un changement de variable dans la seconde intégrale à savoir y = -, on trouve :X

100 B

(y’ =J

0max

yy-I(l$ y)- 2 dy =J

x?-1(l +.)-y dz,

&I~X 0

BminBmax = 1, ou encore : l/Bmax = Fa(n,m) mais par ailleurs :

B,i, = F,(m,n) e t EL,, = FI-,(m,n)

et par conséquent :

1- = F,(n,m) =1

Bm a x Ji-,(m, n)

559

Page 538: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

18. Analyse de régression-corrélation

18.1. La distribution gaussienne à deux dimensions. Coefficient de corrélation

< ~ ml,a - On a évidemment : z = ~ ety=-.0x 0.v

b - On doit avoir

+oO +CG@(x,y)dzdy=l=A

X2 - 2cvxy + y2PL

dx dy;

-cc -m

pour calculer cette intégrale, on effectue un changement de variables :

/3s =x-cxy e t /Jr = yJïZ3~

qui conduit au jacobien :

J = 3x7 Y) - P2tqs,r) JCG? .

Ainsi, on obtient :

+oOSJ’

2l=A exp( -s2) exp( -r”) dr ds = AJ;i(ï”.

-cc

c - La fonction de répartition s’écrit simplement :

p(u,w) = Fexp [-f(x - 2oy)‘] exp [-$y’(1 ~ o’)] ,

cxprcssion à partir de laquelle on tire :

+CC +CC

Qz(x) =s

p(x, w) dv = A / exp [-$(x - 2ay)‘] exp [-ky?(I - 02)] dy

d - Pour que Q,(x) soit la loi normale réduite, il faut que p2 = 2( 1 - 02). Comme II: et yjouent des rôles symétriques, forcément, y obéit à la loi normale réduite si x obéit à la loinormale réduite.

560

Page 539: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ETEXERCICES

e - Calcul de la covariance :

et on effectue un changement de variable identique à celui du 5 b seulement ,G’ est remplacé parsa valeur du 5 d. On établit que : KxY = o, c’est la covariance de x et y mais aussi le coefficientde corrélation car les variables sont centrées et réduites ce qui impose que les écarts quadratiquessont égaux à 1.

Dans le cas où a = 0, 9(x,y) = *z(x)‘JXy(y) e t d ans le cas dc la loi normale, l’absencede corrélation entraîne l’indépendance des variables ce qui etait affirmé en cours mais nondérnontré.

f - L’expression de la droite de régression de y en x s’écrit : y = crx car il s’agit de variablescentrées.

g - L’équation caractéristique associée aux variables x et y est la transformée de Fourier àdeux dirnensions de la fonction dc distribution cp(u, II) c’est-à-dire :

+CCX(%V) =

X2 ~ 2axy + y2

P2exp[2rj(xu + y~)] dx dy,

-ccet pour effectuer l’intégration, on effectue les changements de variables suivants :

x ~ ayl”&=-

Pe t s+$:

soit : 5 = @fi + Ly.sJ!G

y=sdG,

transformations qui conduisent au jacobien (compte tenu du fait que ,@ = 2(1 ~ a”)) :

Ainsi, on obtient :

+CZ

x(u, w) = A* / exp( -w2) exp[2z-j(u@r&)] dr /exp(+rs2) exp[2Tj(oU + U)S&)] ds.

-00 -00

enfin :

x(u, w) = exp[-2n2(U2 + 2wuv + V”)I.

18.2. Étude d’un changement de phase. Analyse de régression

a - L’équation de la droite de régression Sr : Y~(X) = a1 + br(x ~ 1101) où :

563

Page 540: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Par ailleurs on connaît 20, donc on calcule Y~(Q) = ~1 + br(ze - 81) ; ensuite, on en déduitl’intervalle de confiance sur cette valeur estimée :

IAYI(Q,)~ I tala@5 - 2)&J

1 + (zo;z1)2.Xl

avec

ici, comme d’habitude, ta,2(NI - 2) est la distribution de Student à (Nr - 2) degrés de libertéavec le niveau de confiance (1 - cy). Attention aux valeurs absolues.

b - Nous avons le même résultat pour la droite 5’2 : Y~(Z) = 62 + b2(z - g2) pour cela, il &fîtde remplacer l’indice 1 par l’indice 2. En définitive, on obtient :

IAff = lAfi +

18.3. Mesure d’une température par spectroscopie

AK(xo)l.

a - Posons ZJ = log, [1~/(25 + l)] ainsi : ZJ = A - B[J(J + l)/T]. La pente de la droite derégression est donc ,B = -B/T et par ailleurs elle est donnée par le calcul statistique :

P = i=l naX, avec Xi = i(i + 1)

et

b - On a T = -B/P dont on déduit : /AT] 7 $]A/?] = $$A/3 avec :

lW = bp(n - 2)$:

s2 = ; g’” - Y(,,)12.z=l

5 6 2

Page 541: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE I. CORRIGÉS DES PROBLÈMES ETEXERCICES

18.4. Solubilité du nitrate de sodium dans l’eau

a - On écrit l’équation de la droite de régression : Y(z) = ti + b(z - 2) où :

avec 0: = i )JyTl(xi - 3)2 et ai = k CFEi(yi - y)” et aussi :

2 --xiyi - nxy

i = l>

nuxfly

F étant le coefficient de corrélation. On trouve les résultats numériques suivants :

3 = 26, a = g = 90,14, az = 21,24, oy = 18,51 et f 2 x~iy~ = 2 736,5i=l

ensuite on calcule : b = 0,871, F = 0,999. Il n’y a aucune raison de rejeter une liaison decorrélation puisqu’il y a quasiment une dépendance linéaire. La droite de régression s’écritdonc : Y(x) = 90,14 + 0,871(x - 26) = 67,5 + 0,871x.

Calculons à présent S2 = & ~~=,[xi - Y(x,)]’ = 0,805 d’où S = 0,805.

b - Pour x0 = 40, voici les résultats trouvés : y = 102,34 avec une incertitude :

[Ayl = *t012(7)-$J

1 + (xoi2)2 = *0,68 avec a = 0,lO.

Autrement dit, on a 90 chances sur 100 de tomber dans l’intervalle ]Ay].

19. Les fractions continues19.1. Calcul d’une fonction donnée sous forme d’une fraction continue

a - D’abord on calcule : pi/Qi = Ao, puis P2/Q2 = [AoAl + (x - ao)]/Al, et enfin :

p3

c3=Ao+

(x - ao)Az = AoAlAâ + Ao(x - ai) + A~(J: - ao) .

AI& + (x - R) AI& + (x - a)À partir de cette dernière expression, la démonstration des relations cherchées s’effectue par

récurrence ; les relations sont donc vraies pour m = 3, montrons qu’elles sont vraies pour m + 1.Il suffit de remplacer A,-1 par A,-1 + (x - am-l)/Am, dans les relations :

. P, = A,-1P,-1+ (x - u~-~)P,~~

Qm = Am-lQm-1 + (x - am-2)Qm-2

mais il est commode de former le rapport P,+i/Q,+1 :

~ = A,-IA, + (x - u,-I)P,-I + (x - am-a)Pm-2AmPmtl

Q m+l A,-IA, + (x - am-l)Qm-1 + (x - am-a)&+An&[A,-lpm-1 + (x - a,-2)Pm-21 + (x - a,-l)Pm-1

= &[A,-lQm-1 + (x - am-2)Qm-2]+ (x - am-l)Qm-1AmPm + (x - a,-$‘m-1

= &Qm + (x - am-l)Qm-1 .

5 6 3

Page 542: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

b - Nous avons : f(x) = f(xo) + [(x - xo)/l!]f’(xo) au premier ordre donc :

AO = f(xo) et A1 = fi;“) .

c - Utilisons la relation (que l’on ne demande pas de démontrer) :

A ~ (k + l)Ak-1Ic+’ ~ (k- l)+ A&$'

on calcule :

puis :

A3 = 3f’f2 c;

-3yy2 + 2f’2f”/ - Cl[é$ - CIQ] .

d - Étude de la fonction y = log,(l + x). 0 n écrit : df/ dz = l/(l + xc,), puis :

d2f _ 1 d”f 2

dx2 (1 + xo)2e t -=

dz” (1 + x0)3 ’

ct d’une façon générale :

d”f ~ ( n . - l ) ! .

dxTL (1 + x0)7L

Ensuite, oncalcule : Ao =log,(l+xo),Al = (l+q~),A2 = 2,A3 =3(1+x0).Pour calculer log,(x), il suffit de faire x0 = 0. Les relations de récurrence dorment :

Po = 1, Qo = 0, PI = Ao et QI = 1. En définitive, on obtient :

et pour x = 1, on trouve log,(2) z 0,769.

X2 x3 x4e - Le développement de log,(l +x) = x - - + - - - (au même ordre que pour la question

précédente) donne log,(2) FZ 0,583.2 3 4

L’erreur absolue sur le résultat donné par la formule de MacLaurin est 0,2 tandis qu’elle estde 0,08 sur le résultat donné par la fraction continue.

20. Éléments de traitement du signal

20.1. Détermination d’une constante de temps

a - On a V(t) = Aexp(-tut) avec cy = &.

Approche no 1 - On note les données (Vi, ti) pour i = 0, 1,2, . . , N. On prend le logarithmede l’expression précédente, ce qui permet de linéariser le problème :

log,(V,) = & = loge(A) - a& = a - CI$,

Page 543: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

ANNEXE 1. CORRIGÉS DES PROBLÈMES PET EXERCICES

n et <y sont les inconrmes du systhe linéarisé. N est d011c déterminl par la pente dc la droitedc rbgression de < eu t, à savoir :

(N+ l)& e<;t;i=oa=

(N$l)$ j

0iI < et t sont respectivement la moyenne des < ct des t, et SF est l’écart quadratiquc moyendes t. On trouve :

< = 3 , 0 5 0 , t= 5 e t e<,t, = 133,35 et, enfin sf = lO,O,i=o

011 trouve que a = -0,3126 et que z = s/(stdm) avec s2 = (l/N)[& ~ Y(tl)12, puis011 obtient : s = 0,01042 et z = 0,01405. Enfin, pour terminer, on trouve dans les tahlcs dcStudent : to.~,(9) = 1,156 après avoir effectuk une interpolation linéaire. De là on déduit, lavaleur numérique de ~CV = ztO.15(9) = 10,016 2. Autrernent dit, nous avons 70 c:hanccs sur 100de trouver CV dans l’intervalle :

-0,32884 < N < -0,29644.

Approche no 2 - Nous avons V = A + B cxp(Pt) t ‘1c 1 nous faut cakulrr A? B et /Y. On saitque les abscisses t sont en progression arithmi:tiquc dc raison At et de premier terme to, ainsi,les éql&ions discrétisées s’écrivent :

V, = A + B exp(&) = A + B exp[,3(to + iAt)]

en posant PL = exp(,!?At) et p, = A + B exp[/?(tO + iAt)] on obtient les bquations :

l4 = A + BpiV7+, = A + BpiuVz+2 = A + Bpiu2V?,+:s = A + Bpq~” etc.

À prhcnt, OII note Ai les difhenccs prcmikcs dc Vi à savoir :

A, = AD, = bi+l ~ b, pour i = 0, 1,2, . , n - 1,

cc qui nous permet d’écrire :

&=Bp,(u-1)

A,+l = Bp,(u - 1)~

kquations entre lesquelles on élimine Bp, cc qui donne : ,uA, = ATfl, on a (~2 - 2) équations decc type où % prend les valeurs 0, 1,2, . . , n ~ 2. À présent, on dCtcrminc IL par la mWiotlc desmoindres carres CII posant E, = ?LA, - A,+l,et 1'011 minimise la somme des carrés des résidus :

If--Z II -2E2 = CE, = c [u& - A,,,]“,

i=o i=o

565

Page 544: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

en la derivant par rapport à U, soit :

ce qui donne :

Comme TL = exp(pAt), on tire immédiatement : /? = & loge(u). À présent, on obtient A et Ben écrivant y~+ 1 équations (incompatibles) : V, = A + Bpi auxquelles on applique la méthodedes moindres carrés. On pose :

ct Ef2 = -&f = ?,A + Bpi ~ VJ”.i=lJ i=o

On minimise cette dernière expression par rapport à A et B ce qui nous donne un systèmelinéaire de deux équations à deux inconnues (cf. la droite de régression), on obtient en définitive :

(n + 1) CPL - CPi cpi%=O i=o i=O

1=0 i=O i=o

Application numérique - On trouve : b = -0,304 2 puis A = -0,756 4 ct B = 101,5.Le module de la différence entre Q: et /3, noté Sa, est 0,0084. La valeur correspondante de

t,,12(9) s’obtient à partir des calculs de la première partie :

Q2(9) = ; = 0,6.

La consultation de la table de Student donne environ y/2 = 0,25, soit de l’ordre de 50 chancessur 100 de tornber dans l’intervalle &Y. On notera que cet intervalle est environ deux fois pluspetit que le précédent calculé dans la première partie pour lequel correspondait une probabilitéde 70 chances sur 100, c’est donc tout à fait normal de trouver une probabilité plus faible (50chances sur 100) de tomber dans 6~.

566

Page 545: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Index

Abel : 19Adams (méthode d’) : 200, 207, 209Adams-Bashforth (méthode d’) : 201, 202, 212Adams-Moulton (méthode cl’) : 205, 213addition dc deux matrices : 70Aitken

algorithme d’interpolation d’ : 106 108algorithme a2 d’ : 31, 35, 39

Al-Khwârizmi : 17, 18aléatoire

fonction : 435variable : 301, 3055308

Alembert (règle de d’) : 44, 54algébrique (équation) : 51algorithme : 17

a” d’Aitken : 31, 39de Coolcy-Tukey : 249, 262, 272

Ampère (théorie de Monge-) : 216aplatissement : 319appareil (fonction d’) : 283approximants

de Maehly : 405, 414, 416, 418, 419de Padé : 405, 407, 408, 411, 414

arc cosinus (calcul de la fonction) : 426arc sinus (calcul de la fonction) : 426arc tangente (calcul de la fonction) : 426arc tangente hyperbolique (calcul de la

fonction) : 426arrondi : 17, 18, 21, 22, 26, 29, 30, 58, 129,

139Arséninc : 273, 285Arzelà (théorème d’) : 196, 197

asymptotique (développement en série) :45 48

autocorrélation : 435-437, 441

Bach : 499Bairstow (calcul des racines d’un polynôme) :

63, 67Bashforth (méthode d’Adams-) : 201, 202, 212Bayes (formule de) : 304Bernoulli

nombres de : 1777180, 183, 444polynômes de : 177, 179, 181schéma de : 311théorème de : 301, 308, 309

Bertrand : 299, 304Bessel

fonctionde deuxièrne espèce : 430de première espèce : 108, 432de troisième espèce : 339

fonction de : 429, 430interpolation de : 98, 100, 101

biais : 357-359, 361Bienaymé : 308, 309, 480, 483binôme (formule du) : 312binomiale (loi) : 311-313, 315, 316blanc (bruit) : 441Brézinski : 31bruit

blanc : 441gaussien : 442rose : 441

Buffon (problème de) : 287, 288, 290

567

Page 546: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

Calcul

d’erreur(s) : 24d’une intégrale définie par Monte-Carlo :

287, 292, 293de la fonction

arc cosinus : 426arc sinus : 426arc: t,angente : 426arc tangente hyperbolique : 426cosinus : 423cotangente : 425exponcntielle : 421logarithme : 425racine carrec : 427sinus : 423tangentje : 425

de T : 290iti:ratif : 22, 37

carac&istique (équation) : 67: 79, 84, 86, 216Cardan : 18Cau<:hy

-LipscUz (théorème de) : 196, 197, 200,207, 210, 214

loi de : 445, 473Cayley-Hamilton (théorème de) : 86centrCc (variable sleatoire) : 344, 358centri;c rtduite (variable aléatoire) : 320cerf (fonction erreur complérnentjaire) : 47chaleur (équation de la) : 216, 225, 229, 467changement dc phase : 492X2

distribution du : 328, 333loi du : 331

Choleski (méthode dc) : 455Clairaut : 113coefficient

tic corrélation : 343-345, 348, 371-374, 376,377

de Fourier : 235, 237, 243, 245, 246de r&ression : 362, 492, 494

conclitionncllc(s)homogénCité tics varianccs : 364, 368, 369probabilitk : 303, 305

conditionsaux limites : 216, 224de Dirichlet : 216de Neumann : 216de stabilité : 224, 226

initiales : 224, 226conforrnitC : 351, 353. 354. 356

mesure de : 353, 356constadc

d’Euler : 444de ternps : 495

contrainte : 354, 357contraire (Événement) : 302. 303convergence

en moyenne quadratiqu, : 274en probabilitb : 301. 309uniforme : 274

convolutionproduit de : 256: 257, 268, 284r&)lution de l’équation dc : 249, 273, 274,

283, 284, 439Cooley-Tukey (algorithme de) : 249, 262, 272coordonnées

cartésiennes : 216cylindriques : 220sph&iques : 220

corde vibrante : 216, 226, 227correction (méthode dc prédiction-) : 463corrdation

coefficient de : 343-345, 348, 371--374, 376,377

matrice de : 341, 346, 379rapport de : 373, 376

cosinus (calcul de la fonction) : 423cosinus intégral (fonction) : 43cotangente (calcul de la fonction) : 425Cotes-Newton (mCthode dc) : 190covariance : 341: 343-348Cramer (mkthode de) : 69critcre

de Kolmogorov : 356de Pearson : 353

cylindre parabolique (fonction du) : 260

Danilevski (mét,hodc de) : 84, 85Debyc (modèle de) : 183déflation : 76, 84Del Fcro : 18densité

de probabiliti: : 306 308dc puissance : 435

dépendance linkaire : 361&rivée

Page 547: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

approximation par les différences finies : 96successive d’un polynôme : 459

déterminantcalcul d’un : 69, 74de Vandermonde : 75

développement asymptotique : 40, 43, 447,475

combinaison linéaire de : 46de cerf : 47de erf : 47de l’exponenticlle intkgrale : 47des fonctions de Besscl : 48des int,égralr:s de Fresnel : 48diffkrenciation d’un : 46du cosinus intégral : 47du sinus intégral : 47intPgration d’un : 46produit de : 46rapport de : 47

dévcloppemcnt en série : 39, 422dc Fourier : 36, 234, 236-238, 240, 243, 246dc polynômes : 120

dichotomie : 52, 53différences

divisks : 397premikes, deuxièmes etc. : 95, 96; 397

différenciations rktrogradcs (rnethode des) :207, 208, 213

digamma (fonction) : 430Dira(:

fonction de : 438, 441impulsion de : 439, 441peigne de ou fonction sha : 438

Dirichlct (conditions de) : 216dissymbtrie : 319distribution

hinomiale rkgative : 477d’une somme dc deux variables akatoires

indépendantes : 327, 339de Poisson : 313, 477dc Student : 336, 339du x2 : 328, 333exponcntielle : 295gaussicnne : 331, 470, 486, 491norrnalc : 340rapport de deux variables akatoires

indkpendantes : 490

rapport de deux variantes(Fishcr-Snedecor) : 490

rectangulaire : 470, 481division diun polynôme par un binôme : 445droite dc régression : 376; 377

I

Ecartprobable : 320type : 307, 308

Cchantillon : 352- 354, 358khantillonnage : 260-262. 267-269, 271, 469,

482, 488tjhkor+rnc d’ : 263

khclon unité : 269énergie d’un signal : 433epsilon-algorithme : 38. 39

rnatricicl : 37. 38scalaire : 35, 38, 39vectoriel : 37 39, 41

bquationalgkhriyue : 51aux dérivks partielles : 215 217caractéristique : 67, 68, 79, 84. 86, 216de convolution (rkolution) : 249, 273, 274,

283, 284: 439de Frcdholm : 39; 42, 274, 280~ 282, 439de la chaleur : 216, 225, 229, 467dc Laplace : 216, 221de Mathieu : 462de Poisson : 216, 220, 221dc type

elliptique : 216, 220hyperbolique : 216, 225paraholiquc : 216, 224

de Van der Pol : 462des cordes vibrantes : 216différentielle : 195-198, 200, 207, 210, 214du pendule : 195, 214intégrale : 39, 273 275, 280

de Fredholm dc deuxième espèce : 39, 41de Fredholm de première espèce : 274,

280, 282intégro-différentielle : 281séculaire : 79transcendante : 51

Pquipotentielles d’une triode : 222, 223erf (fonction erreur) : 47erreur(s)

569

Page 548: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

calcul d’ : 24d’arrondi : 21, 30, 58, 129, 139de troncature : 23, 25, 26fonction : 47, 505

erreur complémentaire : 47, 447minirnisation de : 89, 93, 94

espace des phases : 462esptrance mathknatique : 307estirnateur : 26, 291, 357, 359, 361, 363, 364,

371, 376estimation : 18, 22, 26, 357-359, 369, 375, 378étalonnage d’un appareil : 486Euler

constante d’ : 43, 145, 177, 183, 430, 444fonction

dc deuxième espke : 331de première espèce : 338

méthode de : 464Euler-MacLaurin

formule de la somme : 180, 184méthode d’intégration d’ : 177

kknemcntscompatibles : 302contraires : 302, 303dépendants : 303équiprobables : 300incompatibles : 300, 302 305indtpendants : 302, 303produit de deux : 301, 303somme de deux : 301, 303

cxponcnticllccalcul de la fonction : 421intkgralc (fonction) : 47

exposant : 27 30extraction d’un signal noyC dans du bruit :

437extrapolation de Richardson (procédé d’) :

31-35

F.F.T. : 249, 251-255, 257, 260, 262, 263,266, 271, 467, 531

CI deux dimensions : 271, 272factorielle (fonction) : 432fcnikc (fonction) : 231, 245, 246Ferrari : 19fiabilité : 311, 314, 478, 479Fibonacci : 443filtrage : 229, 244, 246, 440

filtre : 244-246, 440, 441Fisher-Snedecor (loi de) : 489, 490fonction(s)

aléatoire : 435caractéristique : 325-328cosinus int,kgral : 43d’appareil : 283, 439d’autocorrélation : 435-437, 441d’Heaviside : 269d’intercorrélation : 437, 438de Bessel : 429, 430, 432de corrélation : 435de Dirac : 438, 441de Wcbcr-Hermite (ou du cylindre

parabolique) : 157, 162digamma : 430du cylindre parabolique : 90, 157, 162, 260erreur : 505erreur complkmentaire : 447eulérienne

de deuxième espèce : 331dc première espèce : 338

exponentielle intégrale : 47factorlcllc : 432fenêtre : 231, 245, 246gamma : 328, 430, 431génératrice des moments : 312génératrice des polynômes

d’Hcrmitc : 162de Bernoulli : 177de Laguerre : 149de Legendre : 120de Tchebycheff : 139

lipschitziennc : 196, 210orthogonales : 113, 390peigne : 438répartition : 305-307sinus integral : 47spline : 101, 102, 105unité : 269< de Riemann : 444, 445

fonctionnelle régularisante : 276, 285formule

dc Bayes : 304de la somme (Euler-MacLaurin) : 177, 180,

184de Lagrange : 190de Moivre : 236

570

Page 549: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

de Poisson : 271dc Rodriguès : 115-117, 141, 157, 189de Stirling : 316des probabilités totales : 304des trapèzes : 182des trois niveaux : 188du binôme : 312

Fouriercoefficient de : 235, 237, 243, 245, 246développement en série de : 234, 236 238,

240, 243, 246équation de la chaleur : 225, 229intégrales de : 250, 252, 253série de : 229, 232-235, 238, 241, 244, 246transformée de : 237, 241, 242, 246, 249,

251-255, 257, 260, 262, 263, 266, 271fractions

continues : 397, 398, 400-403rationnelles : 397, 398, 407-411, 413

Fredholméquation de : 39, 42, 274, 280, 282, 439

deuxième espèce : 41prcmièrc espèce : 274, 280, 282

fréquences de diverses gammes : 444Fresnel (intégrale de) : 48Frobenius (forme canonique de) : 84, 85

Gammaconstante d’Eulcr : 430, 444fonction : 328, 430, 431

g a m m enaturelle : 444ternpkri:e : 444

Gauss-Laplace (loi de) : 311, 312, 316, 317mtthode

d’intégration de Gauss-Hermite : 153, 161d’intégration de Gauss-Laguerre : 141,

147, 150d’int,égration de Gauss-Legendre : 113,

116, 122d’intégration de Gauss-Tchebycheff : 136,

138p 140de Gauss-Seidel : 222, 223des pivots de : 70, 72, 74, 78

Gibbs (phknomène de) : 238, 239Givens (mkthode dc) : 82Gode1 : 19

I N D E X

gradient (méthode du gradient conjuguk) :456

Gram-Schmidt (orthogonalisation dc) : 457grands nombres (loi des) : 301Grccnbcrgcr (gknkrateur de nombres

pseudo-aléatoires) : 289, 290, 292, 294

Hadamard (problème mal posé) : 273Hamilton (théorème de Cayley-) : 86hasard : 299, 300Heaviside (fonction d’) : 269Hermite (polynômes d’) : 153-155, 157, 159,

1 6 2Héron : 427Hilbert : 76, 86histogramme : 352homogkkiti: des variantes conditionnelles :

364, 368, 369, 371-373, 376Horncr (schkma de) : 411, 445Hospital (rfiglc de 1’) : 430

Impulsion de Dirac : 439, 441inccrt,itudcs : 18, 21; 22indécidable (problème) : 19indépendance : 302, 303, 363inégalitk dc Bicnaymé-Tchebychcff : 308, 309,

480, 483infini (produit) : 403instabiliti: mlmériyue : 58, 59, 61, 207, 273,

294intCgrale(s)

dc Fourier : 250, 252, 253de Fresncl : 48de Lebesgue : 253de Riemann : 253de Stielt,jes : 306

intégration numérique : 260intercorrélation : 437, 438interférences : 435interpolation

formulede Bessel : 98, 100, 101de Lagrange : 101de Newton : 96; 97; 101de Stirling : 98, 100. 101

par des fonctions splinc : 101, 105inversion d’une matrice

Page 550: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALGUL NUMERIQUE APPLIQUÉ

par décomposition cn matricestriangulaires : 72, 73, 78, 81, 82

par la mCthode des pivot,s : 453par une mkthode de Monte-Carlo : 293trop volumineuse : 454

isothermes d’un rbfrigérateur : 465itération (généralités) : 23

Jacohiméthode de : 86

équat,ions aux dCriv+es partielles : 222,Jordan (théorème de) : 233, 234

Kacrnarx (mkthode de) : 61, 62, 64, 452Kinchine (th+orème de Wicncr-) : 436 438Kolmogorov (Crit>ère de) : 356Kroneckcr : 133Krylov (calcul des valeurs propres par la

rr1éthotlc dc) : 86Kutta (mbthode de R.unge et) : 199: 201, 208,

211, 212

Lagrangeforrnule de : 190multiplicateurs de : 278polynôme d’interpolation de : 90-92, 94: 96.

100, 101: 106Laguerre

p01y11ôrnes : 141-145, 149, 150gén&alisés : 151, 152

Laplacecalcul des t,ransforrnées : 149équation de : 216, 221loi de Gauss- : 311; 312, 316, 317produit de : 221, 229, 429

Le Verrier (calcul des valeurs propres par lambthodc de) : 79, 81

Lcbrsgue (inttgrale de) : 253Lcgendre (polynôme de) : 117, 119 121,

123-125. 129Lchmer (gbérateur de nombres

pscudo-alkatoires) : 289, 290, 292, 294Leibnitz (rcglc de dérivation dc) : 115, 116,

153-155Liouville-Neumann (série de) : 39. 41; 42Lipschitz : 196, 197, 200, 207, 210, 214lipschit,xicnne (fonction) : 196, 210lissage (filtrage) : 89, 229

localisation des racines : 52logarithme (calcul dc la fonction) : 425loi

hinomiale : 311-313, 315. 316négative : 474 476

dc Fisher-Snedecor : 489, 490de Gauss-Laplace : 311. 312, 316. 317de Poisson : 311-315de Student : 331, 339. 340de Weibull : 479des grands nombres : 301cl11 x2 : 331multinomiale ou polynomiale : 482, 483

MacLaurind&eloppement en sCric : 20. 113, 127, 137.

147. 402, 459, 495formule d’Euler- : 177série de : 21, 160

Maehly (approximants de) : 405, 414: 416,418, 419

maillage d’un domaint : 215, 217 219, 222.224 -226

mantisse : 21, 26: 28, 29Mathieu (équation dc) : 462matrice

de corrélation : 341. 346, 379de covariancc : 346de Hilbert : 76, 86décomposition en matrices triangulaires :

72, 73, 78, 81, 82définie positive : 111invcrsc : 69, 72, 78multiplication : 69, 70produit : 69, 72, 73, 82puissa.nce : 81quasi t,riangulairc : 82 84tract : 81, 86transposPe : 82triangulaire : 72, 73. 81. 82tridiagonale : 77unitaire : 73, 77, 78

rnat,ricicl (cpsilon-algorithme) : 37, 38Mayer : 287rnédiane : 307MendClbev : 493rnéthodc

d’Adams : 200, 207, 209

572

Page 551: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

d’Adams-Bashfortll : 201, 202, 212d’Adams-Moulton : 205. 213d’Euler : 464d’intégration dc Gauss-Hermite : 153, 161de Cholcski : 455, Lde Cotes-Newton : 190de Cramer : 69de Danilcvski : 84, 85dc Gauss-Seidel : 222: 223de Givcns : 82de Jacohi

équations aux dérivbcs partielles : 222systèmes linéaires : 86

de Kacmarz : 61, 62, 64, 452de Krylov : 86dc Le Verrier : 79, 81de Monte-Carlo : 287: 292, 293de Newton : 58

et des parties proportionnelles : 58, 59de Picard : 197, 210de prédiction-correction : 463dc régularisation : 276, 280, 283dc Richardson : 185dc Romherg : 177, 184, 186dc Runge et Kut,ta : 199, 201, 208, 211, 212de Rutishauser : 81-84, 86dc Simpson : 188, 192de Souriau : 461dc Taylor : 198, 200, 211de tir : 214des différentiations rétrogrades : 207, 208,

213des moindres carrés : 89, 109, 110, 375, 376.

454, 495des pivots dc Gauss : 70, 72, 74, 78des rectangles : 186, 188des trapèzes : 184, 187, 188, 192du gradient conjugué : 456du recuit simulé : 287, 294

minimum d’une fonction : 287, 294mode : 307modèle de Debyc : 183moindres carrés (mi:thodc des) : 89, 109, 110.

375, 376, 454,495Moivre (forrnule de) : 236moments

centrés : 307iimi ccntr& : 307

I N D E X

Monge-Amp& (theorie de) : 216Monte-Carlo (méthodes) : 287, 292, 293Moulton (méthode d’Adams-) : 205, 213moyenne

d’une fonction : 291d’uiie va.riahle alkatoire : 307

rrlultiplic:atcllrs dc Lagrange : 278

Ntcud : 215; 217, 218; 222. 223N e u r n a n n

conditions de : 216Liouville (série dc) : 39, 41; 42

Neville (calcul du polynôme d’interI>olation) :107. 108

N e w t o nformule d’itération : 56 60méthode d’intkgration de Cot,es- : 190polynôme d’interpolation : 96-98; 101relation cntrc les coefficients ct les 5”” d’un

polynôme : 79n o m b r e s

d’or : 443de Bernoulli : 177-180. 183, 444loi des grands : 301pseudo-alkatoircs à distribution

exponcnticllc : 295gaussicnnc à queues soign& : 296, 297gaussienne ordinaire : 297rectangulaire : 288, 290. 293, 297sinusoïdale : 295

représentation des : 17, 18, 20, 22, 27 30noyau : 274

OpRratcurde diffCrences

deuxiemes : 95, 97-99premières : 95, 97-99

intkgral : 275régularisant : 276, 277, 284

ordred’un processus itératif : 449 451, 455statistique : 471

orthogonales (aux)fonctions : 390polynômes : 113, 121, 133, 134, 136, 141,

143, 144, 153%1X1, 389. 390, 392-394ortliogonalisation : 390, 392: 457ortlionormi:(c)s

573

Page 552: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

polynômes : 114, 158oscillateur de Van der Pol : 462oscillation du pendule simple non linéarisé :

195, 214

Pacioli : 18Padé (approximants de) : 405, 407, 408, 411,

414paramètre de régularisation : 276, 277, 280Parseval (théorème de) : 255 -258Pearson (critère de) : 353peigne de Dirac : 438pend11le

de longueur variable (intégration) : 462équation du : 195, 214

phénomène de Gibbs : 238, 239rr (calcul de) : 290Picard (méthode de) : 197, 210pivot

de Gauss : 70, 72, 74, 78de la transforma.tion de Danilevski : 84, 85

Poincaré (développement asymptotiquc) : 45point de pourcentage : 367, 373Poisson

distribution de : 313équation de : 216, 220, 221formule de : 271loi de : 311-315processus de : 314

polynôrneà coefficient principal réduit : 67, 93, 114,

118, 134à coefficients complexes : 449, 450caracteristique : 79, 86d’Hermite : 153-155, 157, 159, 162de Bernoulli : 177, 179, 181de Lagrange (interpolation) : 90-92, 94, 96,

100, 101, 106de Laguerre : 141 145, 149, 150

généralisé : 151, 152de Legendre : 117, 119-121, 1233125, 129de Tchebycheff : 1333137, 139division par un monôme : 449division par un trinôme : 63interpolation

ascendant de Newton : 98, 101de Bessel : 98, 100, 101de Stirling : 96, 98, 100, 101

descendant de Newton : 97: 101racines d’un : 63

à coefficients complexes : 67, 449, 450à coefficients réels : 67

population parente : 351 353, 483, 486,489-491

précision (sur les nombres) : 18, 22, 23, 26,29, 30

prédiction-correction (methode de) : 463probabilité : 299

composée : 303conditionnelle : 303, 305convcrgcnce cn : 301, 309densité de : 3066308totale : 303, 304

problèmebien pose : 274, 276de Buffon : 287, 288, 290de Dirichlet : 216de la poursuite : 465indécidable : 19mal pose : 273-276, 284raide : 207, 208

procédé d’extrapolation de Richardson :31-35

processusde Poisson : 314du deuxieme ordre : 452du premier ordre : 452du troisième ordre : 512

produitde convolution : 256, 257, 268, 284dc deux matjrices : 69, 72, 73, 81, 82de Laplace : 221, 229, 429infini : 403scalaire : 120, 159, 257, 456, 457

profil d’une corde vibrante : 226prolongement analytique : 39, 40propagation

dc la chaleur : 216des crrcurs : 22

propres (valeurs) : 69, 72, 79, 81, 82: 84-86pseudo-aléatoires (nornbres) : 287 290,

292 297puissance d’un signal : 433, 434Polya (urne de) : 474, 475

574

Page 553: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

Quadratiquc (forme définie positive) : 82, 84quantile : 366, 367quasi triangulaire (matrice) : 82284

Racinecarrée (calcul de la fonction) : 427localisation des : 52localisation des racines d’un polynôme

à coefficients complexes : 67à coefficients réels : 67

nombre de racines dans un intervalle(Sturm) : 383, 3855387

raide (problème) : 207, 208rapport (de corrélation) : 373, 376recuit simulé (méthode du) : 287, 294rccursivité : 264, 266réduites (fractions continues) : 399 402réfrigérateur (isothermes d’un) : 465refroidissement

d’une plaque homogène : 225d’une sphère homogcne : 467

règlede d’Alembert : 44, 54de 1’Hospital : 430de Leibnitz (dérivation) : 115, 116, 141,

142 151 1533155> >rcgression

coefficient de : 362, 492linéaire : 374, 376multilincaire : 378

régularisant (opérateur) : 276, 277, 284rcgularisation (pararnètre de) : 276, 277, 280,

283relations de Newton (coefficients d’un

polynôme...) : 79 81répartition (fonction de) : 305 307rcponsc impulsionnelle : 439representation des nombres en machine : 18,

25527résidu d’observation : 278, 280, 282, 283, 285,

3622364rétrograde (méthode des differentiations) :

207, 208, 213Richardson

méthode de : 185procédé d’extrapolation de : 31-35

Riemannfonction Ç dc : 444, 445

INDEX

intégrales de : 253robuste : 370Rodriguès (formule de) : 1155117, 141, 157,

189Rolle (théorème de) : 54, 92, 117Romberg (méthode de) : 177, 184, 186Rothe : 19Routh (schéma de) : 386Ruffini : 19Runge (méthode de Runge et Kutta) : 199,

201, 208, 211, 212Rutishauser (méthode de) : 81-84; 86

Scalaire (epsilon-algorithme) : 35, 38, 39schéma

de Bernoulli : 311de Horner : 411, 445de Routh : 386

Schmidtorthogonalisation de : 390orthogonalisation de Gram- : 457

séculaire (équation) : 79Seidel (méthode de Gauss-) : 222, 223série

asympt,otique : 45548de Fourier : 229, 2322235, 238, 241, 244, 246de Liouville-Neurnarm : 39, 41, 42de MacLaurin : 20, 21, 113, 127, 137, 160,

402, 459, 495de Taylor : 20, 123, 127, 137, 160, 198, 200:

211,445, 450développement en série de polynômes : 120entière : 17, 20, 21, 203, 401

seuil : 354 355 373 374, I >Shannon

fréquence de : 268interpolation de : 268

signal : 433, 435Simpson

formule de : 463méthode de : 188, 192

sinus (calcul de la fonction) : 423sinus intégral (fonction) : 47Snedecor (loi de Fisher-) : 489, 490Sobolev : 279, 280solubilité du nitrate de sodium dans l’eau :

493solution de Weber : 430

Page 554: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

MANUEL DE CALCUL NUMÉRIQUE APPLIQUÉ

SOIIlIIl~

des puissances scmblatbles des racines d’unpolynôme : 79, 81

formule dc la : 177, 180source de chaleur : 467Souriau (m@thode de) : 461spectre

contimi : 250de handc : 250

spectroscopie (mesure d’une tempkrature) :493

spline (fonction) : 101. 102: 105stabilitk (condition) : 224. 226statistiyucs (carac:t&istiyues) : 299 301Stieltjes (intC:grale de) : 306Stirling

formule de : 316polynôme d’interpolation de : 96, 98. 100,

1 0 1stoch&ique : 364 366Stokes : 45Student

loi dc : 331. 339, 340W. Gossct, : 336, 339

Sturmsuites de : 383-386théorème dc : 383, 385

suitesde Sturm : 383 386numériques (Variat)ion des) : 383test des - ascendantes ct descendantes : 365

syst?mcs

linkaireschoix des pivots : 85mCthode de Jacob : 86m~thodc dc ri:solution : 69, 70, 72, 73, 76volumineux : 454

non linéaires, m&ode de résolut,ion : 450,451

surdktermin& : 86. 110: 378; 454, 485

Tableau des différences : 96, 412: 418taille de l’échantillon : 368, 489t,angcnte

calcul de la fonction : 425coniniun~~ A deux courbes : 446

Tartaglia : 18

Taylor (développcmcnt en série tic) : 20; 123,127, 137, 160. 198. 200, 211: 445. 450

Tchchycheff : 308, 309intbgration dc Gauss- : 113, 116, 122-124,

129, 136, 138-140polynôme de : 133 136

températurc (mesure par spwtroscopic) : 493test

d’hypothèse : 351de pile ou face : 299, 300. 302

des suites ascendantes c,t, descendantes : 365théorème

d’Arz& : 196. 197d’Cchantillonnagc : 263dc Bernoulli : 301, 308, 309dc Cm:hy : 445. 473de Cauçhy-LiI)sc:llitx : 196, 197, 200, 207,

210, 214dr Cayley-Hamilton : 86de Jordan : 233, 234de Padb : 407dc Parsrval : 255 258L , idc Rolle : 54, 92. 117de St,urm : 383dc Weierstrass : 90, 123, 235, 391dr, Wiener-Kinchine : 436-438des prohat,ilit,bs c:omposPes : 303des prol)abilités totales : 303: 304suites de Sturm : 385

théorie de Mongc-Ampère : 216Tikhonov : 273tir (m&thodc dc) : 214trace d'une matrice : 81. 86transcendante (equation) : 51transfert, thermique : 224transformations

de Fourier : 237, 241, 242, 246. 249.251 255, 257, 260, 262, 263, 266, 271

de Jacobi : 86orthogonales : 548unitaires : 82

transformées dc Laplace (calcul des) : 149transitoire (ttude d’un phknomène) : 463tIrapèzes

formules des : 182mkthode des : 184, 187. 188, 192

triangulaire (décomposition des matrices) :72, 73, 78: 81. 82

576

Page 555: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)

triaugularisation des matrices : 72, 73, 78, 82tridiagonales (matrices) : 77trio& (@uipotentielle d’une lampe) : 222: 223trois niveaux (formule des) : 188troncature : 18, 23. 25, 26, 29Tukcy (algorithme de Coolcy-) : 249, 262, 272

Unicit@ de la solution : 196unitaires

matrices : 73, 77, 78transformations : 82

Valeurs propres : 69, 72, 79, 81, 82, 84 86Van tlcr Pol

i:quation de : 462oscillatcur de : 462

Vandermoiidr (dbtcrminant de) : 75variahlc

aléatoire : 301, 305-308ceritrér : 358ccntrbc duite : 344

ccntr@e réduite : 307. 320continue : 306, 307dépcndantc(s) : 343, 345discrète : 307indépendai~tr(s) : 343

variancc (homogénéité des varianccsconditionnelles) : 364, 368. 369:371-373. 376

variations d’une snitc numtrique : 383vectoriel (epsiloii-algorithrnc:) : 37-39. 41

Weber-Hermite (fonctions de) : 157, 162solution dc : 430

Weibull (loi dc) : 479Weierstrass (thhrfimc tic) : 90, 123, 235, 391Wiener-Kinchiue (théorème dc) : 436 -438Wolff : 288Wyrm : 31

c (fonction - dc Riemann) : 444, 445

577

Page 556: Calcul Numérique Appliqué - Maths - Algorithme (Édition Edp Sciences)