2. optimisation sans contrainte fonctions à une seule variable

2. Optimisation sans contrainte

Fonctions à une seule variable

2.1. Méthodes n’utililisant que les valeurs des fonctions

• Méthode de Fibonacci Hypothèse: La fonction f est définie sur l’intervalle [a, b] et est unimodal;

i.e., f ne possède qu’un seul minimum local dans [a, b]

• L’approche consiste

– à choisir un certain nombre de points selon une stratégie basée sur les

nombres de Fibonacci

– à évaluer séquentiellement la valeur de la fonction à ces points

– avec l’objectif de réduire la longuer de l’intervalle contenant le

minimum local en se basant sur la propriété d’unimodalité de la

fonction

• Étant données les valeurs de la fonction en deux points de l’intervalle, l’unimodalité permet d’identifier une partie de l’intervalle où le minimum ne peut se retrouver

a a ab b bx1 x1 x1x2 x2 x2

1 2

2

et * ,

f x f x

x a x

1 2

1

et * ,

f x f x

x x b

1 2

1 2

et * ,

f x f x

x x x

a bx1 x2x3 x4

Choisir deux points x1 et x2 symétrique et à la même distance de chaque extrémité de l’intervalle [a, b]

Choisir le prochain point symétriquement par rapport au point déjà dans l’intervalle résultant.

a bx1 x2x3 x4

Choisir le prochain point symétriquement par rapportau point déjà dans l’intervalle résultant.

Stratégie optimale de sélection des points d’évaluation

• Notation:

d1 = b – a, la longueur de l’intervalle initial

dk = longueur de l’intervalle après avoir utilisé k points d’évaluation

{Fk} la suite des nombres de Fibonacci définie comme suit:

F0 = F1 = 1

Fn = Fn-1 + Fn-2 n = 2, 3, ….

{1, 1, 2, 3, 5, 8, 13, 21, …}


Supposons que nous décidons au départ d’utiliser N points d’évaluation.

Procédure se résume comme suit:

i. Les deux premiers points sont choisis symétriques à une distance

de chacune des extrémités de l’intervalle [a, b]. Une partie de

l’intervalle est éliminée en se basant sur l’unimodalité de la fonction.

Il en résulte un intervalle de longueur .

ii. Le troisième point est choisi symétriquement par rapport au point déjà dans l’intervalle résultant. Ceci engendre un intervalle de longueur

11

N

N

Fd

F

12 1

N

N

Fd d

F

23 1

N

N

Fd d

F


i. Les deux premiers points sont choisis symétrique à une distance de chacune des extrémités de l’intervalle [a, b]. Une partie de l’intervalle est éliminée en se basant sur l’unimodalité de la fonction. Il en résulte un intervalle de longueur .

ii. Le troisième point est choisi symétriquement par rapport au point déjà dans l’intervalle résultant. Ceci engendre un intervalle de longueur

iii. En général le point suivant est choisi symétriquement par rapport au point déjà dans l’intervalle résultant.

11

N

N

Fd

F

12 1

N

N

Fd d

F

23 1

N

N

Fd d

F

iii. En général le point suivant est choisi symétriquement par rapport au point déjà dans l’intervalle résultant.

Note: Selon iii. , le dernier point N devrait être placé au centre de l’intervalle superposé à celui s’y trouvant déjà. En effet, puisqu’en utilisant cette stratégie de sélection des points d’évaluation, nous avons que

11 2,3, ,N k

k

N

Fd d k N

F

Note: Selon iii. , le dernier point N devrait être placé au centre de l’intervalle superposé à celui s’y trouvant déjà. En effet, puisqu’en utilisant cette stratégie de sélection des points d’évaluation, nous avons que

11 2,3, ,N k

k

N

Fd d k N

F

( 1) 1 21 1 1 1

1

1 11 1 1

il s'ensuit que2

1.

21

N N

N

N N N

N N

N NN

N N N

F Fd d d d

F F Fd d

F Fd d d d

F F F

Pour remédier à cette situation, le dernier point est plutôt placé à une distance (à gauche ou à droite) de celui s'y trouvant déjà.

N

• En utilisant cette stratégie de sélection des points d’évaluation,

et il est possible de démontrer que

est le plus petit intervalle qu’il est possible d’obtenir en utilisant N

points d’évaluations

11 2,3, ,N k

k

N

Fd d k N

F

1 1 11 1

N NN

N N N

F F dd d d

F F F

• En utilisant cette stratégie de sélection des points d’évaluation,

Ainsi, lorsque le nombre de points d’évaluation N devient très grand pour tendre vers l’infini, la suite des valeurs

plus rapidement qu’en utilisant toute autre stratégie.

11 2,3, ,N k

k

N

Fd d k N

F

1 1 11 1

N NN

N N N

F F dd d d

F F F

0kd

3

8

0 15

8

N = 5{1, 1, 2, 3, 5, 8}

1 4

5

5

8N

N

F F

F F

5 12 1

5

5

8

Fd d

F 1

1 2,3, ,N kk

N

Fd d k N

F

3

8

0 12

8

5

8

N = 5{1, 1, 2, 3, 5, 8}

5 23 1

5

3

8

Fd d

F 1

1 2,3, ,N kk

N

Fd d k N

F

3

8

0 11

8

2

8

5

8

N = 5{1, 1, 2, 3, 5, 8}

5 34 1

5

2

8

Fd d

F 1

1 2,3, ,N kk

N

Fd d k N

F

3

8

0 11

8

2

8

5

8

N = 5{1, 1, 2, 3, 5, 8}

1

8

5 45 1

5

1

8

Fd d

F 1

1 2,3, ,N kk

N

Fd d k N

F

• Méthode de la section dorée ( nombre d’or τ = 1.618…)

La méthode de la section dorée utilise la même stratégie que la méthode de Fibonacci pour selectionner les points d’évaluation, mais le nombre de points d’évaluation n’est pas spécifié au départ.

Pour spécifier les deux premiers points, nous procédons comme dans la

méthode de Fibonacci en les prenant symétriques à une distance

de chaque extrémité en considérant que N → ∞.

11

N

N

Fd

F

• La méthode de la section dorée utilise la même stratégie que la méthode de Fibonacci pour selectionner les points d’évaluation, mais le nombre de points d’évaluation n’est pas spécifié au départ.

Pour spécifier les deux premiers points, nous procédons comme dans la

méthode de Fibonacci en les prenant symétrique à une distance

de chaque extrémité en considérant que N → ∞.

11

N

N

Fd

F

1

1

1Il est possible de démontrer que lim .

Par conséquent les deux premiers points sont choisis symétriquement à 1

une distance de chaque extrémité.

N

NN

F

F

d

• Méthode de bisection (ou de bipartition) Méthode pour identifier le 0 d’une fonction g(x) sur un intervalle [a, b].

Si , alors la méthode de bisection peut être utilisée pour identifier un point où la dérivée d’une fonction s’annule.

Hypothèse: Sur l’intervalle [a, b], la fonction g est continue et telle que

g(a) g(b) < 0 (i.e.,

g x f x

il existe , où 0).x a b g x

• Principe de la méthode: à chaque itération, réduire la longueur de

l’intervalle contenant en la divisant en deux.x

Étape 0: Soit et tel que 0. Soit le niveau de tolérance

sur la longueur de l'intervalle contenant la racine à la fin de l'algorithm

Étape 1: Soit le poin2

e.

a bc

a b g a g b

x

t milieu de l'intervalle , .

Si 0, alors et l'algorithme s'arrête.

Si 0 i.e., et sont de même signe ,

alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b

, l'algorithme s'arrête. Autrement, reprendre l'étape 1.a

• Puisque par hypothèse g est continue sur [a, b] et g(a) g(b) < 0,

– g change de signe entre a et b

– g s’annule en un point entre a et b

– la méthode génère une suite d’intervalles de longueur décroissante

jouissant de la même propriété

• La suite des valeurs des longueurs des intervalles est la suivante:

, , , , , , où 2 4 8 2n

L L L LL L b a

a bc




e.

a bc

a b g a g b

x




alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b


g

a b




e.

a bc

a b g a g b

x




alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b


g

c

a b




e.

a bc

a b g a g b

x




alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b


g

La suite des valeurs des longueurs d'intervalle est la suivante:

, , , , , , où 2 4 8 2n

L L L LL L b a

Le nombre d'itérations requises pour atteindre une longueur inférieure ou égale à :

À la fin de l'itération la longueur de l'intervalle est

egale à .2

Si représente le nombre d'it

k

nl

kL

n

2

2

érations requises, alors

2 log .2

Donc en prenant égale au plus petit entier plus grand ou

égale à log , la longueur après itératio

n

n

L L Ll n

l ln

Ln

l

2

ns sera

inférieure ou égale à . Ainsi

log .

lL

nl

• La suite des valeurs des longueurs d’intervalle est la suivante:

, , , , , , où 2 4 8 2n

L L L LL L b a

1

La suite des longueurs des intervalles converge vers 0:

1La convergence est linéaire avec un rapport de convergence de :

2

02lim l

lim 0

i0

2

.2

m2

k

k k

k

nn

LL

L

L

1

2 1.

2

k

k L

Hypothèse g(a) g(b)<0 est essentielle




e.

a bc

a b g a g b

x




alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b


a bc

Hypothèse g(a) g(b)<0 est essentielle




e.

a bc

a b g a g b

x




alors : .

Étape 2: S

Autrement : .

i

a b

g c x c

g c g a g c g a

a c

b

c b


a b

Uniquement l’intervalle initial contient la racine

• Méthode de Newton Rappel: Formule de Taylor d’ordre n

2

( 1) ( )1

Il existe un point entre et tel que

2!

1 ! !

k

k

k k k k

n k nn nk k

z x x

f xf x f x f x x x x x

f x f zx x x x

n n

2.2 Méthode utilisant les dérivées

• Méthode de Newton

Hypothèses:

Aux points d'évaluation , il est possible d'évaluer

, , , et de plus 0.

k

k k k k

x

f x f x f x f x

2

Étant donné un point d'évaluation , considérons

l'approximation quadratique suivante de à :

2!

k

k

k

k k k k

k

x

f x

f xq x f x f x x x x x

2

2! entre et

k k k k

k

ff x f x x x x

x

x x

x

f

z

z

f

qk

xk

2

2!

k

k k k k

k


2

2!

k

k k k k k k k k

k

f xq x f x f x x x x x f x

22 !

k

k k

k

f xq x f x x x

22 !

k

k k k k k

k

f xq x f x x x f x

k k

kq x f x

k

kq x f x

f

qk

xk

1

1 1

1

1

La méthode itérative de Newton determine le prochain point

d'évaluation en remplaçant par et en annulant :

0

k

k k

k k k k k

k

k

k k

k

k

k k

k

x f q q x

q x f x f x x x

f xx x

f x

f xx x

f x

xk+1

Convergence de la méthode de Newton

0

Soit une fonction possédant des dérivées continuesd'ordre 3. Supposons que * satisfait les conditions * 0 et

* 0. Si (le point initial) est choisi su

Théorème

ffisemment près de *,

a

2.1:

o

r

l

fx f x

f x x x

1 2 1 2

s la suite des points générés par la méthode de Newton converge vers * avec un ordre de convergence d'au moins 2.

Soient 0 et 0 tels que * et * .

Par continui

Preu

té de

ve.

e

kxx

k k f x k f x k

f

1

11

1 2

t de , il existe un scalaire 0 tel que pour

tout * : *

et .

f

B x x

f k f k

1 2 1 2

1

11

1 2


Par continuité de et de , il existe un scalaire 0 tel que pour

tout * : *

et .

Puisque * 0, alors la

Preuve. k k f x k f x k

f f

B x x

f k f k

f x

1

1

1

1

1

relation définissant

devient*

** *

* ** . 2.1

k

k

k k

k

k

k k

k

k

k k

k

k k k

k

k

x

f xx x

f x

f x f xx x

f x

f x f xx x x x

f x

f x x x f x f xx x

f x

1

2

* ** . 2.1

Se référant à la formule de Taylor d'ordre 2 appliquée à , il existe un entre * et tel que

* * *2!

ce qui s'écrit également

k k k

k

k

k

k k k k

k

f x x x f x f xx x

f xf

x xf

f x f x f x x x x x

f x

2

2

2 21 1

* * *2!

ou encore

* * * .2!

Substituant dans 2.1 ,

1 1* * * * . 2.2

2 2

k k k

k k k k

k k k k

k k

fx x f x f x x x

ff x x x f x f x x x

ffx x x x x x x x

f x f x

2 21 1

21

10

1 1* * * * . 2.2

2 2

Posons maintenant

2min , .

Démontrons maintenant que partant de n'importe lequel point * ,nous convergeons vers * et que la co

k k k k

k k

ffx x x x x x x x

f x f x

k

k

x B xx

1 21

nvergence est d'ordre au moins 2.En effet si * , alorsi) le point dans la formule de developpement de Taylor a la propriété que * ,et ainsi (par définition de et )

kx x

B x k k

2

Se référant à la formule de Taylor d'ordre 2 appliquée à , il existe un entre * et tel que

* * *2!

k

k k k k

fx x

ff x f x f x x x x x

Convergence de la méthode de Newton

0


* 0. Si (le point initial) est choisi su

Théorème

ffisemment près de *,

a

2.1:

o

r

l

fx f x

f x x x

1 2 1 2

s la suite des points généréspar la méthode de Newton converge vers * avec un ordre de convergence d'au moins 2.


Par cont

P

inuité

reu

de et

ve.

kxx

k k f x k f x k

f

1

11

1 2

de , il existe un scalaire 0 tel que pour

tout * : *

et .

f

B x x

f k f k

2 21 1

21

10

1 1* * * * . 2.2

2 2

Posons maintenant

2min , .

Démontrons maintenant que partant de n'importe lequel point * ,nous convergeons vers * et que la co

k k k k

k k

ffx x x x x x x x

f x f x

k

k

x B xx

1 21

1

nvergence est d'ordre au moins 2.En effet si * , alors) le point dans la formule de developpement de Taylor a la propriété que

* ,et ainsi (par définition de et )

et

kx xi

B x k k

f k f

2

1

1 2

21 1

2

.

Puisque * , alors également * et

et .

Substituant dans 2.2 ,1

* * ;2

k k

k k

k k

k

x x x B x

f x k f x k

kx x x x

k

21

1

1 21

1 2

2min ,

En effet si * , alors) le point dans la formule de developpement de Taylor a la propriété que

* ,et ainsi (par définition de et )

et ,

Puisque

k

k

k

k

x xi

B x k k

f k f k

x

1

1 2

21 1

2

2

1

* , alors également * et

et .

Substituant dans 2.21

* * ;2

) également2

*

k

k k

k k

k

x x B x

f x k f x k

kx x x x

kii

kx x

k

21 1

2

2

1

1

2

21 1 1

2 21

1* * ;

2) également

2*

et par conséquent1

* 1.2

Il s'ensuit que1 1

* * = * *2 2

* * ,et la méthode converge.De plus, la convergence est

k k

k

k

k k k k

k k

kx x x x

kii

kx x

k

kx x

k

k kx x x x x x x x

k kx x x x

1

12

2

d'ordre au moins 2 puisque* 1

.2*

k

k

x x k

kx x

• Note:

• Méthode également utilisée pour déterminer un point où la fonction s’annule. Il suffit de considérer la fonction

2

hypothèse * 0 assure que * est un maximun ou un

minimum de , et qu'il est possible d'utiliser un 0.

f x x

f k

g x f x

1 1

1

1

ou encore

0

k k

k k k k

k

k

k k

k

k k

k

k

k

g

g x g xx x x x

g x

f

f xx

g x

g

f x

xg x

x x

x

1

1

1

ou encore

0

k

k k

k

k

k

k

k k

k

k k

f

f xx x

f

g

g xx x

g

gx

x x

xg

x x

g

kx1kx

kg x kg x

1

1

Interprétation géométrique:

choisi de telle sorte que

de la droite passant par les

points , et ,0

a pour pente , celle de

au point .

k

k k k

k

k

x

x g

g x

g

x x

x

1 à l'intersection de l'axe des et la tangente de au point k kx x g x

• Importance de l’hypothèse que x0 soit suffisemment près de x*

g

0x1x


g

2x1x

0x


g

2x3x

1x


g

4x3x

2x


g

2kx2 1kx


g

2 2kx 2 1kx

• Méthode de la fausse position

Hypothèses:

Aux points d'évaluation , il est possible d'évaluer

, .

k

k k

x

f x f x

1

2

1

Étant donné un point d'évaluation , considérons

l'approximation quadratique suivante de à

ne nécessitant pas la connaissance de :

1

2

k

k

k

k k

k k k k

k k k

x

f x

f x

f x f xq x f x f x x x x x

x x

2

2! entre et

k k k k

k

ff x f x x x x

x

x x

x

f

z

z 2

2!

k

k k k k

k


12

1

12

1

1

1

1

1

La fonction

1

2a les propriétés

1)

2

)

k k

k k k k

k k k

k k

k k k k k k k

k k k

k k

k

k k

k k

k k k

k k

k k k k

k k k

k

k


x x

f x f xi q x f x f x x x x x

x xq x f x

f x f xii q x f x x x

x xf x f x

q x f x x xx x

q x

1

1 1

1

1 1

)

k

k k

k k k k

k k k

k k

k

f x

f x f xiii q x f x x x

x xq x f x

1

12

1

1

1

La méthode itérative de la fausse position determine le prochain point

d'évaluation en remplaçant par et en annulant :

1

2

k

k k

k k

k k k k

k k k

k k

k

k k

x f q q x


x x

f x f xq x f x

x

1

1 1

1

11

1

11

1

0

k

k

k k

k k k k

k k k

k kk k k

k k

k kk k k

k k

x xx

f x f xq x f x x x

x x

x xx x f x

f x f x

x xx x f x

f x f x

Convergence de la méthodede la fausse position

0 1


* 0. Si et (les points initiaux) son

Théorème

t choisi

2.2:

s suf

fisemment près

fx f x

f x x x

de *,

alors la suite des points générés par la méthode de la fausse position converge vers * avec un ordre de convergence égal à =1.618 (le nombre d'or).

voir le livre de LuenPreuve: berger p. 22

k

x

xx

2.

1

1

1

11

1

Méthode également utilisée pour déterminer un point où la fonction s'annule.

Il suffit de considérer la fonction

k k

k k kk k k k

k k

k k k

k k

g

x x x

f

x xx x f x

x x g x g xg x g x

f x

x

x

g f x

f

11

1

1

1 1

ou encore

0

kk k

k k

k k k

k k k k

xx x

g x g x

g x g x g x

x x x x

11

1

1

1 1

ou encore

0

k kk k k

k k

k k k

k k k k

g

x xx x g x

g x g x

g x g x g x

x x x x

1kx kx1kx

1kg x

kg x

1

1 1

Interprétation géométrique:

choisi a l'intersection

de la droite passant par les

points , et ,

et de l'axe des .

k

k k k k

x

x g x x g x

x

g

• Importance de l’hypothèse que x0 et x1 soit suffisemment près de x*

g

0x1x

2. optimisation sans contrainte fonctions à une seule variable

Documents