réseaux de neurones artificiels rebouclés pour ... · dpto. tecnología electrónica universidad...

32
Dpto. Tecnología Electrónica Universidad de Málaga Réseaux de Neurones Artificiels Rebouclés pour Optimisation Gonzalo Joya Dpto. Tecnología Electrónica ETSI Telecomucicación Universidad de Málaga 29017 Málaga [email protected] Paris, le 21 juin 2002

Upload: others

Post on 27-Mar-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Réseaux de Neurones Artificiels Reboucléspour Optimisation

Gonzalo JoyaDpto. Tecnología Electrónica

ETSI TelecomucicaciónUniversidad de Málaga

29017 Má[email protected]

Paris, le 21 juin 2002

Dpto. Tecnología ElectrónicaUniversidad de Málaga

1. Introduction.2. Le modèle de Hopfield. Dynamiques

- Dynamique Continue I.- Dynamique Discrète.- Dynamique Continue II.

3. Quelques exemples d ’application.4. Les problèmes d’application des modèles de Hopfield.

- Confusion entre les différentes dynamiques.- Analyse de convergence.- Le problème de la discrétisation des dynamiques continues.

5. Quelques lignes de travail.- À la recherche d ’un minimum global.- L ’étude des dynamiques plus générales .- L ’étude d ’autres méthodes de résolution.

6. Un exemple. Optimisation d ’une fonction avec des coefficients dynamiques7. Conclusions8. Références

Dpto. Tecnología ElectrónicaUniversidad de Málaga

1. Introduction

Pourquoi l’étude du modèle de Hopfield est-elle intéressante ?

Comme un outil

Les problèmes d’optimisation combinatoire, spécialement les NP-Complets n’ont pas de solution classique satisfaisante.

Il y a beaucoup de problèmes qui peuvent être formulés comme un problèmed’optimisation.

Comme un système intéressant en soi

Il peut être appliqué à des problèmes d’optimisation.

Le modèle est un système rebouclé avec des caractéristiques dynamiques très intéressantes.

Dpto. Tecnología ElectrónicaUniversidad de Málaga

1. Introduction

Quelques objectifs globaux de cet exposé

1. Il n’ y a pas une seule formulation du modèle de Hopfield.

Il faut faire une utilisation cohérente du modèle choisi pour chaque problème considéré et connaître ses limitationset possibilités.

2. Le travail avec le modèle de Hopfield n’est pas actuellement limité à la résolution de problèmes fictifs d’optimisation.

Il y a des problèmes ouverts en rapport avec la performanceou l’applicabilité du modèle à des problèmes réels.

Dpto. Tecnología ElectrónicaUniversidad de Málaga

2. Le modèle de Hopfield . Dynamiques.Dynamique Continue I

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

i

i

s

E

dt

du

∂∂

−= ∑ −=j

jiji

iIst

dt

du

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

On veut trouver le vecteur s =(si) qui minimisela valeur d’une fonction bilinéaire en s

Nous partons d’un système d’éléments fonctionnels si

Quelle dynamique doit suivre le système pour optimiser E ?

⇒⇒

g est continue, monotone croissante. g(x) →→ 0 si x →→ - ∝∝ et g(x) →→ 1 si x →→ ∝∝

Dpto. Tecnología ElectrónicaUniversidad de Málaga

2. Le modèle de Hopfield . DynamiquesDynamique Discrète

))(sgn()( tuts ii =

∑∑∑ +−=i

iij i

jiij stsstE 21)(s

0==

ii

jiij

t

tt

Hopfield (1982) propose un système rebouclé de neurones basés sur le modèle de McCulloch-Pitts

∑ −=+j

jiji iIsttu )1(

Hopfield démontre que sous les conditions

Le système évolue au sens de diminuer la valeur d’une fonction d’énergie E

Dpto. Tecnología ElectrónicaUniversidad de Málaga

2. Le modèle de Hopfield . DynamiquesDynamique Continue II

s t gu t

ii( ) (( )

)=β

∑ −+−=j

jijii

iIstu

dt

du

ij

jijii

i Istsgs

E

dt

du−+−=

∂∂

−= ∑− )(1β

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

Hopfield (1984) décrit une réalisation physique possible d’un réseau de neurones basée en Amplificateurs Opérationnels

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Quelle est la fonction d’énergie du système?

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

∑ −=j

jiji

iIst

dt

du

))(sgn()( tuts ii =

∑∑ ∑ +−=i

iij i

jiij stsstE 21)(s

s t gu t

ii( ) (( )

)=β

∑=

−+−=q

jjiji

ii

Istudt

du

1

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

∑ −=+j

jiji iIsttu )1(

Dynamique continue I

Dynamique discrète

Dynamique continue II

2. Le modèle de Hopfield . Dynamiques

Dpto. Tecnología ElectrónicaUniversidad de Málaga

)(2

)1(2

)1(2 1,,

22−+

++−+−= ∑∑∑∑ ∑∑ ∑ iyiiyx xy

xii

xyi x

xix i

xi sssdD

sB

sA

E

Le problème du voyageur de commerce

Il s'agit de trouver le chemin le plus court entre n villes, qui passe une seulefois par chaque ville et retourne a la ville de départ

Un exemple particulier : Le tour de France

3. Quelques exemples d ’application.

Armorica

Aginum

Burdigala

Camaracum

Divodurum

Durocortorum

Lugdunum

Lutetia

Massilia

Nicae

Tolosa

Rotomagnus

Le Village

Ordre de la visite

Le réseau

de n

euro

nes

dxy est la distance entre les villes x et y

Dpto. Tecnología ElectrónicaUniversidad de Málaga

On désire colorier les régions d'une carte géographique de sorte que des régions voisines aient des couleurs différentes. Empiriquement, on sait que quatre couleurs suffisent pour une telle tâche (http://www-leibniz.imag.fr/GRAPH/francais/definitions.html#planarite)

3. Quelques exemples d ’application.Le problème des quatre couleurs

Bel

ize

Gu

atem

ala

EL

Saa

lvad

or

Ho

nd

ura

s

Nic

arag

ua

Co

sta

Ric

a

Pan

amá

xji ij

xix

iji x

xi sstB

sA

E ∑∑∑∑ ∑≠

+−=2

)1(2

2

}1,0{∈ijs

tij = 1 si les régions i et j ont une frontière commune

Dpto. Tecnología ElectrónicaUniversidad de Málaga

3. Quelques exemples d ’application.Le problème de la bipartition d ’un graphe

Soit un graphe G avec N (pair) sommets. Il s'agit de diviser en deux parties égales, d ’une manière à minimiser le nombre d ’arcs entre les deux parties.

1;)( 2 ±=+−= ∑∑∑≠

ii

iji ij

iij ssBsstAE

Chaque si représente un sommet

tij = 1 si les sommets i et j ont un arc commun

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

∑ −=j

jiji

iIst

dt

du

))(sgn()( tuts ii =

∑∑ ∑ +−=i

iij i

jiij stsstE 21)(s

s t gu t

ii( ) (( )

)=β

∑=

−+−=q

jjiji

ii

Istudt

du

1

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

4. Les problèmes d’application des modèles de Hopfield.Confusion entre les différentes dynamiques

tIsttuttuj

jijii i∆+=∆+ ∑ − )()()(

tIsttuuq

jjijii i

∆+∆−=∆ ∑=

− )(1

∑ −=+j

jiji iIsttu )1(∑ −=+

jjiji i

Isttu )1(

Dynamique continue I

Dynamique discrète

Dynamique continue II

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

s t gu t

ii( ) (( )

)=β

4. Les problèmes d’application des modèles de Hopfield.Confusion entre les différentes dynamiques

∑ −=+j

jiji iIsttu )1(

Fréquemment les trois dynamiques sont mélangées. On peuttrouver beaucoup d ’articles qui commencent par décrire la dynamique continue I (réf. de Hopfield, 1984 obligée), puis appliquent une règle d’activationdiscrète et asynchrone (dynamique discrète), et analysent la trajectoire d’une énergie discrète.

Deux exemples très significatifs:

Hopfield and Tank (1985). Neural computation of decision in optimization problems,Biol. Cybernet., 52, pp. 141-152

Wilson and Pawley, (1988) On the stability of the travelling salesman problem algorithm of Hopfield and Tank, Bio. Cubernt., 58, pp. 63-70

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

∑ −=j

jiji

iIst

dt

du

))(sgn()( tuts ii =

∑∑ ∑ +−=i

iij i

jiij stsstE 21)(s

s t gu t

ii( ) (( )

)=β

∑=

−+−=q

jjiji

ii

Istudt

du

1

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

∑ −=+j

jiji iIsttu )1(

Dynamique continue I

Dynamique discrète

Dynamique continue II

4. Les problèmes d’application des modèles de Hopfield.Hopfield avec Dynamique Discrète. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Possibles trajectoires d ’ Evolution

(0,0,0) (1,1,1)

(1,1,0)(0,0,1)

(0,1,1)(1,0,1)

(1,0,0)

(0,1,0)

EA

B

CEspace des États. Représentation des possiblesétats pour un Réseau de Hopfield à 3 neurones avecdynamique discrète

B

1

A

C0

0.9

2

3

1

3

2

4. Les problèmes d’application des modèles de Hopfield.Hopfield avec Dynamique Discrète. Analyse de convergence

- Un réseau de n neurones a 2n d ’états possibles, mais à partir de chaque état le système ne peut évoluer que vers un d ’entre ses n voisins.

- Un tel réseau peut prendre un nombre exponentiel d ’opérations de recherche o(2n) pour trouver un minimum local.

- Un état minimum local de l’énergie, peut avoir un rayon d’attraction nul.

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

∑ −=j

jiji

iIst

dt

du

))(sgn()( tuts ii =

∑∑ ∑ +−=i

iij i

jiij stsstE 21)(s

s t gu t

ii( ) (( )

)=β

∑=

−+−=q

jjiji

ii

Istudt

du

1

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

∑ −=+j

jiji iIsttu )1(

Dynamique continue I

Dynamique discrète

Dynamique continue II

4. Les problèmes d’application des modèles de Hopfield.Hopfield avec Dynamique Continue I. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

s

Théorème : Soit s (0<si<1) une solution de Ts- I = 0. Alors, s est un point d’équilibre instable.

Il n’y a pas de faux états d ’équilibre dans l’intérieur de l’hypercube.

Une explication intuitive:

Pour chaque neurone si nous avons uneexpression linéaire de E(si)

jj

jiijj

iji sIsIstsE ∑∑ ++−= )()(

E(si)

si10

4. Les problèmes d’application des modèles de Hopfield.Hopfield avec Dynamique Continue I. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Si un sommet a une valeur d’énergie plus petite que le reste de ses sommets voisins, alors il possède un domaine d’attraction qui contient ses voisins.

Sauf pour l’existence de sommets dégénérés,les seuls point stables du système sont dessommets de l’hypercube .

s

Deux sommets adjacents qui ont une valeur d ’énergie différente ne peuvent pas être des états stables en même temps

4. Les problèmes des différentes dynamiques.Hopfield avec Dynamique Continue I. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑ −=j

jiji

iIst

dt

dutIsttuttu

jjijii i

∆+=∆+ ∑ − )()()(

4. Les problèmes des différentes dynamiques.Hopfield avec Dynamique Continue I. Discrétisation de la dynamique

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

La simulation par ordinateur implique une intégration numérique de l’équation de la dynamique continue.

La nouvelle dynamique n’est pas obligée de produire une diminution d ’énergie.

%minimum global Nombre moyen de pas

∆∆t = 1 6 1,983

∆∆t = 0.1 40 13,198

∆∆t = 0.01 100 51,389

Solution d’une Equation Diophantienne avec un réseau de Hopfield continue I

Dpto. Tecnología ElectrónicaUniversidad de Málaga

∑∑ ∑ +−=ii

iij i

jiij sIsstE 21)(s

))(()( tugts ii =

∑ −=j

jiji

iIst

dt

du

))(sgn()( tuts ii =

∑∑ ∑ +−=i

iij i

jiij stsstE 21)(s

s t gu t

ii( ) (( )

)=β

∑=

−+−=q

jjiji

ii

Istudt

du

1

∑∫∑∑∑ −++−=i

s

iii

iii

ij

jij

i

dssgsIsstE0

1 )(2

∑ −=+j

jiji iIsttu )1(

Dynamique continue I

Dynamique discrète

Dynamique continue II

4. Les problèmes des différentes dynamiques.Hopfield avec Dynamique Continue II. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Théorème :Soit E une fonction bilinéaire polynomiale sur Rn, que nous voulons optimiser.Soit {ββi} une séquence de nombres positifs tendant vers zéro.Alors quelle que soit la condition initiale s(t0) de notre système, sauf pour unensemble non dense, le système converge vers un état e+o(ββi), où e est un sommetet un minimum local de E.

Application pratique:

1. Partir d’un état initial aléatoire et ββ élevé.

2. Laisser évoluer le système jusqu’à l’équilibre (point intérieur).

3. Si la distance entre ce point et un sommet peut être considérée plus petite que l ’erreur, alors

le minimum est trouvé. Sinon,

diminuer ββ et tourner au pas 2.

ββ1

ββ2

ββ3

ββ4

ββ5

4. Les problèmes des différentes dynamiques.Hopfield avec Dynamique Continue II. Analyse de convergence

Dpto. Tecnología ElectrónicaUniversidad de Málaga

5. Quelques lignes de travail L ’étude des dynamiques plus générales

Le modèle de Hopfield généralisé d’ordre élevé

d u

d tu w s si

i i i i i ii i Cj

q

ij j

j jn

= − + −∈=

∑∑ , ...( ,... )

. . .1 1

11

I

s t gu t

ii( ) (( )

)=β

∑∫∑∑ ∑ −

=

≠∈

++−=i

s

iii

q

j

iii

Ciiiiiiii

i

j

njj

jjdssgsIssswE

0

1

1

,...,

)...(..., )(...

1

1

11β

Applicabilité à l’optimisation de fonctions multilinéaires

Dpto. Tecnología ElectrónicaUniversidad de Málaga

5. Quelques lignes de travail Etude d ’autres méthodes de résolution

Soit la EDO )(sfdt

ds=

“Forward Euler Rule” “Backward Euler Rule”

)(1 nnn sftss ∆+=+ )( 11 ++ ∆+= nnn sftss

Approchée par

Dpto. Tecnología ElectrónicaUniversidad de Málaga

5. Quelques lignes de travail Etude d ’autres méthodes de résolution

))(()( tugts ii =)(sii net

dt

du= )()( xtanhxg =

Dynamique continue I

)(sfdt

ds=

⇒⇒)()1(

1)( 2 snetssf −=

βdt

du

du

ds

dt

ds= ;

“Backward Euler Rule” ))1(())1(1(1

)()1( 2 ++−∆+=+ nnetnstnsns iiii sβ

Dpto. Tecnología ElectrónicaUniversidad de Málaga

5. Quelques lignes de travail Etude d ’autres méthodes de résolution

Comparaison des règles

“Forward Euler Rule”“Backward Euler Rule”

Il faut résoudre une équation nonlinéaire pour chaque itération

La méthode produit directement la solutionpour chaque itération

Le temps de calcul pour chaque itération est plus grand pour la méthode implicite

Il préserve la stabilité de l’équationdifférentielle pour des ∆∆t grands.

Méthode implicite

Il a besoin de ∆∆t extrêmement petit pourpréserver la stabilité de l’équation différentielle.

Le méthode implicite peut trouver un point stable avec un nombre plus petit d’itérations.Ce fait compense l’inconvénient du temps de calcul

Méthode explicite

Dpto. Tecnología ElectrónicaUniversidad de Málaga

6. Un exemple. Optimisation d ’une fonction avec des coefficients dynamiques

Le système(Linéaire dans les paramètres)

),,( θuxfxy == & x,u sont mesurables

θ),( uxAxy == &

Le problèmeL’estimation « on line » des paramètres: Trouver une règle d’adaptation des paramètres estimés qui minimise l’erreur de prédiction

)ˆ(ˆ θθ g=& 22)ˆ,,( θuxfye −=

Règle d’adaptation Erreur de prédiction

Dpto. Tecnología ElectrónicaUniversidad de Málaga

( )yAAAke

k TT +−=∂

∂−= θ

θθ ˆ2

ˆˆ

2&

Fonction qui doit être optimisée

Réalisation du modèle de Hopfield(Dynamique continue I)

))(()( tugts ii =

)(sii net

dt

du=

)()( xtanhxg =

∑∑∑ +−=ii

iij i

jiij sIsstE 21)(s

θ̂≡s

yAAAeE TTTT θθθ ˆˆˆ2

1

2

1 2 −=≡)/tanh( βnets =

yAAsAu TT +−=.

yAI T−=AAT T−=

(Ici tii� 0)

6. Un exemple. Optimisation d ’une fonction avec des coefficients dynamiques

Dpto. Tecnología ElectrónicaUniversidad de Málaga

6. Un exemple physique. Le pendule inversé

uml

xml

vx

l

gxy

22

1sin +−−== &&&

( )uxxA ,,sin &=T

mlml

v

l

g

−−=

22

1,,θ

Erreur d’estimation pour ϑϑ1

Intégral de l ’erreur de prédiction

Dpto. Tecnología ElectrónicaUniversidad de Málaga

7. Conclusions

1. Trois modèles différents du paradigme de Hopfield ont été présentés.

2. L’applicabilité de ces modèles à des problèmes d’optimisation combinatoire a été justifiée.

3. On a remarqué le risque de confondre ou mélanger les éléments constitutifs des trois modèles.

4. Pour les trois modèles les caractéristiques de convergence vers un minimum local ont été étudiées.

5. L’effet de la discrétisation d’une dynamique continue a été analysé sous la perspective de la conservation de la fonction d’énergie.

6. Une technique nouvelle de discrétisation qui utilise des méthodes numériques implicites a été introduite.

7. Le modèle de Hopfield a été appliqué dans le contexte de l’optimisation dynamique.

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Références

Références avec d’exemples d’application.

Garey, M.R., Johnson, D.S., (1979), Computers and intractability. A guide to the theory ofNP-Completeness, W.H. Freeman and Company.

Hertz, J., Krogh, A., Palmer, R.G., (1991), Introduction to the theory of neural computation,Addison-Wesley.

http://home.alex.tuxfamily.org/pvc.html

http://www-leibniz.imag.fr/GRAPH/francais/definitions.html#planarite

Références sur le modèle de Hopfield avec dynamique discrète.

Joya, G., Atencia, M.A., Sandoval, F., Hopfield neural networks applied to optimization probelms: some theoretical and simulation results, in LNCS 1240, Proceedingsof the IWANN’97, Verlag, pp. 246-257, (1997)

Vidyasagar, M., Are Analog Neural Networks Better than Binary Neural Networks?, CircuitsSystems Signal Processing, Vol. 17, No. 2, pp. 243-270, (1998)

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Références sur le modèle de Hopfield avec dynamique continue II.

Vidyasagar, M., Minimum-seeking properties of analog neural networks with multilinear objective functions, IEEE Trans. On Automatic Control, Vol. 40, No. 8, pp. 1359-1375 (1995).

Amari, S., I., Chen, T., New theorems on global convergence of some dynamical systems, Neural Networks, Vol. !4, pp. 251-255, (2001).

Références que analysent les trois modèles.

Joya, G., Atencia, M.A., Sandoval, F., Hopfield neural networks for optimization: study of the different dynamics, Neurocomputing, Vol. 43, pp. 219-237, (2002).

Références

Références sur le modèle de Hopfield avec dynamique continue I.

Abe, S.. Global convergence and suppression of spurious states of the Hopfield neuralnetworks, IEEE Trans. On Circuits and Systems I: Fundamental Theory and Applications, Vol. 40, No. 4, pp. 246- 257, (1993).

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Références sur l ’étude d ’autres méthodes de resolution.

Stuart, A., Humphries, A., Dynamical systems and numerical analysis. Cambridge University Press (1996).

Atencia, M.A., Joya, G., Sandoval, F., Continuous-state Hopfield Dynamics based on Implicit Numerical Methods, in Proc. Of ICANN ’2002, (2002)

Références