barycentre et première composante principale sur des graphes

40
Barycentre et premi ` ere composante principale sur des graphes I. Gavra Universit ´ e Paul Sabatier Toulouse Joint work with S. Gadat, L. Miclo, L. Risser. Journ ´ ees IOPS, 5-7 Juillet 2017

Upload: others

Post on 18-Jun-2022

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Barycentre et première composante principale sur des graphes

Barycentre et premiere composante principale sur desgraphes

I. Gavra

Universite Paul Sabatier ToulouseJoint work with S. Gadat, L. Miclo, L. Risser.

Journees IOPS, 5-7 Juillet 2017

Page 2: Barycentre et première composante principale sur des graphes

I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet

II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique

III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique

IV - Simulations

V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion

Page 3: Barycentre et première composante principale sur des graphes

I - 1 Motivations - Donnees structurees par des graphes

Objet flexible permettant de structurer des donnees :Bibliometrie :

Page 4: Barycentre et première composante principale sur des graphes

I - 1 Motivations - Donnees structurees par des graphes

� Cinema� Reseaux sociaux� Marketing

Page 5: Barycentre et première composante principale sur des graphes

I - 2 Geometrie sommaire

La geometrie est decrite sommairement par differents indicateurs :

� Nombre de nœuds� Distribution des degres� Nombre de triangles� . . .

On peut egalement optimiser/calculer des clusters (moins simple) :� Algorithme de Louvain� Spectral Clustering� . . .

Ou bien optimiser/calculer des representations (encore plus difficile) par desalgorithmes de forces :

� Kamada–Kawai (1989)� Fruchterman-Reingold (1991)� . . .

Page 6: Barycentre et première composante principale sur des graphes

I - 3 Geometrie encore plus elementaire ( !)

Comment calculer le barycentre d’un graphe ?

Si parfois la reponse semble sauter aux yeux . . .

FIGURE: Desserte Air France - KLM

Page 7: Barycentre et première composante principale sur des graphes

I - 3 Geometrie encore plus elementaire ( !)

Elle peut parfois laisser perplexe . . .

FIGURE: Graphe de citations - Jonathan Goodwin website

Page 8: Barycentre et première composante principale sur des graphes

I - 4 Formalisation

On se donne un graphe G parametre par� V � t1, . . . , nu ensemble de sommets� E � pwi,jq1¤i,j¤n ensemble d’aretes

Ce graphe est suppose :� Non oriente et pondere :

@pi, jq P V2 wi,j � wj,i P r0,�8s� Si wi,j � 8 il n’y a pas d’arete directe entre i et j.� Plus wi,j est petit, plus l’arete directe entre i et j est courte.� Il n’a pas des boucles : wi,i � 0� Complet : il ne possede qu’une seule composante connexe.

L’objet principal : la distance geodesique sur le graphe G :

dpi, jq � mini�i1Ñi2Ñ...Ñik�j

k�1

`�1

wi`,i`�1 .

Page 9: Barycentre et première composante principale sur des graphes

I - 5 Moyenne de Frechet

V est lui-meme pondere par une distribution de probabilites : ν

ν traduit l’importance du noeud vis-a-vis du :� nombre de citations d’un auteur� nombre de telechargements d’un article sur ArXiv, . . .� nombre d’entrees enregistrees par la filmographie d’un acteur

Leger souci : la geometrie du graphe n’est pas ! plate " !

Sur un espace euclidien Rd, la moyenne d’une distribution µ est

arg minxPRd

»Rd}x� y}2dµpyq.

Le barycentre du graphe G est alors defini par la moyenne de Frechet :

Mν :� arg minxPE

Uνpxq ou Uνpxq � 12

»G

d2px, yqνpyq. (1)

Page 10: Barycentre et première composante principale sur des graphes

I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet

II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique

III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique

IV - Simulations

V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion

Page 11: Barycentre et première composante principale sur des graphes

II - 1 Principe du recuit simule

Quelques rappels sur la methode du recuit simuleHistorique :

� Methode de Laplace, 1800� Grandes deviations : Freidlin & Wentzell, 1965� Algorithme initial : Kirkpatrick, Gelatt, Vecchi, Science,’83� Premiere preuve : Hajek, M.O.R. ’88� Version analyse spectrale : Holley, Kusuoka, Stroock , J.F.A. ’89, Miclo,

I.H.P. ’92

U fonction a minimiser, essentiellement deux idees pour S.A. :

� Utiliser une methode de Laplace et le comportement asymptotique de

πβ9e�Uβ ÝѸ

i

αiδxi

T � 1{β est la temperature.� Realiser un compromis exploration / exploitation par le biais d’un

processus de Markov, continu ou discret.

Page 12: Barycentre et première composante principale sur des graphes

II - 1 Principe du recuit simule discretE espace d’etats discret. Chercher

arg minxPE

Upxq

� L’exploitation est realisee par un schema de temperature decroissant

βn ÝÑ �8 lorsque n ÝÑ �8.� L’exploration se fait par le biais d’une chaıne de Markov pXnqnPN sur E.� A chaque ! instant ", on utilise une transition Markovienne Qn reglee

pour que la mesure invariante instantanee soit πβn .

Algorithm 1: Metropolis-Hastings Simulated AnnealingData: Fonction U. Schema de temperature pTkqk¥0, Noyau K

1 Initialisation : X0 P E;2 for k � 0 . . .�8 do3 Simuler x1 � KpXk, .q et calculer pk � 1^

!eT�1

k rUpXkq�Upx1qs Kpx1,XkqKpXk,x1q

)4 Actualiser Xk�1 selon Xk�1 �

#x1 avec probabilite pk

Xk avec probabilite 1� pk

5 end6 Sortie : limkÝÑ�8 Xk

Page 13: Barycentre et première composante principale sur des graphes

II - 1 Principe du recuit simule continu

E espace d’etats continu (typiquement Rd). Chercher

arg minxPE

Upxq

� L’exploitation est realisee par un schema de temperature decroissant

βt ÝÑ �8 lorsque t ÝÑ �8.� L’exploration se fait par le biais d’un processus de Markov pXtqt¥0 a

valeurs dans E, et inhomogene en temps.� A chaque ! instant ", le generateur markovian Lβt est regle pour que la

mesure invariante instantanee soit πβt .

Algorithm 2: Langevin Simulated AnnealingData: Fonction U. Inverse de temperature pβtqt¥0

1 Initialisation : X0 P E;2 @t ¥ 0 dXt � �βt∇UpXtqdt � dBt

3 Sortie : limtÝÑ�8 Xt

Page 14: Barycentre et première composante principale sur des graphes

II - 2 Optimisation stochastique

Absence de convexite contourne par S.A., mais il y a encore un probleme :

Uνpxq � EY�νrd2px, Yqs �»

EUpx, yqdνpyq

et ν est :� soit inconnue� soit rend le calcul exact de Uν inconcevable en temps de calcul

On exploite une idee provenant des algorithmes stochastiques :

9xt � �∇Uνpxtq ðñ Xn�1 � Xn�γn�1BxUpx, Yn�1q avec pYjqj¥0 i.i.d. � ν

avec ¸n

γn � �8¸

n

γ1�εn   �8, pour un ε ¡ 0.

Il suffit de pouvoir faire des evaluations non biaisees des transitions pour quel’algorithme stochastique soit voisin de la descente de gradient standard.

@x P E E rBxUpx, Yn�1qs � ∇Uνpxq

Page 15: Barycentre et première composante principale sur des graphes

II - 2 Optimisation stochastique

� Notation importante :Uypxq � d2px, yq

� Recuit simule couple a de l’optimisation stochastique ?� On a acces a une suite de v.a. pYnqn¥0 i.i.d. avec Yi � ν.

� Dans le cas discret (Metropolis-Hastings) :

EYn�1�ν rPrXn�1 � x|Xn � x, Yn�1ss � EYn�1�ν

�eT�1

k rUYn�1 pXkq�UYn�1 pxqs�

� eT�1k EYn�1�ν rUYn�1 pXkq�UYn�1 px

1qs

� PMH�SA rXn�1 � x|Xn � xsBilan :

� Une seule observation Y a chaque iteration ne suffit pas� Transition MH � sans biais : evaluations batch dont le nombre Õ avec n

Page 16: Barycentre et première composante principale sur des graphes

II - 2 Optimisation stochastique

� Notation importante :Uypxq � d2px, yq

� On a acces a une suite de v.a. pYnqn¥0 i.i.d. avec Yi � ν.

� Recuit simule couple a de l’optimisation stochastique ?� Dans le cas continu (Langevin) : @f P C2pEq

EY�ν

�LYβt pf q

�� EY�ν

��βtx∇xf ,∇xUyy � 1

2∆f�

� �βtx∇xf ,∇xUνy � 12

∆f

� LUνβtpf q!

Il semble plus propice de se tourner vers Langevin-SA.

Page 17: Barycentre et première composante principale sur des graphes

II - 3 Relax quantiqueIl convient d’operer une relaxation du probleme initial, en gerant un espacecontinu ΓG a la place du graphe discret G :

� Mieux qu’un long discours :

FIGURE: Un exemple de graphe quantique/metrique, source : Wikipedia.

� Une arete e est desormais un segment de longueur Le, associee a uneparametrisation xe P r0, Les.

� L’arete est orientee : 0 pointe sur une extremite, Le sur l’autre.� Notion de distance geodesique.

dpx, yq � txe � dpep0q, yqu ^ tLe � xe � dpepLeq, yqu

� On ecrit e � v lorsque l’arete e a une extremite qui est v P V.

Page 18: Barycentre et première composante principale sur des graphes

II - 3 Relax quantique

Les operateurs differentiels sont definis sur ΓG :

� Premier ordre : extension ! triviale " sur la reunion des interieurs desaretes :

@pf , gq P C1pΓGq @e P E @x P e x∇f pxq,∇gpxqy � x∇f pxeq,∇gpxeqy� Second ordre : extension ! triviale " du Laplacien a l’interieur des aretes.

∆f pvq :� d2e f pvq

Soit DpLq le sous-ensemble des fonctions f P C2pΓGq qui verifient lesconditions de Neumann :

DpLq :�#

f P C2pΓGq t.q. @v P V¸e�v

ae,vdef pvq � 0

+.

Pour tout f P DpLq on definit :

@f P DpLq @x P ΓG Ltpf qpxq � �βtx∇Uνpxq,∇f y � 12

∆f pxq

Page 19: Barycentre et première composante principale sur des graphes

II - 3 Relax quantique

Via les operateurs differentiels sur ΓG et le domaine DpLq, on a :

Theorem (Freidlin-Wentzell AoP’93)Il existe un unique processus de Markov pXtqt¥0 tel que pour toute fonction fdans DpLq,

f pXtq � f pX0q �» t

0Lf pXsqds,

est une martingale locale.

Definit un processus Feller-Markov sur ΓG (probleme Martingale bien pose)qui essentiellement :

� Est une diffusion standard a l’interieur des aretes� Rebondit uniformement sur tous les voisins aux extremites lorsqu’on

choisit :ae,v � 1

nv

Remarque : On peut definir d’autres diffusions sur ΓG en choisissant d’autresgluing conditions (absorption avec probabilite ¡ 0 par exemple).

Page 20: Barycentre et première composante principale sur des graphes

I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet

II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique

III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique

IV - Simulations

V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion

Page 21: Barycentre et première composante principale sur des graphes

III - 1 Recuit homogeneiseOn souhaite utiliser un processus sur ΓG qui possede la dynamique

Ltpf q � �βtx∇Uν ,∇f y � 12

∆f � �βtEY�ν rx∇UY ,∇f ys � 12

∆f

EY�ν correspond a utiliser au temps t une ! infinite " d’observations Y � ν.On definit un processus markovien couple pXt, Ytq :

� Xt : position courante dans ΓG de l’estimation de la moyenne de Frechet� Si la coordonnee Yt est figee sur une valeur y, alors :

Lp1qt,y pf qpxq � �βtx∇xUy,∇xf y � 12

∆xf

Dynamique de Y� Yt : arrivees via un processus de Poisson d’intensite pαtqt¥0.� Chaque nouvelle arrivee est distribuee sur les noeuds de G selon ν.� Cette transition a pour generateur celui du processus de saut :

Lp2qt pf qpyq � αt

»Grftpx, y1q � ftpx, yqsdνpy1q

! Approximation stochastique " : @x P ΓG @y P G

Ltpf qpx, yq � �βtx∇Uypxq,∇xf y � 12

∆xf pxq

�αt

»Grftpx, y1q � ftpx, yqsdνpy1q

Page 22: Barycentre et première composante principale sur des graphes

III - 1 Recuit homogeneise

Algorithm 3: S.A. homogeneise sur ΓG

Data: Fonction U. Schema de temperature pβtqt¥0. Intensite pαtqt¥0

1 Initialization : Choisir X0 P ΓG et T0 � 0 ;2 for k � 0 . . .�8 do3 while Nαt � k do4 Xt evolue comme un M.B. sur ΓG initialise en X�Tk

.5 end6 Tk�1 :� inftt : Nαt � k � 1u et utiliser Yk�1 � YNαt de loi ν ;7 Le processus Xt saute de X�t vers Yk�1 :

Xt � X�t � βtα�1tÝÝÝÑXtYNαt , (2)

ou ÝÝÝÑXtYNαt est le chemin geodesique de Xt vers YNαt dans ΓG.8 end9 Sortie : limtÝÑ�8 Xt

Comprehension de la formule (2) : on saute de X�t dans la direction YNαt surune distance qui est βtα

�1t .

“Discretisation” Euler explicite de l’EDS :

dXt � �βt∇UYt pXtqdt � dBt

Page 23: Barycentre et première composante principale sur des graphes

III - 1 Recuit homogeneise

Une illustration graphique :

FIGURE: Evolution schematique du S.A. homogeneise sur ΓG. On observe un saut enT1 vers YT1 � N1 puis un mouvement Brownien sur ΓG pendant T2 �T1. Puis un secondnoeud est echantillonne selon ν : ici YT2 � N5 et un saut vers YT2 a lieu au temps T2.

Page 24: Barycentre et première composante principale sur des graphes

III - 2 Etude theorique

Notations utiles :

LpXt, Ytq � mt avec ntpxqdx �»

Vmtpx, yqdy et mtpy |xq :� PrY � y |Xt � xs.

Si µβt9 e�βtUν , on va etudier l’evolution conjointe de

Jt :� KLpnt, µβt q �»

ΓG

log�

ntpxqµβt pxq

�dntpxq

et

It :�»

KLpmtp.|xq||νqdntpxq �» �»

log�

mtpy|xqνpyq

�mtpy|xqdy

�dntpxq

En particulier, si Jt ÝÑ 0, l’inegalite de Pinsker implique

PrUpXtq ¡ min Uν � δs ¤ µβt tU ¡ min U � δu � ?2Jt.

On conclut alors puisque :

µβt tU ¡ min U � δu ÝÑ 0 exponentiellement vite O�

e�βtδ

Page 25: Barycentre et première composante principale sur des graphes

III - 2 Etude theorique

Evolution de Jt : un calcul (presque) standard demontre que

J1t ¤ C1pΓGqrβ1t � β2t Its � 2

»ΓG

�∇x

#dntpxqµβt pxq

+�2

µβt pdxq

On demontre alors une inegalite de Log-Sobolev verifiee par µβt sur ΓG :»

ΓG

�∇x

!aψpxq

)2µβt pdxq ¥ e�c�pUνqβt

C2pΓGqp1� βtq»

ΓG

ψpxq log rψpxqs dµβt pxq,

Proposition

J1t ¤ C1pΓGqrβ1t � β2t Its � e�c�pUνqβt

C2pΓGqp1� βtq Jt

La constante c�pUνq est fondamentale.

c�pUνq :� maxpx,yqPΓ2

G

rHpx, yq � Uνpxq � Uνpyqs �minpUνq

ou Hpx, yq � minγ:xÑy maxsPγx,y Uνpsq.

Page 26: Barycentre et première composante principale sur des graphes

III - 2 Etude theoriqueEvolution de It : On demontre que

I1t ¤ �αtIt � J1t � C1pΓGqrβ1t � 6β2t s.

Plus l’intensite des arrivees est importante, plus vite It ÝÑ 0.� Calibration finale des deux parametres pαtqt¥0 et pβtqt¥0, on veut :

limt�8

It � limt�8

Jt � 0 et αt le plus petit possible.

� On calibre Kt � Jt � ktIt et etablit une inegalite en

K1t ¤ �εtKt � ηt,

avec εt � e�c�pUν qβt

C2pΓGqp1�βtqet ηt � α�1

t .� Le lemme de Gronwall assure la convergence de Kt vers 0 des que»

εsds � �8 et ηt � opεtq.

TheoremSi on choisit βt � β logpt � 1q avec β   c�pUνq�1 et αt � t , alors

limt ÞÝÑ�8

Kt � 0.

Page 27: Barycentre et première composante principale sur des graphes

I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet

II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique

III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique

IV - Simulations

V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion

Page 28: Barycentre et première composante principale sur des graphes

IV - 1 Reseau social

N80

N330

N202

N187

N180

N210

N194

N254

N266N141

N329

N142 N21

N66

N332

N331N72 N79

N48

N75

N285

N276

N104

N186

N204

N200

N161

N53

N122

N113

N16 N134

N318

N145

N123

N256

N63

N26

N323

N342

N67N169

N188

N322

N9

N213

N55N15

N344

N233

N234

N118

N25N239

N62

N261

N277N203 N56

N242

N249

N341

N208

N315

N148

N290

N196

N101

N85

N166

N106

N292

N179

N297

N231

N257

N69

N121

N183

N164

N117

N221

N159

N77

N90

N165

N345

N39

N45

N294

N209

N215

N74

N153

N299

N94

N24

N346

N92N302

N336

N76

N300

N73

N191

N126

N160

N228

N54

N105

N10

N57

N88

N30

N27

N260

N50

N303

N38

N1

N3

N236

N133 N130

N272

N280

N178 N283

N270

N184

N281

N320

N284

N135

N197

N139

N251

N206

N108

N127

N36

N309

N348

N479

N404

N445

N461

N392

N387

N431

N395

N419

N426

N451

N439 N397

N370

N460

N373

N432

N402

N444

N421

N420

N413

N198

N495

N473

N471

N448

N425

N386

N441

N415

N379

N455

N463

N390

N442

N372

N407

N422

N466

N429N352

N107

N374

N34

N428

N456N484

N363

N409

N173N465

N427

N440

N430

N393

N464

N462

N423

N453

N447

N459

N380

N443

N468

N485

N435

N457

N358

N477

N357

N486

N389

N401

N381

N424

N467

N454

N498

N411

N356

N472

N499

N437

N351

N476

N384

N406

N364

N385

N369

N469

N350

N399

N480

N449

N371

N433

N362

N89

N225

N102

N143

N95

N319

N287

N46

N23

N177

N227

N47

N131 N289

N43

N273

N264

N218

N78

N328

N306

N86

N174

N17

N162

N140

N114

N19

N116

N157

N71

N155

N61

N245

N267

N307

N286

N124

N49

N237

N129

N190

N347

N81

N125

N51

N175

N68

N83

N240

N99

N278

N301

N255

N8

N91

N181

N275

N193

N241

N152

N337

N32

N282

N279

N305

N216

N151

N44

N167

N205

N333

N14

N28

N244

N111

N93

N310

N20 N226

N312N220

N343N112

N41

N144

N138

N293

N262

N326

N149

N214

N2

N115

N259

N52

N182

N201

N110

N97

N137

N192

N253

N243

N230

N70

N29

N265

N238

N82

N212

N268

N316

N18

N171

N217

N64

N163

N100

N58

N223

N13

N59

N211

N128

N222

N176

N87

N150

N146

N207

N339

N258

N274

N96

N5

N98

N172

N298

N295

N271

N334

N109N252

N11

N35

N12

N335

N37

N154

N185

N325

N313 N248

N232

N199

N132

N40

N314

N304

N170

N291

N308

N324

N0

N224

N156

N119

N158

N490

N489

N418

N474

N396

N361

N382

N410

N359

N367

N434

N482

N488

N416

N388

N446

N438

N417

N391

N493

N492

N483

N414

N481

N353

N497

N354

N458

N360

N355

N475

N452

N470

N450

N403

N398

N400

N436

N408

N376

N378

N375

N412

N368

N349

N405

N383

N377

N478

N491

N365

N494

N366

N487

N496

N394

N147

N288

N263

N22

N120

N250

N296

N327 N229

N321

N6

N338

N311

N247

N219

N195N4

N269

N33

N189

N42

N103

N136

N246

N84

N31

N60

N65

N235

N340

N317

N7

N168

FIGURE: Resultat sur un sous-graphe de Facebook de 500 noeuds et 4000 arete.

Visualisation : Cytoscape

Page 29: Barycentre et première composante principale sur des graphes

IV - 1 Reseau social

FB500 FB2000 FB4000β Error Med. Freq. Av. time Error Med. Freq. Av. time Error Med. Freq. Av. time14 β� 15 % 0.6042 0.95 s 28 % 0.3519 10.12 s 27 % 0.3314 12.41 s

12 β� 2 % 0.4184 1.38 s 1 % 0.7268 4.25 s 5 % 0.6534 14.11 s

β� 0 % 0.8008 1.48 s 0 % 0.9418 12.36 s 1 % 0.8913 13.55 s

2β� 0 % 0.8321 11.31 s 0 % 0.9892 8.52 s 0 % 0.9647 16.79 s

4β� 0 % 0.8233 13.19 s 0 % 0.9930 15.58 s 0 % 0.9824 31.43 s

8β� 0 % 0.7717 2.36 s 0 % 0.9750 23.25 s 0 % 0.9445 44.46 s

FB500 FB2000 FB4000S Tmax Error Med. Freq. Av. time Error Med. Freq. Av. time Error Med. Freq. Av. time12 S� T�max 2 % 0.7667 0.59 s 0 % 0.9344 3.22 s 0 % 0.8614 6.70 s

S� 2T�max 0 % 0.8049 2.79 s 0 % 0.9610 9.30 s 0 % 0.8970 24.42 s

S� 4T�max 0 % 0.8101 5.60 s 0 % 0.9677 22.21 s 0 % 0.9222 54.73 s

2S� T�max 1 % 0.8345 2.26 s 0 % 0.9512 8.39 s 0 % 0.9062 20.95 s

2S� 2T�max 0 % 0.8361 4.57 s 0 % 0.9586 23.30 s 0 % 0.9121 23.30 s

2S� 4T�max 0 % 0.8423 11.16 s 0 % 0.9735 11.16 s 0 % 0.9366 96.84 s

Temps moyen d’execution sur 100 MC : 13 secondes

Page 30: Barycentre et première composante principale sur des graphes

IV - 2 Donnees reelles

ROI

Page 31: Barycentre et première composante principale sur des graphes

IV - 2 Donnees reellesSzulga

Bonichon

Marckert

Mallows

vanDijk

Demichel

Raugi

Simatos

Horowitz

Yamazaki

Ferraz

Barth

Sol\\xc3\\xa9

Egami

Decreusefond

Randriambololona

MoyalTran

Vergne

Delattre

HuGarc\\xc3\\xada Moore

Verd\xc3\xba

Valencia-Pabon

McDiarmid

Z\\xc3\\xa9morVall\\xc3\\xa9eScheicher

Szpankowski

Denise

Oudjane

Rubenthaler

Logothetis

Marsalle

Leonardi

Rosenkrantz

Stanley

Waterman

Altman

DhersinCoutin

Ponty

Flajolet

Ravelomanana

Pouyanne

Banderier

Rouault

Tolley

Louchard

Gouyou-Beauchamps

Francon

Randrianarimanana

Bousquet-M\\xc3\\xa9lou

Paccaut

Corteel

Zimmermann

Ludkovski

SteeleDorea

K\\xc3\\xb6rezlio\\xc7\\xa7lu

Yukich

Deguy

Puech

Promislow

GardyMilevsky

Ney

Feinberg

Sen

Trashorras

Hillairet

Siri-Jegousse

Gao

\\xc3\\x89tor\\xc3\\xa9

Bertein

Suen

deSaporta

vanGaans

Zhang

Rulliere

Falconnet

Wigderson

Norros

Lubachevsky

Brown

Hill

Ivanoff

Freedman

Richou

Spruill

Alencar

Zajic

Schneider

Bordenave

Ruci\xc5\x84ski

Mordecki

Leung

Cocozza-Thivent

Fricker

Fischer

Tibi

Vallois

Ravanelli

Weil

Zhang

Weiss

Reitzner

Billera

Thimonier

Geniet

Bensusan

Wang

Yuan

Henard

Chalendar

Kleinberg

Feige

Karp

Mathieu

Bayraktar

Delmas

Huang

Peleg

Kravitz

Dupuis

Zhang

Liang

Yang

Luccio

Najim

Lueker

Aza\xc3\xafs

Khorunzhiy

Borodin

Mercier

Zhou

Shamir

Azar

Raghavan

Montanari

DasSarma

Slivkins

Broder

Straka

LeGland Chen

Yang

Merhav

Roussignol

Celani

Frieze

KarlinUpfal

Dyer

RobinsonMolla

Pietracaprina

Augustine

Pandurangan

Pisanti

Grossi

KumarDworkMitzenmacher

Salhi

Balan

Zinn

Robert

Fayolle

Temme

MahmoudHordijk

Madiman

Valchev

Aistleitner

El-Nouty

Panholzer

Chigansky

Prodinger

Antunes

Lew

DrmotaAkhavi

Liu

Kuba

dePanafieu

Young

Gittenberger

Budhiraja

Zhou

Regnier

Shwartz

Luschgy

Cohen

Lavault

Huang

Montseny

Song

LelargeEstrade

B\\xc3\\xa1r\\xc3\\xa1ny

Pra\\xc5\\x82at

Gross

MastersSworder

Wu

Sturm

Carey

Maslov

Faddeev

Bobkov Kwapie\\xc5\\x84Guerin

Hamadene

Rutkowski

Bielecki

Orlandi

Cisse Sirbu

BenAlayaTanr\\xc3\\xa9

Schachermayer

Voiculescu

Manou-Abi

Graf

Chistyakov

Christen

Guillin

Albuquerque

Nappo

Ruh

Stockbridge

LeBorgne

Miller

Song

Schreiber

Djehiche

Marchioro

Huet

Hairer

Zabczyk

Tyukov

Mityagin

Doebner

Filipovi\xc4\x87

Weisz

Carmona

Nikeghbali

Sayit

Kabanov

Zani

Guiol

Spehner

Ferri\\xc3\\xa8re

Mania

Maillard

Stauffer

Yehudayoff

Locherbach

Yadin

Schramm

Bardet

Stoltz

Vincenzi

Janssens

Dorobantu

Makarychev

Veber

Andjel Dozzi

Fehr

Peled

Wakolbinger

Kurtz

Wilson

Benjamini

Soundararajan

Ramanan

G\xc3\xb3ra

Tsur

Shinkar

H\\xc3\\xa4ggstr\\xc3\\xb6m

Williams

Delbaen

JonassonMiclo

Hinz

Hernandez-Hernandez

Thieullen

Lima

Schmitt

Grorud

Bucklew

Iscoe

UtzetCoquet

Goodman

Chern

Kane

Ofek

Kendall

Bansaye

Marton

Rhoades

Barrieu

Th\xc3\xa4le

Simonyi

Aldous

DAristotile

Diaconis

Ewald

Pimentel

K\\xc3\\xb6rner

Alonso

Gillet

Janson

Remy

Kardaras

Reingold

Tetali

Amami

Dombry

\xc5\x81uczak

Krell

Nadtochiy

Hanlon

Evstigneev

Zitt

Calka

Sly

Herbertsson

B\\xc3\\xb6r\\xc3\\xb6czky

Hitczenko

Crawford

Pene

Chung

Anulova

Bugeaud

Alon

Chassaing

Brightwell

Hug

Mahfoudh

Kira

Mairesse

Spencer

Loukianov

Garcia

Loukianova

Galves

Lov\\xc3\\xa1sz

ZeitouniJolis

Mart\\xc3\\xadnez

Romik

Angel

ChronopoulouDuminil-Copin

Gurel-Gurevich

Sol\\xc3\\xa9

vanderHofstad

Kulske

Nourdin

Muhle-Karbe

Baxendale

Lyons

Izkovsky

Steif

Gobet

Cattiaux

Lladser

Rost

Takahashi

DaiPra

Sodin

Shkolnikov

Gallardo

Bahsoun

Friedli

Martin

OConnell

Schoenmakers

Mazliak

Karatzas

Kannan

Zhang

Lambert

Petz

Caputo

Guerbaz

Teichmann

Chen

Berger

Meda

Hoffman

Szpirglas

Kozma

Feldman

Melnikov

Kallsen

Rosen

Chavel

Klenke

Hubalek

Pokern

Galves

Xing

Lubetzky

Gu\\xc5\\xa3\\xc4\\x83

Sazonov

Liptser

Duarte

ODonnell

Creutzig

Mossel

Abadi

Gloter

Torres

Shapira

Baldi

Graham

Panloup

Schott

Pontier

Luczak

Mayer-Wolf

Assaf

Dobri\xc4\x87

Evans

Dembo

M\\xc3\\xa9min

Shields Meckes

Pemantle

S\xc5\x82omi\xc5\x84ski

\\xc3\\x9cst\\xc3\\xbcnel

Pitman

Veretennikov

Cohen

Winkler

Gombani

Bollob\\xc3\\xa1s

Guiol

Lacayo

Quer-Sardanyons

Rovira

Es-Sebaiy

Newman

Ichiba

Greven

Roelly

Tudor

Gantert

Liggett

Fradon

Mountford

Sidoravicius

T\xc3\xb3thdenHollander

Ruszel

Maes

Ravishankar

Nualart

Grimmett

Rifo

Alexander

Bardina Bjork

Ferrari

Hammond

Bahadoran

Redig

Freire

VivesSanta-Eul\\xc3\\xa0ia

Crisan

Fritz

Vares

Fernandez

Remenik

Santacroce

Cairoli

Ramirez

Molchanov

Stricker

Fontes

Schweizer

Follmer

Virag

Guillotin-Plantard Noreddine

Garz\xc3\xb3n

Schonmann

Cesi

Geman

Darses

ProtterConforti

Bertoglio

Martinelli

Le\\xc3\\xb3n

\xc3\x87etin

Cadel

Bascompte

Deya

Comets

PiccoAl\\xc3\\xb2s

Erd\xc5\x91s

\xc5\xbdigo

Kipnis

Murr

Grandits

Weiss

Runggaldier

Fernandez

Schilling

Jona-Lasinio

Bouten

Guasoni

Villemonais

Cancrini

SanMart\\xc3\\xadn

Cassandro

Briand

Davis

Zervos

Viens

Porchet

Coculescu

Kramkov

Collet

Tindel

Joulin

Benois

Jeanblanc

ElKarouiKohatsu-Higa

Lacoste

Mathieu

Nguy\xe1\xbb\x85nHuuDu

Pardoux

Presutti

TrioloRoynetteChoulli

Dereich

LandimHu

Herrmann

Ouahhabi

Castell

Chesney

Ianiro

Lamberton

Sarr\xc3\xa0

Gobron

Sznitman

Lin

Tarr\\xc3\\xa8s

Merola

Ta\\xc3\\xafbi

Caderoni

Olivieri

Maass

Anderson

DartnellM\\xc3\\xa1rquez-Carreras

Sanz-Sole

Pettersson

Fiel

Song

Bezerra

Tsagkarogiannis

SaadaOb\xc5\x82\xc3\xb3j

Fontana

BaudoinCarmona

Werner

Bressaud

Brassesco

Rozovskii

Ankirchner

Bogachev

Swanson

NardiKrawczykPoisat

Dalang

RollaCaravenna

dosSantos

Beffara

G\xc3\xa4rtner

LeNyJarai

deLima

March

Peres

Pal

Cotar

Poly

Berestycki

Revelle

Aaronson

Dawson

Gorostiza

Limic

vandenBerg

Fleischmann

Goodman

Schinazi

Merzbach

Kesten

Lawler

Xiong

Yor Mytnik

Rolles

Berend

Morters

Konig

Kupper

Chevallier

Birkner

Schweinsberg

Klein Biagini

Khas\\xca\\xb9minski\\xc4\\xad

Durrett

Madan

Stoimenov

Donati-Martin

Winter

NavarroCruz

Zili

Bronstein

Hryniv

\xc4\x8cern\xc3\xbd

Najnudel

LeGall

Sidorova

Shlosman

Feng

Heyne

Corwin

Cabezas

Tudor

Xu

Deuschel

Quastel

VanMoffaert

Huang

Wilbertz

Arguin

Walsh

Bourgade

Biane

Ma\xc3\xafda

Burdzy

Chung

ZessinKirkpatrick

Frangos

Dimitroff

Gayrard

Nualart

Pellegrinotti

R\\xc3\\xa9veillac

Mueller

Schapira

Keane

TudorGuionnet

Xu

BenArous

Salopek

Krylov

Sortais

Gun

Bovier

Cranston

Bassalygo

Pinsker

Rudiger

Prelov

Pecherski\xc4\xad

Adelman

EckhoffRuizdeCh\\xc3\\xa1vez

Ghomrasni

Foondun

Konno

L\\xc3\\xb3pez-Mimbela

Braverman

Tribe

Drapeau

Hawkes

Shiryaev

Tanemura

Levin

Windridge

Goldschmidt

Kogan

Bolthausen

Hu

Keevash

Elworthy

Batchelor

Hyland

Robinson

Marcuard

Zhang

Li

Liu

Bernard

Butko

Ying

Varadarajan

Kim

Zhou

Paycha

Xu

Ouerdiane

Derguzov

Sudakov

Kotani

Winter

Bogdan

Reichmann

Issoglio

Hayman

Zhang

Brown

Petrov

Whittle

Quas

Fukushima

Gouere

Ren

Yuan

Aida

Bao

Cao

Chen

Wu

Smolyanov

Zhang

Bo

Lyons

Hsu

Takeda

Holley

Kuwae

Albeverio

Krasovski\xc4\xad

Barbaresco

Ma

Sagna

Ma

Yan

Taniguchi

Mendez-Hernandez

Park

Williams

Shen

Durran

Engl\\xc3\\xa4nder

Diehl

Saussol

Neate

Lunt

Gong McKean

Franchi

Sztonyk

L\\xc3\\xa9vy

Kulczycki

Caruana

Reuter

Davis

Cipriani

Kree

Chen

Nesterenko

Sabot

Truman

Wang

Housworth

Singh

Lau

Gustafson

Brossard

Kershaw

Setterqvist

Baggett

Duplantier

Shao

Duan

Tudor

Galamba

Ouyang

Metz

Thalmaier

vandenBerg

Mauldin

Xu

Stroock

Coulibaly-Pasquier

UlsamerXu

Plank

Eremenko

Frikha

Delyon

Grigoryan

Fang

Ledrappier

Mao

Wu

Deng

Qian

Basdevant

Wang

Driver

Aleksandrov

Spencer

Ancona

Parry

Bouthemy

Cruzeiro

Benassi

Gairing

Teplyaev

Glover

Bardou

Rockner

Hennequin

Kwa\\xc5\\x9bnicki

Pietruska-Pa\xc5\x82ubaPopescu

St\xc3\xb3s

Lorentz

Feng

Bogachev

Kumar

Hogele

Rudolph

Razborov

Muller

Cass

Taylor

Qian

Yao

Chaumont

ZhengLitterer

Laurence

Semenov

Russo

Swords

Lepingle

Kruk

Appleby

Lapeyre

vonWeizs\\xc3\\xa4cker

Schottstedt

Michel

Peithmann

Marinelli

Bakry

Gassiat

Beznea

Wetzel

Hein

Nazarov

Mohammed

Sab

Davies

Gundy

Jakobson

Pesin

Gerin

Enriquez

Brydges

Bunimovich

Suryanarayana

Smillie

AubrunMichon

Dellacherie

Az\\xc3\\xa9ma

Fromm

\\xc3\\x89mery

Lindstr\xc3\xb8m

Jacob

Gaines

Bottcher

Vondra\xc4\x8dek

Wang

Kusuoka

Gatheral

Durand

Nadakuditi

Yang

Gjerde

OuyangKusuoka

Ub\\xc3\\xb8e

Ladyzhenskaya

Kurtz

Ross

\\xc3\\x98ksendal

Meyer

Grishin

Frohlich

Phan

Raimond

Vormoor

Kumagai

Croydon

Marstrand

Aase

Xiang

Song

Uemura

Hattori

SunKhanin

Bol\xca\xb9shev

Wang

Ayache

Kendall

Kloppel

Kornfeld

Ba\xc4\xaddak

Chen

Privault

LeJan

Vershik

Kirillov

Rozanov

Kolmogorov

Dani

Benaych-Georges

Port\\xc3\\xa8s

Maslova

Friz

Arnaudon

Torrecilla-Tarantino

Allouche

Gr\\xc4\\x83dinaru

Richter

Brunel

Miermont

Kozlov

Aleksandrov

Haas

Bakhtin

Smirnov

Profeta

Ershov

Tang

Menard

Beck

Zabrodin

Zindy

Raja

Oseledets

Mekler

Gurevich

Hattori

Hambly

Andres

Cox

L\\xc3\\xa9ger

Godunov Khelemski\xc4\xadZ\xc3\xa4hle

Onishchik

Wang

Korolyuk

Zalgaller

Reshetnyak

Berestycki

Lavrent\xca\xb9ev

YangKingman

Kutateladze

Taylor

Fujita

Sevast\xca\xb9yanov

Curien

Hughston

Dobrushin

Warren

Karpelevich

Baumgarten

Koteck\\xc3\\xbd

Baik

Ye

Forde

Zambrini

Hobson

Schneider

Guivarch

Mazet

Jiao

Pag\\xc3\\xa8s

Kuptsov

Marchetti

Yan

Xu

Auffinger

Ahn

Maisonneuve

Ueltschi

Minlos

Yang

Pirogov

Fitzsimmons

Jung

Kifer

Tsirelson

Sina\xc4\xad

Sukhov

Doring

Vvedenskaya

He

Monch Barlow

Bass

Henkel

Cherny

Bayer

Ortgiese

Royfman

Unterberger

Fribergh

Koralov

Revuz

Neveu

Hu

Aizenman

P\\xc3\\xa9ch\\xc3\\xa9Scacciatelli

Jansen Zhang

Riedle

Klein

Bonnefont

Spohn

Stauch

DosReis

Yao

Boufoussi

Blanchet-Scalliet

Hajji

Lepeltier

L\\xc3\\xa9onard

Nzi

Lejay

Elliott

Chafa\\xc3\\xaf

Ouknine

Sellami

AitOuahra

Callegaro

Bally

Zargari

Viswanathan

Mourragui

DeMasiBertini

Stoica

Scheutzow

Fehringer

Mao

Bouleau

Imkeller

Pavlyukevich

Yang

Zambotti

Varadhan

Zhang

Szatzschneider

Rodkina

Schulman

Mellouk

Zhang

Millet

\xc5\x81ochowski

Arnold

Edgar

Butt\xc3\xa0

Scarlatti

Matoussi

Freidlin

Petunin

Denis

Victoir

Ledoux

Durrleman

Berkaoui

Erraoui

Aksamit

Horst

Kruse

Deng

Olla

M\\xc3\\xa9l\\xc3\\xa9ard

Eddahbi

Kohlmann

FaggionatoToninelli

Gabrielli

Dupoiron

Blondel

Lakhel

Yor

Cohen

Str

oock

Ledoux

Jaff

ard

Bre

zis

Zeit

ouni

Lions

Nuala

rt1

2

3

4

5

6

7

8

Frequency

(%

)

Il y a un biais d’aspiration de la base de donnees.

Page 32: Barycentre et première composante principale sur des graphes

I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet

II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique

III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique

IV - Simulations

V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion

Page 33: Barycentre et première composante principale sur des graphes

V - 1 ACP dans le cadre euclidien.Methode d’analyse des donnees. Intuition :

� Inclure les donnees dans un ellipsoide (minimal)� Chaque axe de l’ellipsoide represente une composante principale

FIGURE: ACP d’une loi normale multidimensionnelle. Source : Wikipedia

Donnees : x1, . . . xm P Rn. Pour v P Rn :

Sv � txm � tv, t P Ru, ou xm � 1m

m

i�1

xi

Premiere composante principale : Sv1 , ou v1 est t.q. :

v1 P arg min}v}�1

m

i�1

d2pxi, Svq.

Page 34: Barycentre et première composante principale sur des graphes

V - 1 ACP sur un graphe.G Espace des geodesiques :

G � tγ � ΓG t.q. γ � γ, @x, y P γ, x � y, Dp P Cx,y, p � γ avec |p| � dpx, yqu.

FIGURE: Degre relatif de x P A par rapport a A � Γ connexe, degApxq : dans combien dedirection on peut partir de x, en restant dans A

Gd :� tγ P G t.q. @x P γ, degγpxq ¤ d � 1u.

Espace important, G1 : γ P G1,degγpxq ¤ 2

� Chemin geodesique� Cycle geodesique

Page 35: Barycentre et première composante principale sur des graphes

V-1. ACP sur un graphe.

Formulation Variationnelle :

UνpCq � Erd2pX,Cqs �n

i�1

d2pxi,Cqνpxiq, (3)

Une composante principale d’ordre d est un element g�d P Gd t.q. :

g�d P arg mingPGd

Uνpgq.

Mdν l’ensemble de minimiseurs de Uν sur Gd.

Premieres composantes principales : M1ν ÝÑ Optimisation sur G1, espace

non-connexe

Page 36: Barycentre et première composante principale sur des graphes

V - 2 Definition du processusG1 espace approprie :

G1 :�¤

x,yPγ

tg P Cx,y; Dγx,y s.t. gY γx,y P G1.u,

� A partir d’un element g� P arg mingPG1Uνpgq, on peut facilement

construire g� P arg mingPG1Uνpgq.

� Connexe et compact.� Peut-etre separe en cellules homeomorphes a des boules de R et R2.

Operateurs differentiels a travers des homeomorphismes et pour un domainebien choisi on definit :

LCt Fpx, yq � �βtxOUypxq,OxFpx, yqy �∆xFpx, yq � αt

»V

Fpx, yq � Fpx, y1qdνpy1q,(4)

Page 37: Barycentre et première composante principale sur des graphes

V - 2 Recuit homogeneise sur G1

Algorithm 4: Recuit homogeneise sur G1

Data: Fonction U. Schema de temperature pβtqt¥0. Intensite pαtqt¥0

1 Initialisation : Choisir X0 P G1 ;2 T0 � 0 ;3 for k � 0 . . .�8 do4 while Nαt � k do5 Xt evolue comme un mouvement brownien dirige par OUYk ,

relativement a la structure de G1, initialise en X�Tk.

6 end7 Tk�1 :� inftt : Nαt � k � 1u;8 Au temps t � Tk�1, tirer Yk�1 � YNαt selon la loi ν.9 end

10 Output : limtÝÑ�8 Xt.

Page 38: Barycentre et première composante principale sur des graphes

V - 2 Recuit homogeneise sur G1

Une illustration graphique :

FIGURE: Evolution schematique du S.A. homogeneise sur G1. On observe un saut enT1 vers YT1 de l’extremite gauche de X puis un mouvement Brownien sur G1 pendantT2 � T1. Puis un second noeud, YT2 , est echantillonne selon ν : et un saut del’extremite droite de X vers YT2 a lieu au temps T2.

Page 39: Barycentre et première composante principale sur des graphes

V -4 Exemple : Reseau social

FIGURE: Premiere composante principale du sous-graphe de Facebook.

Visualisation : Cytoscape

Page 40: Barycentre et première composante principale sur des graphes

V - 4 Conclusion

Poursuite des travaux :

� Passage a l’echelle via un clustering preliminaire� Experiences a venir sur la totalite du graphe de ZbMaths� Prouver la convergence du processus pour l’ACP� Ameliorer les performances numeriques pour l’ACP.

Merci de votre attention !