apprentissage profond: raisons qui nous ont fait ...quimper/seminaires/files/deep.pdf · 1.5...

51
Introduction Réseau de neurones References . . Apprentissage profond: Raisons qui nous ont fait reconsidérer les réseaux de neurones. Ludovic Trottier April 8, 2016 Ludovic Trottier Apprentissage profond 1/49

Upload: hoanglien

Post on 10-Jan-2019

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

.

.

Apprentissage profond: Raisons qui nous ont faitreconsidérer les réseaux de neurones.

Ludovic Trottier

April 8, 2016

Ludovic Trottier Apprentissage profond 1/49

Page 2: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

... .. Plan

IntroductionQu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Réseau de neuronesProblèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

Ludovic Trottier Apprentissage profond 2/49

Page 3: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

... .. Apprentissage profond (Deep Learning)

Sur Wikipédia, on peut lire:1. Deep structured learning, hierarchical learning, deep machine

learning2. Attempt to model high-level abstractions in data by using

multiple processing layers.3. Deep learning < Machine Learning < Representation Learning

(replacing handcrafted features with learned representations)4. Buzzword, rebranding of neural network

Est-ce vraiment un rebranding?

Ludovic Trottier Apprentissage profond 3/49

Page 4: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 4/49

Page 5: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

"In this paper we describe our Go program, AlphaGo. This programwas based on general-purpose AI methods, using deep neuralnetworks to mimic expert players, and further improving theprogram by learning from games played against itself."

Youtube: Google DeepMind Challenge Match: Lee Sedol vs AlphaGo

Ludovic Trottier Apprentissage profond 5/49

Page 6: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

"Recent improvements in speech recognition, made possible by theintroduction of deep neural networks combined with Microsoftsproven statistical machine translation technology, allow for bettertranslation outcomes, making meaningful one-on-one conversationpossible."http://blogs.skype.com/2014/12/15/skype-translator-how-it-works/

Ludovic Trottier Apprentissage profond 6/49

Page 7: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 7/49

Page 8: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 8/49

Page 9: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 9/49

Page 10: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 10/49

Page 11: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 11/49

Page 12: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 12/49

Page 13: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 13/49

Page 14: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 14/49

Page 15: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 15/49

Page 16: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Ludovic Trottier Apprentissage profond 16/49

Page 17: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

Tutoriel:http://www.makeuseof.com/tag/create-neural-paintings-deepstyle-ubuntu/

Ludovic Trottier Apprentissage profond 17/49

Page 18: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

http://www.makeuseof.com/tag/create-neural-paintings-deepstyle-ubuntu/

Ludovic Trottier Apprentissage profond 18/49

Page 19: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Qu’est-ce que l’apprentissage profond?Qui s’y intéresse?

... .. Ce qu’on peut en retirer...

Le Deep Learning c’est:1. Une technologie applicable dans plusieurs domaines

1.1 Jeu de Go1.2 reconnaissance vocale (Cortana, Skype, Google Voice)1.3 traitement automatique du langage naturel (Watson, Facebook,

Twitter)1.4 vision numérique (DeepFace)1.5 robotique (grasping, Google Car)1.6 système d’aide à la décision (soins de santé)1.7 art (Neural Style)1.8 . . .

2. Une approche d’apprentissage automatique nécessitant GPU +données massives.

3. Un lien étroit entre la recherche et l’industrie.

Ludovic Trottier Apprentissage profond 19/49

Page 20: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Réseau de neurones pré 2006

Ludovic Trottier Apprentissage profond 20/49

Page 21: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Réseau de neurones pré 2006

Ludovic Trottier Apprentissage profond 20/49

Page 22: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Problème 1: Vanishing Gradient

Conséquence: Les niveaux inférieurs prennent un temps fou àconverger.

Ludovic Trottier Apprentissage profond 21/49

Page 23: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Problème 2: Sur-apprentissage

Conséquence: Pour la même quantité d’observations, plus il y ade niveaux/neurones, plus le réseau sur-apprend.

Ludovic Trottier Apprentissage profond 22/49

Page 24: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Problème 3: Fonction objective truffée de minimums locaux

Conséquence: Plus il y a de niveaux/neurones, plus la fonction estdifficile.

Ludovic Trottier Apprentissage profond 23/49

Page 25: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Problème 4: Malédiction de la dimensionalité

Conséquence: Plus la dimension de l’observation augmente, plusil y a de connexions à apprendre.

Ludovic Trottier Apprentissage profond 24/49

Page 26: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Apprentissage vorace des niveaux de façon non-supervisée (Hintonet al., 2006)

Ludovic Trottier Apprentissage profond 25/49

Page 27: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Ludovic Trottier Apprentissage profond 26/49

Page 28: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Machine de Boltzmann Restreinte

Au lieu d’avoir une distri-bution de probabilité con-ditionnelle Pr(y|x), on amaintenant une distribu-tion de densité marginalep(x).

• Le but est maintenant de maximiser p(x) en fonction desconnexions.

• Classification → Estimation de densité

Ludovic Trottier Apprentissage profond 27/49

Page 29: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Machine de Boltzmann Restreinte

Au lieu d’avoir une distri-bution de probabilité con-ditionnelle Pr(y|x), on amaintenant une distribu-tion de densité marginalep(x).

• Le but est maintenant de maximiser p(x) en fonction desconnexions.

• Classification → Estimation de densité

Ludovic Trottier Apprentissage profond 28/49

Page 30: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Machine de Boltzmann Restreinte

Au lieu d’avoir une distri-bution de probabilité con-ditionnelle Pr(y|x), on amaintenant une distribu-tion de densité marginalep(x).

• Le but est maintenant de maximiser p(x) en fonction desconnexions.

• Classification → Estimation de densité

Ludovic Trottier Apprentissage profond 29/49

Page 31: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Machine de Boltzmann Restreinte

Au lieu d’avoir une distri-bution de probabilité con-ditionnelle Pr(y|x), on amaintenant une distribu-tion de densité marginalep(x).

• Le but est maintenant de maximiser p(x) en fonction desconnexions.

• Classification → Estimation de densité

Ludovic Trottier Apprentissage profond 30/49

Page 32: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Qu’est-ce qui est arrivé en 2006 ?

Machine de Boltzmann Restreinte

Au lieu d’avoir une distri-bution de probabilité con-ditionnelle Pr(y|x), on amaintenant une distribu-tion de densité marginalep(x).

Conséquence:1. Possibilité d’apprendre sur des données non-étiquetées.2. Excellente initialisation pour l’apprentissage supervisé.3. Première fois que les réseaux profonds fonctionnent.

Ludovic Trottier Apprentissage profond 31/49

Page 33: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Impact majeur

1. Greedy layer-wise training of deep networks (Bengio et al.,2007).

2. Unsupervised learning of invariant feature hierarchies withapplications to object recognition (Ranzato et al., 2007).

3. Unsupervised feature learning for audio classification usingconvolutional deep belief networks (Lee et al., 2009)

4. Sparse feature learning for deep belief networks (Boureauet al., 2008)

5. Training restricted Boltzmann machines using approximationsto the likelihood gradient (Tieleman, 2008)

6. Large-scale deep unsupervised learning using graphicsprocessors (Raina et al., 2009)

7. Representational power of restricted Boltzmann machines anddeep belief networks (Le Roux and Bengio, 2008)

Ludovic Trottier Apprentissage profond 32/49

Page 34: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Pourquoi ça fonctionne?

Après 4 ans de recherche, on comprend que l’entraînement deHinton est une forme de régularisation (Erhan et al., 2010).

Ludovic Trottier Apprentissage profond 33/49

Page 35: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Exemple de vanishing gradient (Erhan et al., 2010)

Ludovic Trottier Apprentissage profond 34/49

Page 36: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Une nouvelle percée

• Les nombreux travaux de recherche entre 2006 et 2010 nousont montré l’importance de contrôler le vanishing gradient.

• Le pré-entraînement est long et fastidieux.• En 2010, une nouvelle fonction d’activation ayant despropriétés intéressantes est proposée: la Rectified Linear Unit(ReLU) (Nair and Hinton, 2010):

f (x) ={x si x ≥ 00 sinon

Ludovic Trottier Apprentissage profond 35/49

Page 37: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Propriétés intéressantes de la ReLU

La ReLU a plusieurs propriétés intéressantes:1. Biologiquement plausible: one-sided comparé à

l’anti-symétrique tanh.2. Activations creuses: 50% des neurones ont une activation nulle

après l’initialisation aléatoire des poids.3. Pas de vanishing gradient: La dérivé vaut 1 partout dans la

portion positive.4. Complexité faible: comparaison.

ReLU Sa dérivée

Ludovic Trottier Apprentissage profond 36/49

Page 38: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Impact majeur de (Nair and Hinton, 2010)

En 2011, pour la première fois on apprend un réseau de neuronesprofond sans entraînement non-supervisé vorace (Glorot et al.,2011).

On peut lire dans le résumé de l’article:

Even though they [rectifying neurons] can take advantage ofsemi-supervised setups with extra-unlabeled data, deep rectifiernet can reach their best performance without requiring anyunsupervised pre-training on purely supervised tasks with largelabeled datasets. Hence, these results can be seen as a newmilestone in the attempts at understanding the difficulty intraining deep but purely supervised neural networks.

Ludovic Trottier Apprentissage profond 37/49

Page 39: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Observation empirique d’une autre propriété intéressante

Propriété: propagation de la sparsité à travers les niveaux (Glorotet al., 2011).

Ludovic Trottier Apprentissage profond 38/49

Page 40: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Exemple de tâche d’apprentissage

.ImageNet Classification..

......

1.4 millions d’images couleur entraînement (138 Go), 50 000validation (6.3 Go), 100 000 test (13 Go). 1000 classes. Dimensionsvariables ≈ 256× 256.

Lichen barbu Lichen des caribous

Ludovic Trottier Apprentissage profond 39/49

Page 41: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Exemple de tâche d’apprentissage

.ImageNet Classification..

......

1.4 millions d’images couleur entraînement (138 Go), 50 000validation (6.3 Go), 100 000 test (13 Go). 1000 classes. Dimensionsvariables ≈ 256× 256.

Lichen barbu Lichen des caribous

Ludovic Trottier Apprentissage profond 39/49

Page 42: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Une redécouverte majeureKrizhevsky et al. (2012) entraînement un réseau profond àconvolution à 8 niveaux de 60 M paramètres et 650 000 neurones.

Trois approches expliquent leur succès:1. Convolution (ReLU, Pooling)2. GPU3. Dropout

Ludovic Trottier Apprentissage profond 40/49

Page 43: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Approche #1: Réseau de neurones à convolution

Ludovic Trottier Apprentissage profond 41/49

Page 44: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Approche #2: GPUEntraîner le réseau de Krizhevsky et al. (2012) demande 6 jours surdeux GPUs.

Ludovic Trottier Apprentissage profond 42/49

Page 45: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Approche #3: Dropout (Srivastava et al., 2014)

Ludovic Trottier Apprentissage profond 43/49

Page 46: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Dropout (Srivastava et al., 2014)

Ludovic Trottier Apprentissage profond 44/49

Page 47: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Pour aller plus loin...

.IGGG Computer Vision + Applied Machine Learning Reading Group..

......

Vendredi 15 Avril, PLT-3904, 3:30 PM:Recent Advances in Convolutional Neural Networks.http://www2.ift.ulaval.ca/~pgiguere/rgroup/readingGroup2015.html

Je parlerai des avancées entre 2012-2015 telle que:1. Leaky ReLU, Noisy ReLU, Parametric ReLU, exponential LU2. Drop-connect3. Stochastic pooling, spatial pyramidal pooling4. Batch Normalization5. L’architecture Inception (oui, comme le film)

Ludovic Trottier Apprentissage profond 45/49

Page 48: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

Problèmes des réseaux de neurones standardsÈre de l’entraînement non-supervisé voraceÈre de la ReLUÈre des réseaux à convolution

... .. Conclusion

.Pas tant un rebranding.....

......

Oui, il y a des réseaux de neurones, mais pré 2006, il n’y avait pas:1. Apprentissage non-supervisé vorace.2. Fonction d’activation non-saturée.3. Régularisation stochastique.4. Support matériel pour les convolutions.5. Réduction de dimensionnalité.6. Et bien d’autres (à suivre le 15 Avril).

Découvrez par vous-même: http://deeplearning.net/

Questions?

Ludovic Trottier Apprentissage profond 46/49

Page 49: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

... .. References I

Bengio, Y., Lamblin, P., Popovici, D., Larochelle, H., et al. (2007).Greedy layer-wise training of deep networks. Advances in neuralinformation processing systems, 19:153.

Boureau, Y.-l., Cun, Y. L., et al. (2008). Sparse feature learning fordeep belief networks. In Advances in neural informationprocessing systems, pages 1185–1192.

Erhan, D., Bengio, Y., Courville, A., Manzagol, P.-A., Vincent, P., andBengio, S. (2010). Why does unsupervised pre-training help deeplearning? The Journal of Machine Learning Research, 11:625–660.

Glorot, X., Bordes, A., and Bengio, Y. (2011). Deep sparse rectifierneural networks. In International Conference on ArtificialIntelligence and Statistics, pages 315–323.

Hinton, G. E., Osindero, S., and Teh, Y.-W. (2006). A fast learningalgorithm for deep belief nets. Neural computation,18(7):1527–1554.

Ludovic Trottier Apprentissage profond 47/49

Page 50: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

... .. References II

Krizhevsky, A., Sutskever, I., and Hinton, G. E. (2012). Imagenetclassification with deep convolutional neural networks. InAdvances in neural information processing systems, pages1097–1105.

Le Roux, N. and Bengio, Y. (2008). Representational power ofrestricted boltzmann machines and deep belief networks. Neuralcomputation, 20(6):1631–1649.

Lee, H., Pham, P., Largman, Y., and Ng, A. Y. (2009). Unsupervisedfeature learning for audio classification using convolutional deepbelief networks. In Advances in neural information processingsystems, pages 1096–1104.

Nair, V. and Hinton, G. E. (2010). Rectified linear units improverestricted boltzmann machines. In Proceedings of the 27thInternational Conference on Machine Learning (ICML-10), pages807–814.

Ludovic Trottier Apprentissage profond 48/49

Page 51: Apprentissage profond: Raisons qui nous ont fait ...quimper/Seminaires/files/deep.pdf · 1.5 robotique (grasping, Google Car) 1.6 système d’aide à la décision (soins de santé)

IntroductionRéseau de neurones

References

... .. References III

Raina, R., Madhavan, A., and Ng, A. Y. (2009). Large-scale deepunsupervised learning using graphics processors. In Proceedingsof the 26th annual international conference on machine learning,pages 873–880. ACM.

Ranzato, M. A., Huang, F. J., Boureau, Y.-L., and LeCun, Y. (2007).Unsupervised learning of invariant feature hierarchies withapplications to object recognition. In Computer Vision and PatternRecognition, 2007. CVPR’07. IEEE Conference on, pages 1–8. IEEE.

Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I., andSalakhutdinov, R. (2014). Dropout: A simple way to preventneural networks from overfitting. The Journal of Machine LearningResearch, 15(1):1929–1958.

Tieleman, T. (2008). Training restricted boltzmann machines usingapproximations to the likelihood gradient. In Proceedings of the25th international conference on Machine learning, pages1064–1071. ACM.

Ludovic Trottier Apprentissage profond 49/49