modélisationstatistique - claroline.locean-ipsl.upmc.fr · modélisation statistique plan...

21
Modélisation statistique Plan Modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Réalisation Modélisation Statistique Statistiques descriptives Modélisation Linéaire Non Linéaire Régression linéaire Analyse en composantes principales Cartes topologiques Classification Régression Supervisé Perceptron multi-couches

Upload: vocong

Post on 23-Sep-2018

240 views

Category:

Documents


1 download

TRANSCRIPT

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

Modélisation StatistiqueStatistiquesdescriptives

Modélisation

Linéaire Non Linéaire

Régressionlinéaire

Analyse en composantesprincipales Cartes topologiques

Classification

Régression

Supervisé

Perceptronmulti-couches

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

1/20

Sommaire du documentPlanModélisation statistiqueStatistiques descriptives

Découpage des coursStatistiques unidimensionnellesStatistiques bidimensionnellesStatistiques multidimensionnelles

Modélisation linéaireRégression linéaireAnalyse en composantes principales

Modélisation non linéairePerceptron multicouchesCartes topologiques

BibliographieNous joindreRéalisation

Dans ce document tous les liens actifs sont en vert

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

2/20 Schéma de la modélisation statistiqueStatistiquesdescriptives

Modélisation

Linéaire Non Linéaire

Régressionlinéaire

Analyse en composantesprincipales Cartes topologiques

Classification

Régression

Supervisé

Perceptronmulti-couches

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

3/20

StatistiquesdescriptivesStatistiquesdescriptives

unevariable

X

unevariable

X

deuxvariables

X ,Y

deuxvariables

X ,Y

plusieursvariables

Xk k ∈ [1, n]

plusieursvariables

Xk k ∈ [1, n]

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

4/20

Cours de statistiques descriptivesLe cours de statistiques descriptives comporte 3 cours:

I Statistiques unidimensionnelles

I Statistiques bidimensionnelles

I Statistiques multidimensionnelles

Statistiquesunidimensionnelles

Description du cours

Statistiquesbidimensionnelles

Description du cours

Description du coursStatistiquesmultidimensionnelles

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

5/20 Statistiques unidimensionelles 1/2

Caractéristiques:

I une seule variable X qui peut prendre n valeurs xiParamètres:

I moyenne

I médianeI quartiles

I variance et écart type

Représentations graphiques:

I camembertsI histogrammes

I boîtes à moustaches

Accès à la description du cours

Étude de cas

Statistiquesunidimensionnelles

Paramètres

MoyenneQuartiles:

médiane etautres quartiles

VarianceEcart type

Représentationsgraphiques

Camemberts Histogrammes Boîtes àmoustaches

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

6/20

Statistiques unidimensionelles 2/2

Statistiquesunidimensionnelles

Paramètres:Moyenne

x =1

n

n∑i=1

xi

Variance

V(X) =1

n

n∑i=1

(xi − x)2

Représentations graphiques:

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

7/20 Statistiques bidimensionelles 1/2

Caractéristiques:

I Deux variables X et Y

Indicateurs:I CovarianceI Coefficient de corrélation

Représentations graphiques:

I Diagrammes de dispersion

I Histogramme 2D

Accès à la description du cours

Étude de cas:Données environnementales

et effet de serre

Statistiquesbidimensionnelles

Déterminationdes indicateurs

Covariance Coefficientde corrélation

Représentationsgraphiques

Diagrammesde dispersion

Histogrammes2D

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

8/20

Statistiques bidimensionelles 2/2

Statistiquesbidimensionnelles

Paramètres:σX =

√V(X) σY =

√V(Y )

Covariance

Cov(X, Y ) =

n∑i=1

(xi − x)(yi − y)

Coefficient de corrélation

rxy = Cor(X, Y ) =Cov(X, Y )

σX σY

Représentations graphiques:

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

9/20 Statistiques multidimensionelles 1/2

Caractéristiques:

I Un grand nombre de variables XnIndicateurs:

I Vecteur moyen

I Matrice de covarianceI Coefficient de corrélation e

Représentations graphiques:

I Représentation géométrique

I Ellipsoïde de Mahalanobis

Accès à la description du cours

Statistiquesmultidimensionnelles

Déterminationdes indicateurs

Vecteur moyen Matrice decovariance

Matrice decorrélation

Représentationsgraphiques

Réprésentationgéométrique

Ellipsoïde deMahalanobis

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

10/20

Statistiques multidimensionelles 2/2

Statistiquesmultidimensionnelles

Paramètres:Sij = Cov(Xi , Xj ) et Sii = V(Xi )rij = Cor(Xi , Xj )

Matrice de covarianceS11 . . . S1p

.

.

....

.

.

.Sp1 . . . Spp

Matrice de corrélation

r11 . . . r1p...

.

.

....

rp1 . . . rpp

Représentation graphique:

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

11/20

Modélisation linéaireModélisation linéaire

Régressionlinéaire

Régressionlinéaire

Analyseen

composantesprincipales

Analyseen

composantesprincipales

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

12/20

Modélisation linéaireModélisation Linéaire

Deux variables X, Y

Régressionlinéaire

Analyse en composantesprincipales ACP

n variablesXk k ∈ [1, n]

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

13/20

Régression linéaireAccès à la description du cours

RégressionModélisationy = f (x)

Régression linéaire :Méthode des

moindres carrés

Modèle déterministe

Déterminationde a et b

par la méthode desmoindres carrés

Détermination de lavariable aléatoire ε

Régression Linéaire

y = ax + b

Modèle probabiliste

Régression

y = ax + b + εε variable aléatoire

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

14/20 Analyse en composantes principalesAccès à la description du cours

Première étude de cas:Variables climatiques liées à l’effet

de serre

Deuxième étude de cas :Températures locales et effet de serre

Analyse en com-posantes principales

Méthodes

Diagonalisation Méthode desmoindres carrés

But

Diminuerle nombre de variables

Obtenir desreprésentations

graphiques

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

15/20

Modélisationnon linéaireModélisationnon linéaire

CartestopologiquesCartestopologiques Perceptron

multicouchesPerceptronmulticouches

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

16/20 Perceptron multicouches

Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiriavous permettront d’avoir un aperçu sur le perceptronmulticouche

Perceptron :introductionVidéo

Modèle directModélisation de la

fonction de transfertModélisation de l’incertitude

Vidéo

Modèle inversePerceptron Modèle inverse

Vidéo

Accès au cours sur IPSL formations

Etude de cas 1 : Régressionpar Perceptron Multicouche

Etude de cas 2 : Classificationpar Perceptron Multicouche

Application aux iris de Fisher

Etude de cas 3 : Reconnaissancedes chiffres manuscrits Codage desdonnées Masques et poids partagés

Etude de cas 4 : Modélisation dela fonction de transfert du diffu-

siomètre NSCAT et des incertitudes

Etude de cas 5 : Inversion desobservations du radiomètre Sea-WiFS pour la quantification desaérosols- comparaison avec l’al-gorithme standard de la NASA

Etude de cas 6 : Modélisation deséries chronologiques - Applica-

tion à la prévision du trafic SNCF

Etude de cas 7 : Etude de la prévis-ibilité de séries chronologiques detempératures issues de la base dedonnées ERA-Interim du centreEuropéen au moyen de modèlesneuronaux (perceptron multi-couches et cartes de Kohonen)

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

17/20 Cartes topologiques

Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiriavous permettront d’avoir un aperçu sur les cartes topologiques(cartes de Kohonen)

Couleur de l’océanVidéo

Polution atmosphériqueVidéo

Accès au cours sur IPSL formations

Etude de cas 1 : Classificationpar cartes topologiques - Util-

isation de la SOM Toolbox

Etude de cas 2 : Caractérisationde phénomène d’upwelling

au large du Sénégal à partirtempératures de surface de

l’océan et des concentration enChlorophylle-a observées par satellite

Etude de cas 3 : Etude et prévi-sion du phénomène El Nino à

partir des anomalies mensuellesde températures de surface de lamer observées par satellite prèsdes côtes d’Amérique du Sud.

Etude de cas 4 : Etude de la prévis-ibilité de séries chronologiques detempératures issues de la base dedonnées ERA-Interim du centreEuropéen au moyen de modèlesneuronaux (perceptron multi-

couches et cartes topologiques)

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

18/20

Ouvrages sur la modélisation statistique

1. Saporta ,Probabilités, analyse des données et statistique, Springer 2011

2. G. Dreyfus, J.M. Martinez, M. Samuelides, M.B. Gordon, F. Badran, S. Thiria [2008], Apprentissage statistique(Réseaux de neurones, Cartes topologiques, Machines à vecteurs supports), Eyrolles 3ème édition, 2008.

3. Christopher M. Bishop [2006], Pattern recognition and machine learning, Springer 2006

4. Vladimir N. Vapnik , Statistical Learning Theory , Wiley 1998

5. Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, 2nd Edition Wiley 2000

6. Kohonen, Teuvo, Self-Organizing Maps Springer 2001

Page précédente Plan Nous joindre Page suivante

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

19/20

Nous joindre

I Les responsables du MASTER TRIED

I Les enseignants

Cécile MalletCécile Mallet est maître de conférences à l’UVSQ

et enseigne dans le master TRIED

Sylvie ThiriaSylvie Thiria est Professeur d’université

et enseigne dans le master TRIED

Page précédente Plan

Modélisationstatistique

Plan

Modélisationstatistique

StatistiquesdescriptivesDécoupage des cours

Statistiquesunidimensionnelles

(suite)

Statistiquesbidimensionnelles

(suite)

Statistiquesmultidimensionnelles

(suite)

ModélisationlinéaireRégression linéaire

Analyse encomposantesprincipales

Modélisation nonlinéairePerceptronmulticouches

Cartes topologiques

Bibliographie

Nous joindre

Réalisation

20/20

Réalisation du documentI FORMAV

http://formav.eu

22 Bd de la Libération

92370 Chaville

01.47.09.22.75

I Martine Arrou-Vignod

Ingénieur et Agrégée de Mathématiques

Directrice de FORMAV

Page précédente Plan