la distribution normale. plan distribution de fréquences: page 3 distribution de fréquences: page...

Post on 04-Apr-2015

109 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

La distribution normaleLa distribution normale

PlanPlan

Distribution de fréquences: page 3Distribution de fréquences: page 3 Distribution normale: page 14Distribution normale: page 14 Théorème central limite: page 26Théorème central limite: page 26 Utilisation de la distribution normale Utilisation de la distribution normale

standardisée: page 33standardisée: page 33

Idée de la distribution normaleIdée de la distribution normale

On lance 2 dés et on regarde la somme On lance 2 dés et on regarde la somme

= 7= 7

Le nombre totale de possibilités est Le nombre totale de possibilités est de : 6x6=36 possibilitésde : 6x6=36 possibilités

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 10

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 50

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 200

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 1000

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 5000

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 50 000

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 200 000

Résultats théoriquesRésultats théoriques

SommeSomme PossibilitéPossibilité

22 (1,1)(1,1)

33 (1,2)(1,2) (2,1)(2,1)

44 (1,3)(1,3) (2,2)(2,2) (3,1)(3,1)

55 (1,4)(1,4) (2,3)(2,3) (3,2)(3,2) (4,1)(4,1)

66 (1,5)(1,5) (2,4)(2,4) (3,3)(3,3) (4,2)(4,2) (5,1)(5,1)

77 (1,6)(1,6) (2,5)(2,5) (3,4)(3,4) (4,3)(4,3) (5,2)(5,2) (6,1)(6,1)

88 (2,6)(2,6) (3,5)(3,5) (4,4)(4,4) (5,3)(5,3) (6,2)(6,2)

99 (3,6)(3,6) (4,5)(4,5) (5,4)(5,4) (6,3)(6,3)

1010 (4,6)(4,6) (5,5)(5,5) (6,4)(6,4)

1111 (5,6)(5,6) (6,5)(6,5)

1212 (6,6)(6,6)

Résultats théoriquesRésultats théoriques

ProbabilitéProbabilité %% SommeSomme PossibilitésPossibilités

1/361/36 2,782,78 22 (1,1)(1,1)

2/362/36 5,565,56 33 (1,2)(1,2) (2,1)(2,1)

3/363/36 8,338,33 44 (1,3)(1,3) (2,2)(2,2) (3,1)(3,1)

4/364/36 11,1111,11 55 (1,4)(1,4) (2,3)(2,3) (3,2)(3,2) (4,1)(4,1)

5/365/36 13,8913,89 66 (1,5)(1,5) (2,4)(2,4) (3,3)(3,3) (4,2)(4,2) (5,1)(5,1)

6/366/36 16,6716,67 77 (1,6)(1,6) (2,5)(2,5) (3,4)(3,4) (4,3)(4,3) (5,2)(5,2) (6,1)(6,1)

5/365/36 13,8913,89 88 (2,6)(2,6) (3,5)(3,5) (4,4)(4,4) (5,3)(5,3) (6,2)(6,2)

4/364/36 11,1111,11 99 (3,6)(3,6) (4,5)(4,5) (5,4)(5,4) (6,3)(6,3)

3/363/36 8,338,33 1010 (4,6)(4,6) (5,5)(5,5) (6,4)(6,4)

2/36 2/36 5,565,56 1111 (5,6)(5,6) (6,5)(6,5)

1/361/36 2,782,78 1212 (6,6)(6,6)

SommeSomme

=36/36=36/36

SommeSomme

= 100= 100

Simulation par Monte CarloSimulation par Monte Carlo

Distribution d’échantillonnage de la somme de 2 dés

Distribution normaleDistribution normale

Ce type de distribution est rencontrée régulièrement dans la nature (grandeur, poids, habiletés, propriétés psychologiques, etc.)

Existe-il une formule mathématique Existe-il une formule mathématique qui pourrait ajuster ces données qui pourrait ajuster ces données

empiriques ?empiriques ?

Distribution normaleDistribution normale

Distribution d’échantillonnage de la somme de 2 dés

Distribution normaleDistribution normaleDéfinition: fonction mathématique qui décrit des phénomènes pour un

n élevé.

Propriétés: - Unimodale et symétrique (autour de la moyenne)

- Mode = Médiane = Moyenne

- Asymptotique à l’abscisse (la courbe ne touche jamais l’axe des x)

2

2

( )

2

2

1( )

2

x

f x e

= 50 = 2Fonction de

densité

Probabilité d’observationProbabilité d’observationQuelle est la probabilité d’obtenir une somme de 8 ?Quelle est la probabilité d’obtenir une somme de 8 ?

pp(8) =Aire du bâtonnet (8) =Aire du bâtonnet

pp(8) = base(8) = basehauteurhauteur

pp(8) = 1(8) = 15/36 = 5/365/36 = 5/36

1/36

2/36

3/36

4/36

5/36

6/36

2 4 6 8 10 12

Probabilité d’observationProbabilité d’observation

Supposons que la taille des bâtonnets est divisée en 2Supposons que la taille des bâtonnets est divisée en 2

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observationProbabilité d’observation

Encore et encore …Encore et encore …

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observationProbabilité d’observation

… … infiniinfini

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observationProbabilité d’observationQuelle est la probabilité d’obtenir une somme de 8 ?Quelle est la probabilité d’obtenir une somme de 8 ?

pp(8) =Aire du bâtonnet (8) =Aire du bâtonnet

pp(8) = 0(8) = 0hauteurhauteur

pp(8) = 0(8) = 05/36 = 05/36 = 0

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

On ne peut donc plus connaître la probabilité d’une somme donnée !

Fréquences cumulativesFréquences cumulativesSolution: Fréquences cumulativesSolution: Fréquences cumulatives

Si on veut Si on veut pp(8), alors on fait la différence entre 2 fréquences cumulatives(8), alors on fait la différence entre 2 fréquences cumulatives

=> f.c.(8)-f.c.(7)=> f.c.(8)-f.c.(7)

1/36

2/36

3/36

4/36

5/36

6/36

2 3 4 5 6 7 8 9 10 11 12

f.c.(8) = (1+2+3+4+5+6+5)/36=26/36f.c.(8) = (1+2+3+4+5+6+5)/36=26/36

f.c.(7) = (1+2+3+4+5+6)/36=21/36f.c.(7) = (1+2+3+4+5+6)/36=21/36

=> f.c.(8) - f.c.(7) = (26-21)/36 = 5/36=> f.c.(8) - f.c.(7) = (26-21)/36 = 5/36

Distribution normaleDistribution normaleDe façon similaire, pour connaître la probabilité d’un score x quelconque sous la courbe normale, il faut calculer l’aire sous la courbe (intégrer) de -∞ jusqu’à x.

2

2

( )

2

2

1( )

2

xx

g x e

Fonction de densité cumulée

x

x

Distribution normale standardDistribution normale standard

Comme il existe une infinité de valeurs que peuvent prendre les paramètres et , par convention on parle de distribution normale standard si = 0 et = 1.

ZZ

PD

FPD

F

Distribution normale standardDistribution normale standard

Ex.

z = -1,75

Théorème central limiteThéorème central limite

Même si la distribution initiale n’est pas normale, la distribution des moyennes d’échantillonnage le sera

Ex.: x={1, 1, 1, 2, 2, 3}

Théorème central limiteThéorème central limiteExemple x={1, 1, 1, 2, 2, 3}

On tire des échantillons n=10 un très grand nombre de fois. Pour chaque série on calcul la moyenne.

t1={2,2,3,2,3,3,2,2,1,3}=> moyenne = 2.3

t2={3,2,2,2,1,2,1,2,2,2} => moyenne = 1.9

t3={1,1,3,2,1,2,1,2,1,1} => moyenne = 1.5

t10000000 = {1,2,1,3,2,1,3,1,3,3} => moyenne = 2.0

Puis, on regarde la distribution de ces moyennes.

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 10

Moyenne = 1.760 Écart-type = 0.225

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 100

Moyenne = 1,663 Écart-type = 0,232

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 1000

Moyenne = 1,666 Écart-type = 0,240

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 10 000

Moyenne = 1,668 Écart-type = 0,235

Simulation par Monte CarloSimulation par Monte Carlo

Nombre d’essais = 100 000

Moyenne = 1,668 Écart-type = 0,235

Utilisation de la distribution normaleUtilisation de la distribution normale

Solution: Transformation en score z

Quelle est la proportion de données qui est en dessous d’un score spécifique ?

Logique de cette transformation : Soustrait une quantité de la

distribution. Moy = 50

É.-t. = 2

Pour utiliser la table des z, il faut transformer toute distribution normale en une distribution normale standardisée (=0, =1)

Moy = 0

É.-t. = 1

Utilisation de la distribution normaleUtilisation de la distribution normale

Moy = 50

É.-t. = 2

Moy = 0

É.-t. = 1

distribution-distribution-1010

distribution-distribution-2020

Moy = 30

É.-t. = 2

Moy = 40

É.-t. = 2

Utilisation de la distribution normaleUtilisation de la distribution normale

Moy = 0

É.-t. = 1

distribution-distribution-3030

distribution-distribution-4040

Moy = 30

É.-t. = 2

Moy = 20

É.-t. = 2

Moy = 10

É.-t. = 2

Utilisation de la distribution normaleUtilisation de la distribution normale

Moy = 0

É.-t. = 1

distribution-distribution-5050

Moy = 10

É.-t. = 2

Moy = 0

É.-t. = 2

Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0.

Moyenne( ) 0distribution x

Utilisation de la distribution normaleUtilisation de la distribution normale

(distribution-50)/1.25(distribution-50)/1.25

-On divise le résultat de la soustraction par une autre quantité

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 2

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1.75

Utilisation de la distribution normaleUtilisation de la distribution normale

(distribution-50)/1.5(distribution-50)/1.5

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1.5

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1.75

- Divise le résultat de la soustraction par une autre quantité

Utilisation de la distribution normaleUtilisation de la distribution normale

(distribution-50)/1.75(distribution-50)/1.75

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1. 5

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1.25

- Divise le résultat de la soustraction par une autre quantité

Utilisation de la distribution normaleUtilisation de la distribution normale

(distribution-50)/2(distribution-50)/2

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1. 25

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1

- Divise le résultat de la soustraction par une autre quantité

Utilisation de la distribution normaleUtilisation de la distribution normale

(distribution-50)/2(distribution-50)/2

Moy = 0

É.-t. = 1

Moy = 0

É.-t = 1

Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0. Et si on divise le résultat de cette soustraction par l’écart-type, alors le nouvel écart-type de la distribution sera de 1.

- Divise le résultat de la soustraction par une autre quantité

( )Écart-type[ ] 1

distribution x

s

Utilisation de la distribution normale Utilisation de la distribution normale suitesuite

Solution: Transformation en score z (nombre d’écart types standards entre x et la moyenne)

Quelle est la proportion de données qui est en dessous d’un score spécifique ?

Ex.1 : x = 3,70moy = 2,93é.t. = 0,33

x xz

s

3,70 2,932,33

0,33

Table(2,33) => 99,01%

2,50 2,931,30

0,33

Utilisation de la distribution normale Utilisation de la distribution normale suitesuite

Quelle est la proportion de données qui est au dessus d’un score spécifique ?

Ex.2 : x = 2,50moy = 2,93é.t. = 0,33

x xz

s

Table(-1,30) => 9,68% 100 - 9,68% = 90,32%

3,00 2,930,21

0,33

Utilisation de la distribution normale Utilisation de la distribution normale suitesuite

Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?

Ex.3 : x1 = 3,00 ; x2 = 2,85 moy = 2,93é.t. = 0,33

11

x xz

s

Table(0,21) => 58,32%

2,85 2,930,24

0,33

Utilisation de la distribution normale Utilisation de la distribution normale suitesuite

Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?

22

x xz

s

Table(-0,24) => 40,52%

58,32% - 40,52% = 17,8%

Utilisation de la distribution normale Utilisation de la distribution normale suitesuite

À quel score correspond une proportion de 85% en dessous de la moyenne ?

Ex.4 : x = ?moy = 2,93é.t. = 0,33

x xz

ssz x x

x sz x

0,33 1,04 2,93 3,27x sz x

85% =>Table=> z = 1,04

top related