La distribution normaleLa distribution normale
PlanPlan
Distribution de fréquences: page 3Distribution de fréquences: page 3 Distribution normale: page 14Distribution normale: page 14 Théorème central limite: page 26Théorème central limite: page 26 Utilisation de la distribution normale Utilisation de la distribution normale
standardisée: page 33standardisée: page 33
Idée de la distribution normaleIdée de la distribution normale
On lance 2 dés et on regarde la somme On lance 2 dés et on regarde la somme
= 7= 7
Le nombre totale de possibilités est Le nombre totale de possibilités est de : 6x6=36 possibilitésde : 6x6=36 possibilités
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 10
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 50
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 200
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 1000
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 5000
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 50 000
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 200 000
Résultats théoriquesRésultats théoriques
SommeSomme PossibilitéPossibilité
22 (1,1)(1,1)
33 (1,2)(1,2) (2,1)(2,1)
44 (1,3)(1,3) (2,2)(2,2) (3,1)(3,1)
55 (1,4)(1,4) (2,3)(2,3) (3,2)(3,2) (4,1)(4,1)
66 (1,5)(1,5) (2,4)(2,4) (3,3)(3,3) (4,2)(4,2) (5,1)(5,1)
77 (1,6)(1,6) (2,5)(2,5) (3,4)(3,4) (4,3)(4,3) (5,2)(5,2) (6,1)(6,1)
88 (2,6)(2,6) (3,5)(3,5) (4,4)(4,4) (5,3)(5,3) (6,2)(6,2)
99 (3,6)(3,6) (4,5)(4,5) (5,4)(5,4) (6,3)(6,3)
1010 (4,6)(4,6) (5,5)(5,5) (6,4)(6,4)
1111 (5,6)(5,6) (6,5)(6,5)
1212 (6,6)(6,6)
Résultats théoriquesRésultats théoriques
ProbabilitéProbabilité %% SommeSomme PossibilitésPossibilités
1/361/36 2,782,78 22 (1,1)(1,1)
2/362/36 5,565,56 33 (1,2)(1,2) (2,1)(2,1)
3/363/36 8,338,33 44 (1,3)(1,3) (2,2)(2,2) (3,1)(3,1)
4/364/36 11,1111,11 55 (1,4)(1,4) (2,3)(2,3) (3,2)(3,2) (4,1)(4,1)
5/365/36 13,8913,89 66 (1,5)(1,5) (2,4)(2,4) (3,3)(3,3) (4,2)(4,2) (5,1)(5,1)
6/366/36 16,6716,67 77 (1,6)(1,6) (2,5)(2,5) (3,4)(3,4) (4,3)(4,3) (5,2)(5,2) (6,1)(6,1)
5/365/36 13,8913,89 88 (2,6)(2,6) (3,5)(3,5) (4,4)(4,4) (5,3)(5,3) (6,2)(6,2)
4/364/36 11,1111,11 99 (3,6)(3,6) (4,5)(4,5) (5,4)(5,4) (6,3)(6,3)
3/363/36 8,338,33 1010 (4,6)(4,6) (5,5)(5,5) (6,4)(6,4)
2/36 2/36 5,565,56 1111 (5,6)(5,6) (6,5)(6,5)
1/361/36 2,782,78 1212 (6,6)(6,6)
SommeSomme
=36/36=36/36
SommeSomme
= 100= 100
Simulation par Monte CarloSimulation par Monte Carlo
Distribution d’échantillonnage de la somme de 2 dés
Distribution normaleDistribution normale
Ce type de distribution est rencontrée régulièrement dans la nature (grandeur, poids, habiletés, propriétés psychologiques, etc.)
Existe-il une formule mathématique Existe-il une formule mathématique qui pourrait ajuster ces données qui pourrait ajuster ces données
empiriques ?empiriques ?
Distribution normaleDistribution normale
Distribution d’échantillonnage de la somme de 2 dés
Distribution normaleDistribution normaleDéfinition: fonction mathématique qui décrit des phénomènes pour un
n élevé.
Propriétés: - Unimodale et symétrique (autour de la moyenne)
- Mode = Médiane = Moyenne
- Asymptotique à l’abscisse (la courbe ne touche jamais l’axe des x)
2
2
( )
2
2
1( )
2
x
f x e
= 50 = 2Fonction de
densité
Probabilité d’observationProbabilité d’observationQuelle est la probabilité d’obtenir une somme de 8 ?Quelle est la probabilité d’obtenir une somme de 8 ?
pp(8) =Aire du bâtonnet (8) =Aire du bâtonnet
pp(8) = base(8) = basehauteurhauteur
pp(8) = 1(8) = 15/36 = 5/365/36 = 5/36
1/36
2/36
3/36
4/36
5/36
6/36
2 4 6 8 10 12
Probabilité d’observationProbabilité d’observation
Supposons que la taille des bâtonnets est divisée en 2Supposons que la taille des bâtonnets est divisée en 2
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observationProbabilité d’observation
Encore et encore …Encore et encore …
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observationProbabilité d’observation
… … infiniinfini
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observationProbabilité d’observationQuelle est la probabilité d’obtenir une somme de 8 ?Quelle est la probabilité d’obtenir une somme de 8 ?
pp(8) =Aire du bâtonnet (8) =Aire du bâtonnet
pp(8) = 0(8) = 0hauteurhauteur
pp(8) = 0(8) = 05/36 = 05/36 = 0
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
On ne peut donc plus connaître la probabilité d’une somme donnée !
Fréquences cumulativesFréquences cumulativesSolution: Fréquences cumulativesSolution: Fréquences cumulatives
Si on veut Si on veut pp(8), alors on fait la différence entre 2 fréquences cumulatives(8), alors on fait la différence entre 2 fréquences cumulatives
=> f.c.(8)-f.c.(7)=> f.c.(8)-f.c.(7)
1/36
2/36
3/36
4/36
5/36
6/36
2 3 4 5 6 7 8 9 10 11 12
f.c.(8) = (1+2+3+4+5+6+5)/36=26/36f.c.(8) = (1+2+3+4+5+6+5)/36=26/36
f.c.(7) = (1+2+3+4+5+6)/36=21/36f.c.(7) = (1+2+3+4+5+6)/36=21/36
=> f.c.(8) - f.c.(7) = (26-21)/36 = 5/36=> f.c.(8) - f.c.(7) = (26-21)/36 = 5/36
Distribution normaleDistribution normaleDe façon similaire, pour connaître la probabilité d’un score x quelconque sous la courbe normale, il faut calculer l’aire sous la courbe (intégrer) de -∞ jusqu’à x.
2
2
( )
2
2
1( )
2
xx
g x e
Fonction de densité cumulée
x
x
Distribution normale standardDistribution normale standard
Comme il existe une infinité de valeurs que peuvent prendre les paramètres et , par convention on parle de distribution normale standard si = 0 et = 1.
ZZ
PD
FPD
F
Distribution normale standardDistribution normale standard
Ex.
z = -1,75
Théorème central limiteThéorème central limite
Même si la distribution initiale n’est pas normale, la distribution des moyennes d’échantillonnage le sera
Ex.: x={1, 1, 1, 2, 2, 3}
Théorème central limiteThéorème central limiteExemple x={1, 1, 1, 2, 2, 3}
On tire des échantillons n=10 un très grand nombre de fois. Pour chaque série on calcul la moyenne.
t1={2,2,3,2,3,3,2,2,1,3}=> moyenne = 2.3
t2={3,2,2,2,1,2,1,2,2,2} => moyenne = 1.9
t3={1,1,3,2,1,2,1,2,1,1} => moyenne = 1.5
•
•
•
t10000000 = {1,2,1,3,2,1,3,1,3,3} => moyenne = 2.0
Puis, on regarde la distribution de ces moyennes.
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 10
Moyenne = 1.760 Écart-type = 0.225
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 100
Moyenne = 1,663 Écart-type = 0,232
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 1000
Moyenne = 1,666 Écart-type = 0,240
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 10 000
Moyenne = 1,668 Écart-type = 0,235
Simulation par Monte CarloSimulation par Monte Carlo
Nombre d’essais = 100 000
Moyenne = 1,668 Écart-type = 0,235
Utilisation de la distribution normaleUtilisation de la distribution normale
Solution: Transformation en score z
Quelle est la proportion de données qui est en dessous d’un score spécifique ?
Logique de cette transformation : Soustrait une quantité de la
distribution. Moy = 50
É.-t. = 2
Pour utiliser la table des z, il faut transformer toute distribution normale en une distribution normale standardisée (=0, =1)
Moy = 0
É.-t. = 1
Utilisation de la distribution normaleUtilisation de la distribution normale
Moy = 50
É.-t. = 2
Moy = 0
É.-t. = 1
distribution-distribution-1010
distribution-distribution-2020
Moy = 30
É.-t. = 2
Moy = 40
É.-t. = 2
Utilisation de la distribution normaleUtilisation de la distribution normale
Moy = 0
É.-t. = 1
distribution-distribution-3030
distribution-distribution-4040
Moy = 30
É.-t. = 2
Moy = 20
É.-t. = 2
Moy = 10
É.-t. = 2
Utilisation de la distribution normaleUtilisation de la distribution normale
Moy = 0
É.-t. = 1
distribution-distribution-5050
Moy = 10
É.-t. = 2
Moy = 0
É.-t. = 2
Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0.
Moyenne( ) 0distribution x
Utilisation de la distribution normaleUtilisation de la distribution normale
(distribution-50)/1.25(distribution-50)/1.25
-On divise le résultat de la soustraction par une autre quantité
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 2
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1.75
Utilisation de la distribution normaleUtilisation de la distribution normale
(distribution-50)/1.5(distribution-50)/1.5
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1.5
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1.75
- Divise le résultat de la soustraction par une autre quantité
Utilisation de la distribution normaleUtilisation de la distribution normale
(distribution-50)/1.75(distribution-50)/1.75
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1. 5
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1.25
- Divise le résultat de la soustraction par une autre quantité
Utilisation de la distribution normaleUtilisation de la distribution normale
(distribution-50)/2(distribution-50)/2
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1. 25
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1
- Divise le résultat de la soustraction par une autre quantité
Utilisation de la distribution normaleUtilisation de la distribution normale
(distribution-50)/2(distribution-50)/2
Moy = 0
É.-t. = 1
Moy = 0
É.-t = 1
Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0. Et si on divise le résultat de cette soustraction par l’écart-type, alors le nouvel écart-type de la distribution sera de 1.
- Divise le résultat de la soustraction par une autre quantité
( )Écart-type[ ] 1
distribution x
s
Utilisation de la distribution normale Utilisation de la distribution normale suitesuite
Solution: Transformation en score z (nombre d’écart types standards entre x et la moyenne)
Quelle est la proportion de données qui est en dessous d’un score spécifique ?
Ex.1 : x = 3,70moy = 2,93é.t. = 0,33
x xz
s
3,70 2,932,33
0,33
Table(2,33) => 99,01%
2,50 2,931,30
0,33
Utilisation de la distribution normale Utilisation de la distribution normale suitesuite
Quelle est la proportion de données qui est au dessus d’un score spécifique ?
Ex.2 : x = 2,50moy = 2,93é.t. = 0,33
x xz
s
Table(-1,30) => 9,68% 100 - 9,68% = 90,32%
3,00 2,930,21
0,33
Utilisation de la distribution normale Utilisation de la distribution normale suitesuite
Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?
Ex.3 : x1 = 3,00 ; x2 = 2,85 moy = 2,93é.t. = 0,33
11
x xz
s
Table(0,21) => 58,32%
2,85 2,930,24
0,33
Utilisation de la distribution normale Utilisation de la distribution normale suitesuite
Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?
22
x xz
s
Table(-0,24) => 40,52%
58,32% - 40,52% = 17,8%
Utilisation de la distribution normale Utilisation de la distribution normale suitesuite
À quel score correspond une proportion de 85% en dessous de la moyenne ?
Ex.4 : x = ?moy = 2,93é.t. = 0,33
x xz
ssz x x
x sz x
0,33 1,04 2,93 3,27x sz x
85% =>Table=> z = 1,04