cours de stat donné etudiants
DESCRIPTION
coursTRANSCRIPT
COURS DE STATISTIQUE
INFÉRENTIELLE
E.N.A.CFrançoise SEYTE
Maître de Conférence
Université Montpellier 1
2014 - 20151
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
OBJECTIFS DU COURS
Le cours a pour objectif d'acquérir et de maîtriser les outils dela statistique mathématique nécessaires à la constructiond'intervalles de confiance et de tests indispensables à la prisede décision pour un futur ingénieur.
2
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
OBJECTIFS DU COURS
Le cours de statistique probabiliste donne les basesnécessaires pour savoir prendre des décisions utilesdans le futur métier d'ingénieur.
Il essaie de répondre aux questions suivantes :
comment sont construits les échantillons?
Comment déterminer leurs tailles?
Les échantillons sont ils représentatifs de la population?
Peut-on comparer par exemple les moyennes de ces deuxéchantillons?
Peut-on faire des prévisions? …
Autant de questions auxquelles doivent savoir répondre unfutur ingénieur.
3
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
PROGRAMME
1 - Construction théorique des lois statistiques et lecturedes tables statistiques
2 - Echantillonnage
3 - Estimation ponctuelle
4 - Estimation par intervalles de confiance
5 - Tests non paramétriques (test d'adéquation et testd'indépendance) et paramétriques (tests de significationd'un paramètre et tests de comparaison de paramètres)
4
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
CHAPITRE 1 ECHANTILLONNAGE
Les lois d’échantillonnage et les variablesd’échantillonnage définies dans ce chapitre vont nousservir dans les chapitres 3 et 5 pour établir les intervallesde confiance (c’est à dire encadrer les paramètresinconnus d’une population : moyenne, variance,proportion) et faire des tests d’hypothèse (c’est-à-diretester les paramètres d’une population à partir desdonnées d’échantillonnage).
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
5
Notion de base en statistique : celle de population
Population : ensemble d’individus (ou objets ou unitésstatistiques) pouvant être décrits par un ensemble de variables(ou propriétés ou caractéristiques) communes.
Impossible d’étudier tous les individus d’une population
un sondage un échantillon représentatif.
La théorie de l’échantillonnage permet de passer descaractéristiques de la population aux caractéristiques d’unéchantillon représentatif
6
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
La question essentielle que l’on peut se poser est la suivante :
Pourquoi s’intéresser à l’échantillon, pourquoi ne pas effectuer les calculs nécessaires directement sur la population ?
Pour deux raisons au moins :
- il n’est pas certain que les statistiques désirées soient disponibles sur l’ensemble de la population,
- et d’autre part, il est beaucoup moins coûteux et aussi plus rapide de rassembler des informations sur mille individus plutôt que sur un million.
7
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1. DÉFINITIONS
1.1 Echantillons?
Soit X, une variable aléatoire définie dans une
population :
Caractérisée par sa densité de probabilité f(x), dans
le cas d’une variable aléatoire continue,
ou par sa probabilité élémentaire p(x), dans le cas
d’une variable aléatoire discrète.
8
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
échantillon théorique aléatoire probabilisé
échantillon empirique ou observé
9
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Echantillon théorique aléatoire probabilisé :
Echantillon de taille n issu de X, ou n-échantillon de X, le vecteur aléatoire où et indépendants .
L’échantillon est dit IID c'est-à-dire identiquement indépendamment distribué.
10
ni XXXX ,,..., 21 iXX i ji XX ,
ji
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Echantillon empirique ou observé :
L’ ensemble des n valeurs images indépendantes de X estconstitué des n images de l’épreuve associée à Xindépendantes
11
n21 x,,x,x
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
La dernière précision que nous devons apporter avant d’aborder les variables d’échantillonnage est de bien comprendre que les échantillons ne sont pas uniques :
il est en effet possible de prendre plusieurs échantillons de la population mère.
Par conséquent, il est toujours possible de considérer que les échantillons sont choisis de manière aléatoire.
12
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1. 2. Vraisemblance d’un échantillon
→ X : variable aléatoire continue caractérisée par
son ensemble de définition f(x) densité de probabilité
→ X: variable aléatoire discrète caractérisée par :son ensemble de définition
p(x) probabilités élémentaires
13
n1 x,,xL
)x(p)x(px,,xL n1n1
)x(f)x(fx,,xL n1n1
)(; xp
)(; xf
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
SYNTHESE
Caractéristiques de la population
Caractéristiques correspondantes dans l’échantillon
théorique
Caractéristiques correspondantes dans l’échantillon
empiriqueLa moyenne : m
La variance :
ou s² ou La proportion p F f
14
X x
2S 2S ]X[V2
iX
nX
1 22 )(
1XX
nS i
n
XF
s²
^
dxxxfXEm
x
xpxXEm
cas continu
dx)x(fmx)X(EXE]X[V222
x
222 pxmx)X(EXE]X[V
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
cas discret
les échantillons ne sont pas uniques : il est en effet possiblede prendre plusieurs échantillons de la population mère.
Par conséquent, il est toujours possible de considérer que leséchantillons sont choisis de manière aléatoire.
Ainsi, théoriquement on peut associer à chaque échantillonune statistique comme la moyenne et une probabilitéd’occurrence associée à .
La moyenne de l’échantillon est donc une variable aléatoireque l’on notera , celle-ci rassemble toutes les valeurs prisespar l’ensemble des mesurées sur chaque échantillon.
Il en va de même pour l’écart-type S, la variance S², laproportion F, la caractéristique de l’individu i, …
15
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
x
X
x
x
2 . VARIABLES D’ÉCHANTILLONNAGE
2.1. Etude de 𝑿
Ex : un chef d’entreprise s’intéresse au diamètre moyen despièces métalliques qu’il fabriqueLa population : ici : les pièces métalliquesLa variable aléatoire X : « diamètre des pièces »Il prélève un échantillon de n pièces. Il mesure le diamètre deces pièces. Il peut calculer le diamètre moyen de ces pièces.C’est une statistiquePar contre la variable aléatoire : « diamètre moyen despièces ». celle-ci rassemble toutes les valeurs prises parl’ensemble des mesurées sur chaque échantillon.
16
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Objectifs : calculer pour chacune des variables d’échantillonnage précédentes leurs espérance et variance qui serviront dans la détermination de leurs lois de probabilités.
X
x
x
moyenne de l’échantillon théorique
Les sont des variables aléatoires est une variable
aléatoire.
Calcul de l’espérance de la moyenne de l’échantillon théorique
Calcul de sa variance
17
n
1i
iXn
1X
iX X
mXE
n
XV2
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
n
1i
i
n
1i
i XEn
1X
n
1EXE mXEXE i )( XX i
n
i
mn
XE1
1
.
²²
²
1XV
²
1V
²
1
11 nn
nnX
n
n
i
n
i
i
ind
XV
2.2. ETUDE DE S²
Les sont des variables aléatoires, donc S² est une
variable aléatoire.
18
n
1i
2i
2 XXn
1S
s
iX
22 1
n
nSE
On recherche 2S 22 ]ˆ[ SEtel que
estimateur sans biais de (Cf. chapitre 2). 2
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1
1
11ˆ
2
222
n
XXXX
nn
nS
n
nS
i
i
2.3 ETUDE DE LA PROPORTION D’ÉCHANTILLON FSoit Y une variable aléatoire définie dans une population.
Y présente deux modalités : évènement A évènement
La variable aléatoire Y est donc associée au tirage d’un
individu. Y est une variable de Bernoulli.
Maintenant, soit la variable X associée au tirage de n individus
de manière indépendante (c’est-à-dire au nombre de fois où A
se produit).
Considérons F la proportion dans l’échantillon théorique issude la population. obéit elle aussi à une loi binomiale :
19
A
n
1i
iYX )p,n(BX
n
XF
pFE
n
pqFV
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
p
n
npXE
n
1
n
XEFE
n
pq
n
npqXV
n
1
n
XVFV
22
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
20
POPULATION :
Moyenne : m= E[X]
Ecart-type : σ
Variance : σ ² =V[X]
Proportion : p
ECHANTILLON :
Moyenne :
Ecart-type (empirique) : s [ S ]
Variance (empirique) : s² [ S² ]
Proportion : f [ F ]
Taille : n
Caractéristique de l’individu i : xi [Xi]
x [ X ]
3 . LOIS DE PROBABILITÉS DES VARIABLES
D’ÉCHANTILLONNAGE FONDÉES SUR L’HYPOTHÈSE DE
NORMALITÉ : CAS D’UN ÉCHANTILLON TIRÉ D’UNE
POPULATION NORMALE.
21
3.1 Loi de
Quelle est l’utilité de cette loi? Prenons un ex
Une étude statistique effectuée à l’Arena de Montpellier montre que l’affluence des spectateurs est une variable aléatoire X qui suit une loi normale de moyenne 13500.
Si on choisit aléatoirement un échantillon de 50 spectacles sur ces vingt dernières années, quelle est la probabilité pour que l’affluence moyenne soit strictement supérieure à 13500 spectateurs sachant que l’écart-type de la population s’élève à 1000 ?
X
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
La variable aléatoire X : « Affluence hebdomadaire des spectateurs ». Il est indiqué dans l’énoncé que X suit une loi normale de moyenne m = 13500 et d’écart-type σ = 1000 :
Epreuve aléatoire : « Choisir un échantillon au hasard de 50 spectacles ».
Ensuite, essayons de bien distinguer les informations relatives à l’échantillon de celles issues de la population :
Taille de l’échantillon : n = 50
22
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
La question posée dans l’énoncé est relative à « l’affluence moyenne dans l’échantillon ». Il faut donc définir une nouvelle variable aléatoire :
La variable aléatoire : « Affluence moyenne des spectateurs dans l’échantillon ».
La question est précisément « quelle est la probabilité … ». Pour mesurer une probabilité, il nous faut connaître la loi suivie par la variable aléatoire qui nous intéresse. Nous devons donc déterminer la loi suivie par .
23
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
X
X
3 . LOIS DE PROBABILITÉS DES VARIABLES
D’ÉCHANTILLONNAGE FONDÉES SUR L’HYPOTHÈSE
DE NORMALITÉ : CAS D’UN ÉCHANTILLON TIRÉ
D’UNE POPULATION NORMALE.
3.1 Loi de
Hyp :
24
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
,mNX
X
Rappels sur la loi normale
RAPPEL LOI NORMALE
25
La variable aléatoire normale X est une variable continue
pouvant prendre n’importe quelle valeur entre et avec ladensité de probabilité :
avec : m l’espérance mathématiquel’écart-type de la distribution.
La variable normale centrée réduite :
avec
Toutes les tables statistiques utilisent la variable normalecentrée réduite
2mx
2
1
e2
1xf
mXU
2
2
2
1u
euf
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
,mNX
10,NU
26
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Cette table donne la densité de probabilité f(u) correspondant aux valeurs de la variable normale centrée réduite.En raison de la symétrie de la courbe de densité, la table permet de déterminer les densités correspondantes à des valeurs négatives de u : f(-u)=f(u)Ex pour f(-2,8)=0,0079=f(2,8)
Table de la densité de probabilité
Le changement de variable permet de déterminer à l’aide de la table, la densité de probabilité correspondant à une valeur quelconque de la variable normale X de moyenne m et d’écart type .
Il existe donc entre les densités de probabilité de x et de u la relation :
Ex :
27
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
)u(f)x(f
)2,5(NX la densité de probabilité pour x=8 ?
10,NU
512
58,
mxu
064750
2
129501295051 ,
,)x(f,)u(f,u La lecture de la table donne
Table de la fonction de répartition
Cette table donne, pour toute valeur positive u0 de lavariable normale centrée réduite, la valeurcorrespondante de la fonction de répartition F(u0)représentée par l’aire hachurée.
28
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
f(u)
0 u0
F(u0)
0
2
200
2
1Pr)(
u t
dteuuobuF
)u(FuUobPruUobPr 000 11
29
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Supposons que Déterminons la probabilité pour que X soit compris entre deux valeurs a et b :
,mNX
mbmXmaobPrbXaobPr
maF
mbF
mbU
maobPrbXaobPr
)1,0(NmX
U
Exemple : Soit X une variable normale de moyenne 5 et d’écart type 2 : Calculer la probabilité pour que X soit compris entre 1 et 7.
25,NX
8185097720184130
21121121
12
2
57
2
5
2
5171
,,.
)(F)(F)(F)(F)(F)(F
UobPr
XobPrXobPr
30
MCU F. Seyte, Université Montpellier 1- EM Alès - Statistique 1A
Table de la loi normale centrée réduite Cette table permet de trouver la valeur d’une variable normaleen fonction de la probabilité P de dépassement ou de laprobabilité Q complémentaire (Q=1-P). C'est-à-dire que dans cecas, est connue et on cherche à déterminer
Si > 0,5 alors on lira directement dans la table la valeur de u0.Si < 0,5 alors on lira dans la table la valeur de -u0.
0uF 0u
0uF
0uF
f(u)
0
u0
u
P
Q
00
0
uFuUobPrQ
uUobPrP
Exemple : On cherche tel que
31
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
0u P,uUobPr 7500
f(u)
0
u0
u
P
Q
75%
250
250
7501
0
0
0
,uF
,uUobPr
,uUobPr
500 ,uF
on lira donc -u0
La lecture de la table donne 0,6745 donc 674500 ,u
Soit u0 la valeur telle que
32
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
%uuobPr 50
f(u)
0
u0
u
P
5%
95%
950
950
0501
5
0
0
0
0
,uF
,uUobPr
,uUobPr
%uuobPr
95.u remplace la valeur de la variable centrée réduite ayant comme fonction de répartition 95% et/ou ayant comme probabilité de dépassement 5%
On lit cette valeur dans la table 6449,1%95 %5 95. uQP
95.0 uu
CONDITIONS D’APPLICATION
1) Somme de variables normales indépendantes
Ce résultat s’étend à un nombre quelconque de variables normalesindépendantes.
2) Le théorème central limite
si les variables suivent des lois de même nature de moyenne m et d’écart type , si les sont indépendants
* est asymptotiquement normale de moyenne mn et d’écart type
*
3) Approximation de la loi binomiale par la loi normale
33
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
22
212121
222
111,mmNXX
,mNX
,mNX
iX
n
n,nmNXni
n,mN
n
XX
i
nn
nXV
nXV
mnmn
XEn
XE
i
i
2
2
2
2
1
11
iX
18
50
np
nnpq,npNp,nBX
L
34
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
nmNX ;
D’après le théorème central limite: NX
mXE n
XV2
Loi de X
SUITE EX DIAPO 22
Il y a donc une probabilité de 50% que l’affluence moyenne dans l’échantillon soit supérieure à 13500 personnes.
35
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
)0001 ; 13500(),(~X NmN
nmNX
;~ 50/1000 ; 13500~ NX
)1 ; 0(~U N
n
mX
501000
13500U
X
.5,0)0(1)0U(P
501000
1350013500P)13500(P
UF
n
mXX
3.2 LOI DE LA VARIANCE S²
Quelle est l’utilité de cette loi? Prenons un ex
La politique de cohésion sociale d’un pays a, selon legouvernement en place, besoin de tenir compte desinégalités de revenu entre les salariés du secteur privé. Afind’y parvenir, le gouvernement prélève un échantillon de 30salariés du secteur privé, la moyenne étant de 1700€ et lavariance empirique de 1000€ (la variance de la populationétant de 1517.47€). Le gouvernement décidera de rehausserles bas salaires de 5% si la probabilité que la varianceempirique dépassant 1000€ est au moins de 20%. Legouvernement interviendra-t-il en faveur des bas salaires ?
Afin de résoudre le problème, traduisons la question poséeen langage statistique : 36
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
?1000S²P
Loi de la variance S²Théorème de Fisher
Soit un échantillon IID issu de la loi Normale de moyenne m et d’écart type (notée : N(m,)), alors :
les grandeurs aléatoires sont indépendantes.
ou car
37
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
n
mXet
S1n
2
2
)1n(
S1n 2
2
2
)1n(nS 2
2
2
22 S1n
nS
)1(2
2
2
nnS
LOI DU KHI DEUX
1) DéfinitionLoi du à un degré de liberté
Loi du à n degrés de liberté :
Soient avec i=1, …n les Ui sont indépendantes
pour a >0
38
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
2
2
22
1
2
1
01
x
ex
)x(f
,X)(XUX
10,NU
2 12
2 n2
10,NUi
)n(U...UUUU ni222
322
21
2
)(2 nX ,X 0
122
22
2
1
nx
nxe
n
)x(f
0
1dttea at !1 nn
2
1
39
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
n=2
n=4
n=15
2
2f
La distribution du est dissymétrique avec étalement vers la droite
Elle se rapproche de la distribution normale à laquelle elle peut être assimiléelorsque n>30
2
n)x(V
n)X(E
2
2 )TABLE STATISTIQUE
40
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1-P
n2
2f
20
P
La distribution du ne dépendant que d’un seul paramètre n, le nombre de degrés de liberté, la table est à double entrée.Elle donne pour , la valeur de ayant la probabilité P d’être dépassée.
2
30n 2
20 2
0
2PrP que est tel nob np21
20
3) LECTURES DANS LA TABLE
41
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
95%
n2
2f
202
95.
5% 41.31202
95.
97.5%
n2
2f
152
025.
2.5% 26.6152
025.
lorsque n>30 on admet que : 10122 2 ,Nn
67.22 2/)²1-50*2(1.6449 )²/21-DDL *2.952
95. u(50
4) SOMME DE VARIABLES DE INDÉPENDANTES
42
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
2
1X 12 n
2X 22 n
et indépendantes 1X 2X
21
2
21 nnXX
n
i
i
n
i
nii nn...n...nnX
1
2
1
222
21
2
)n(X ii2 iX indépendantes
Théorème d’additivité de indépendants 2
SUITE EX DIAPO 36
43
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
. 77.19KP1517.45
100003
²
S²P1000S²P
n
Dans la table du à la ligne v = 29, on constate que le fractile 19.77 correspond à une probabilité de 0,9. D’où :
. 0,91000S²P
Le gouvernement interviendra en faveur des bas salaires si cette probabilité dépasse 20%, ce qui est le cas.
2
3.3 LOI DE INDÉPENDANTE DE (DE LA VARIANCE
DE LA POPULATION)
Quelle est l’utilité de cette loi? Prenons un ex
A la suite d’une étude statistique effectuée par le CROUS surces 15 dernières années, on estime que l’affluencehebdomadaire des étudiants au restaurant universitaire estune variable aléatoire que nous noterons X qui suit une loinormale de moyenne 2000. On choisit aléatoirement unéchantillon de 52 semaines sur ces 15 dernières années.L’écart-type de l’affluence hebdomadaire mesurée surl’échantillon est de 500. Quelle est la probabilité pour quel’affluence moyenne hebdomadaire soit strictementsupérieure à 2050 étudiants ?
44
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
X 2
La variable aléatoire X : « Affluence hebdomadaire desétudiants au restaurant universitaire »
« Affluence hebdomadaire moyenne des étudiants aurestaurant universitaire issus de l’échantillon »
L’épreuve aléatoire : « Choisir un échantillon au hasard de 52semaines »
45
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
) ; 2000(),(~X NmN
X
)/;(~ nmNX
Distinguons les informations relatives à l’échantillon de celles issuesde la population :
Taille de l’échantillon : n = 52
Ecart-type de l’échantillon : s = 500. Notons qu’il s’agit bien de s etnon de S puisque nous prenons la mesure de l’écart-type sur unéchantillon particulier.
L’écart-type de la population σ : inconnu
?
La technique consiste à faire « disparaître » σ, on l’appelleratechnique de « Studentisation ».
46
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
52
20002050P)2050(P
n
mXX
un échantillon IID
studentisation
La loi de Student est le rapport entre une variablealéatoire obéissant à une loi normale centrée réduite etla racine carrée d’une variable aléatoire suivant une loide rapporté à son degré
47
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
ni1 XXX
);m(NXi
n
;mNX
Ici INCONNU
2
LOI DE STUDENT 1)DÉFINITION
2 variables aléatoires X et Y indépendantes
48
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
10,NX nY 2
nY
XnT
10,NnTalorsnsi
n
n
,NnT
2
10
En pratique, lorsque n > à 30
2 )TABLE STATISTIQUE
donne la probabilité P d’être dépassée en valeur absolue
49
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
f(t)
0
t0
t
P/2
P/2
1-P
-t0
000 tTobPrettTobPrtTobPrP
Notation : t0 =t1-p/2 -t0 = tp/2 = - t1-p/2
3 )LECTURES DANS LA TABLE
50
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
f(t)
0
t0=t.95
t(20)
5%
5%
1-P=90%
-t0= t.05
725.1
%10
200
t
p
n
IBS
1.372 (10)T.80
IBS
1.725 (20)T.90
2ème exemple
POUR TROUVER LA LOI DE INDÉPENDANTE DE
51
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
)1n(T1nS
mX
)1n(
nS
n
mX
2
2
nn
NnT
)(
)1,0()(
2
)1(2
2
2
nnS
nmNX ;
X
SUITE EX DIAPO 44
Convergence : d’où FT = FU. On obtient :
52
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
51500
20002050TP
51500
20002050
1P)2050(P
nS
mXX
)71,0(1)71,0T(P TF
)1;0(T N
C
.2389,07611,01)71,0(1)71.0(1)71,0)51(P(T UT FF
Il y a donc une probabilité de 23.89% que l’affluence moyennedans l’échantillon soit supérieure à 2050 personnes.
3.4 LOI DE F
Quelle est l’utilité de cette loi? Prenons un ex
Deux usines A et B fabriquent des avions de même marque.L’usine A produit 4% d’avions ayant des problèmes la premièreannée. Une compagnie reçoit 600 avions en provenance de A.
Quelle est la probabilité pour que la compagnie trouve moinsde 1% d’avions défectueux ?
53
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Soit X la variable aléatoire : « Nombre d’avions défectueux enprovenance de l’usine A »
Epreuves aléatoires : « Choisir un avion au hasard dansl’échantillon nA »,
F : « l’avion provenant de A est défectueux » avec pA = 4%.
« l’avion provenant de A n’est pas défectueux » avec qA =96%.
XA() = {0,1,2,…, 600} et nA = 600
Convergence : La loi binomiale converge vers la loi normale (les deux conditions nApA > 18 et nA > 50 D’où :
54
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
),(~XA AA pnB
qpnpnNAAAAA
C
A ;X
,84 ; 42XA NC
?)01,0F(P A
F
LOI DE F
Supposons ( en pratique n > 50) et np > 18.
Soit
F converge alors vers une loi normale. On a montré dans le paragraphe 2.3 (diapo 19) que et .
55
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
)p,n(BX
n
npq,npN)p,n(BX
L
n
XF
pFE
n
pqFV
n
pqpNF
L
,
SUITE EX DIAPO 54
56
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
.099991,01)75,3(175,3UP1
75,3UP0,008
04,001,0FP)01,0F(P
U
A
AA
AAA
F
n
qp
p
;~ X
FA
AA
A
A
AA
n
qppN
n 008,0 ; 04,0~
XF
A
AA N
n
4 LOIS DE PROBABILITÉ DE VARIABLES D’ÉCHANTILLONNAGE
À PARTIR DE DEUX ÉCHANTILLONS TIRÉS DANS DEUX
POPULATIONS NORMALES.
Soient deux populations dans lesquelles nous définissons deux variables aléatoires et .
Dans ces deux populations, nous prélevons deux échantillons IID de taille respective n1 et n2.
HYPS :
57
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1X 2X
),m(NX 111
),m(NX 222
4.1 LOI DE LA DIFFÉRENCE DES MOYENNES
D’ÉCHANTILLONS LORSQUE ET SONT CONNUS
Quelle est l’utilité de cette loi? Prenons un ex
Les mécaniciens d’une compagnie A ont un revenu moyen de2500 euros avec un écart-type de 1100 euros. La compagnie Benregistre un revenu moyen de 3200 euros avec un écart-typede 1000 euros. Les revenus sont indépendants etidentiquement distribués.
Déterminez la probabilité pour que le revenu moyen d’unéchantillon de 62 personnes choisies de manière aléatoiredans la compagnie A soit inférieur d’au moins 900 euros àcelui d’un échantillon de même effectif tiré au hasard dans lacompagnie B.
58
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
21
22
Xi la variable aléatoire : « Revenu des mécaniciens de lacompagnie i », i ∈{A,B}
Epreuves aléatoires : « Choisir un salarié au hasard dansl’échantillon ni = 62 de la compagnie i », i ∈{A,B}. Les deuxéchantillons sont de même taille nA = nB = 62.
Loi de probabilité : celle-ci n’est pas fournie mais la conditionspécifiée dans l’énoncé « revenus indépendants etidentiquement distribués » permet l’utilisation du théorèmede la limite centrale. On considère pour cela que deséchantillons de taille 62 permettent de garantir une conditionnécessaire du théorème : n → ∞. On en déduit alors soushypothèse de revenus indépendants et identiquementdistribués que : i∈{A,B}
59
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
iii m ; ~X
: « Revenu moyen des mécaniciens de l’échantillon prélevé dans la compagnie i », i ∈{A,B}
60
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
1100 ; 2500~XA N .1000 ; 3200~XB N
iX
?900P AB XX
)/;(~ AA AA nmNX )/; (~ BB BB nmNX
?~AB XX
LOI DE
avec X1 et X2 indépendantes
D’après le théorème central limite :
61
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
2
222
1
22
2
1
111
1
11
1
,1
,1
nmNXX
nX
nmNXX
nX
n
i
i
n
i
i
2
2
2
1
2
12121 ;
nnmmNXX
21 XX
SUITE EX DIAPO 59
La probabilité pour que le revenu moyen dans l’échantillon Asoit inférieur d’au moins 900€ de celui de l’échantillon B est de14,66%.
62
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
.1466,08554,01)06,1(106,1UP
8,188
700900P900P
U
B
2
B
A
2
A
ABABAB
F
nn
mmXXXX