pr. a. soulaymanicours statistique 20051 tests relatifs aux caracteres quantitatifs
TRANSCRIPT
Pr. A. SOULAYMANI Cours Statistique 2005 1
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
TESTS RELATIFS AUX
CARACTERES QUANTITATIFS
Pr. A. SOULAYMANI Cours Statistique 2005 2
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
I- Position du Problème
Pr. A. SOULAYMANI Cours Statistique 2005 3
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Généralités
Population
Supposons une population infiniment grande pour laquelle la moyenne d’un caractère quantitatif X est = 0. On dispose d’un ou de plusieurs
échantillons de moyennes m1, m2,….mi… ;mk.
m1 m2mkmi
2Les observations mi sont elles compatibles avec l’hypothèse que dans la population ?
Pr. A. SOULAYMANI Cours Statistique 2005 4
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Trois problèmes peuvent être posés dans ces conditions :
La comparaison d’une moyenne observée à une moyenne théorique,
L’estimation d’une moyenne théorique à partir d’une moyenne observée et
La comparaison des moyennes observées deux à deux.
Pr. A. SOULAYMANI Cours Statistique 2005 5
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
II- Estimation statistique
Pr. A. SOULAYMANI Cours Statistique 2005 6
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
• Soit X, une variable aléatoire quantitative de moyenne et de variance 2.
Ces paramètres sont ceux d’une population de taille infini et peuvent être indéterminés.
m
2Tirage parfaitement
au hasard d’un échantillon de taille N
Pr. A. SOULAYMANI Cours Statistique 2005 7
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
La moyenne de la variable aléatoire X de cet échantillon est m de sorte que:
ki
ix
Nxm 1
1
La quantité S2 est un bon estimateur de 2 au niveau de l’échantillon; telle que:
ki
i
ki
ixx
Nxx
NS 1
22
1
22
11
)(1
1
Pr. A. SOULAYMANI Cours Statistique 2005 8
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Population
m1 m2 …… mk
2
• En tirant plusieurs échantillon de la population, les moyennes observées sont m1, m2,….mk.
La distribution de ces différentes moyennes est appelée distribution d’échantillonnage de la moyenne.
Pr. A. SOULAYMANI Cours Statistique 2005 9
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Il est évident, et l’expérience le montre que ces différentes moyennes ne sont pas identiques.
Les observations mi varient, et ses variations expriment les fluctuations de l’échantillonnage.
Autrement dit, la distribution des moyennes des différents échantillons constitue une nouvelle variable aléatoire, sur laquelle on peut appliquer les règles de calcul des variables aléatoires..
m = {m1, m2,……..m3,……….mk}
Pr. A. SOULAYMANI Cours Statistique 2005 10
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Les Différents paramètres de cette nouvelle distribution m = {m1, m2,……..m3,……….mk} sont:
La moyenne théorique de la distribution des moyennes est égale à E(m) = .Les différentes moyennes observées m1, m2…mi…mk sont regroupées autour de cette moyenne théorique .
La variance de la moyenne 2m et son écart type m
de la nouvelle distribution sont:
Net
Nx
m
x
m
2
2
Pr. A. SOULAYMANI Cours Statistique 2005 11
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Net
Nx
m
x
m
2
2
Il est clair que plus la taille N des échantillons est grande, plus les différentes moyennes observées m1, m2…mi…mk sont regroupées de manière très proche autour de la moyenne théorique .
Plus N augmentePlus la variance
diminue
Pr. A. SOULAYMANI Cours Statistique 2005 12
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
La Loi de probabilité de la distribution des moyennes
La forme de la distribution des moyennes ne peut être connue que si l’on connaît la distribution de la variable aléatoire X dans la population.
D’une manière générale, si le caractère étudié (V.A X) obéit à une loi de Laplace Gauss dans la population, alors la distribution des moyennes mi suit également une loi normale η(,sm) ou encore une Loi normale centrée réduite (0,1).
Pr. A. SOULAYMANI Cours Statistique 2005 13
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Toutefois, on peut admettre que lorsque l’effectif N tend vers l’infini, la loi de probabilité de la distribution de m suit une loi normale quelque soit la distribution de X dans la population.
m1 mimk
mm
En pratique,
on considère
une distributio
n
des moyennes norm
ale
à partir
de N>=30
Pr. A. SOULAYMANI Cours Statistique 2005 14
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Intervention de la loi de student:
Lorsque la taille de l’échantillon est petite, N<30; la loi de probabilité de la distribution des moyennes mi pour une variable aléatoire X distribuée normalement, ne suit pas une loi normale, mais une loi de student t à (N-1) degré de liberté, centrée réduite, de sorte que:
Ns
m
S
mt
xm
S x est l’é
cart - type
Estimé de la
Variable aléatoire X
Pr. A. SOULAYMANI Cours Statistique 2005 15
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Le remplacement de par son estimateur S a pour effet de modifier les calculs et les rendres sans biais.
La forme de la loi montre que dès que l’effectif augment, la loi de student tend vers une loi normale centrée réduite (0,1).
En pratique,
on considère que la lo
i de
Student tend vers une lo
i
Normale centré
e réduite
si N>=30
Pr. A. SOULAYMANI Cours Statistique 2005 16
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
En résumé, on distingue 4 situations selon la distribution de X:
X suit une loi normale dans la
population
X ne suit pas une loi normale dans la
population
Grand Échantillon
N≥30
La distribution des moyennes
suit une loi normale
La distribution des moyennes suit une loi approximativement
normale
Petit Échantillon
N<30
La distribution des moyennes suit une loi de
student
Loi
Indéterminée
!!!!!!!!!!!???
Ns
m
Ns
m
Ns
tmddlN )1(
Ns
m
Ns
m
Ns
tmddlN )1(
Pr. A. SOULAYMANI Cours Statistique 2005 17
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III- Comparaison d’une moyenne
observée m à une moyenne théorique
Pr. A. SOULAYMANI Cours Statistique 2005 18
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Échantillon(N)
m
Tirage parfaitement au hasard
Soit un échantillon E de N individus sur lequel on mesure la valeur d’une variable aléatoire continue X.
Population de taille infini
De moyenne
On cherche à savoir si la moyenne de x au niveau de l’échantillon est compatible à celle de la population?.
Pr. A. SOULAYMANI Cours Statistique 2005 19
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
En d’autre termes, le problème peut être posé de 3 manières:
Sur le critère de la VA X, l’échantillon E est-il issu de la population P? (Situation bilatérale)
L’échantillon E provient-il d’une population P’ dont la moyenne de la VA X est supérieure à celle de la population P? (Situation unilatérale)
L’échantillon E provient-il d’une population P’’ dont la moyenne de la VA X est inférieure à celle de la population P? (Situation unilatérale)
Pr. A. SOULAYMANI Cours Statistique 2005 20
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
m ≠
Situatio
n bilatérale
m >
Situatio
n unilatérale
m <
Situatio
n unilatérale
En situation Unilatérale; la
signification est testée à 10%
En situation bilatérale; la
signification est testée à 5%
Pr. A. SOULAYMANI Cours Statistique 2005 21
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Dans la suite du résonnement, on pose les notations suivantes:
m : moyenne de X observée ou calculée sur l’échantillon.
: moyenne théorique de X au niveau de la population de référence P.
2: Variance théorique de X dans la population.
s2: Estimateur sans biais de la variance de X dans la population.
Pr. A. SOULAYMANI Cours Statistique 2005 22
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III-1. Cas de petits échantillons: (N<30)
III-1-1. Si la distribution de la VA X suit une loi normale et la variance est inconnue:
Dans ce cas, on utilise une loi de student t à N-1 ddl de sorte que:
xxmS
Nm
NSm
S
mt
Pr. A. SOULAYMANI Cours Statistique 2005 23
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
La valeur de t calculé est confrontée à celle de t lue sur la table théorique à (N-1) ddl et au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).
xxmS
Nm
NSm
S
mt
t suit une loi de student à N-1 ddl
Pr. A. SOULAYMANI Cours Statistique 2005 24
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Exemple: On sait que la concentration plasmatique du calcium du sujet sain est =2,5 mol/mt
Sur un échantillon de 18 personnes, on a trouvé une moyenne m de 3,2 mole/ml et un écart type estimé Sx = 1,1 mmole/ml.
Peut-on conclure que la calcémie moyenne des 18 personnes soit augmentée?NB: On suppose que la moyenne m’ de la calcémie, de la population dont l’échantillon est issu, suit une loi binomiale.
Pr. A. SOULAYMANI Cours Statistique 2005 25
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Réponse:
Choix du Test et vérification des conditions de son application
L’échantillon est Petit N<30, mais la VA « Calcémie » suit une loi normale dans la population dont l’échantillon est issu.
Application du Test:
xxmS
Nm
NSm
S
mt
Suit une loi de
student à 17 ddl(18-1)
Pr. A. SOULAYMANI Cours Statistique 2005 26
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Définir H0 et H1
H0: On considère que ’. La moyenne de la calcémie au niveau de l’échantillon ne diffère pas significativement de la moyenne des sujets sains.
H1: On considère que ’. La moyenne de la calcémie au niveau de l’échantillon est supérieure à la moyenne des sujets sains.
Pr. A. SOULAYMANI Cours Statistique 2005 27
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Fixer la taille du test et définir la règle de décision
Puisqu’on veut savoir si la moyenne au niveau de l’échantillon est supérieure à celle de la population, on est dans une situation unilatérale.
La valeur critique (ou limite) en situation bilatérale est t(5% / 17ddl) = 2,11.
La valeur critique (ou limite) en situation unilatérale est t(10% / 17ddl) = 1,74.
La valeur de t c
alculée
va être comparée
à 1,74 puisqu’on est
en situatio
n Unilatérale
Pr. A. SOULAYMANI Cours Statistique 2005 28
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Calcul de t observée
La valeur de tcalculée = 2,7 est supérieure à la valeur de la table t(10% / 17ddl) = 1,74. La valeur d
e t calculée
va être comparée
à 1,74 puisqu’on est
en situatio
n Unilatérale
7,21,1
185,22,3
xxmS
Nm
NSm
S
mt
Application de la règle de décision
On rejette H 0 au ris
que de 5%
&
on retient H 1
on conclu que la moyenne au
niveau de l’échantillon est
supérieure à celle de la
population de référence.
Pr. A. SOULAYMANI Cours Statistique 2005 29
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III-1. Cas de petits échantillons (Suite): (N<30)
III-1-2. Si la distribution de la VA X est inconnue:
Dans ces conditions (cf Tableau) il n’existe pas de test non paramétrique
pour comparer les moyennes!!!?
On utilise alors la médiane.
On utilise alors la médiane en comparant la proportion des sujets à droite de la médiane de la population (ou à gauche) par rapport à 50%.
Pr. A. SOULAYMANI Cours Statistique 2005 30
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Exemple: Score de la douleur sur 15 patients traité a avec un nouvel morphinique. La médiane de la population de référence traité par un ancien médicament est de 4.
Ce score varie de 0 (aucune douleur) à 10 (douleur intense). Les résultats obtenus sont repectivement:
0,0,1,1,2,2,2,3,3,4,5,6,7,8,8
Dans l’échantillon le % des patient ayant un score <4 est de 60% (9/15)
Solution:
Pr. A. SOULAYMANI Cours Statistique 2005 31
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Le problème revient donc à la comparaison d’une proportion observée (60%) à une proportion théorique au niveau de la population (50%)
On doit donc utiliser un test de conformité
pour comparer une fréquence observée à une fréquence
théorique.(cf. Chap. Manipulation des fréquences)
Pr. A. SOULAYMANI Cours Statistique 2005 32
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III-2. Cas des grands échantillons :(N≥30)
Dans ce cas, quelque soit la distribution de la VA X dans la population, on suppose que la distribution des moyenne m suit une loi normale d’espérance et d’écart type m.
NAvec x
m
Pr. A. SOULAYMANI Cours Statistique 2005 33
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
xxm
Obs
Nm
N
mm
Cet écart suit une loi normale centrée et réduite (0,1).
Le test consiste donc à calculer l’écart réduit et le confronter à l’écart théorique au niveau de la table de l’écart réduit.
Pr. A. SOULAYMANI Cours Statistique 2005 34
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
xxm
Obs
Nm
N
mm
La valeur de l’écart calculé est confrontée à celle de lue sur la table théorique au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).
Pr. A. SOULAYMANI Cours Statistique 2005 35
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
IV- Estimation d’une moyenne théorique
à partir d’une moyenne observée m
Pr. A. SOULAYMANI Cours Statistique 2005 36
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Intervalle de confiance d’une moyenne
théorique
Pr. A. SOULAYMANI Cours Statistique 2005 37
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III-1. Cas de petits échantillons : (N<30)
Dans ces conditions, il est nécessaire de s’assurer de la normalité de la distribution des moyennes.
Il est également, obligatoire, de remplacer la variance 2 par son estimation S2.
On utilisera pour le calcul statistique le t de student.
Pr. A. SOULAYMANI Cours Statistique 2005 38
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
En pratique, le calcul se fait de la manière suivante:
ddlNàNS
tm x 1%5
NS
tmNS
tm XX
%%
Pr. A. SOULAYMANI Cours Statistique 2005 39
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
III-1. Cas des grands échantillons : (N≥30)
Dans ces conditions, on suppose que la variance est connue, et que l’échantillon est assez grand pour considérer une distribution de moyenne normale.
On utilisera pour le calcul statistique le de l’écart centré réduit.
Pr. A. SOULAYMANI Cours Statistique 2005 40
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
En pratique, le calcul se fait de la manière suivante:
Nm x
%
Nm
Nm xx
%%
Pr. A. SOULAYMANI Cours Statistique 2005 41
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
L’intervalle de confiance de la moyenne a (1-)% chance de recouvrir la moyenne théorique de la population à partir de laquelle l’échantillon de moyenne m a été issu.
Une meilleure estimation de l’intervalle de confiance de la moyenne est obtenue en utilisant l’estimateur sans biais de la variance S2 pour le calcul au lieu de la variance 2.
Pr. A. SOULAYMANI Cours Statistique 2005 42
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
V- Comparaison de deux moyennes
observées m1 & m2
Pr. A. SOULAYMANI Cours Statistique 2005 43
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Population
m1 m2
2
On dispose de 2 Échantillon E1 et E2.
On veut comparer les moyennes observées aux niveaux des 2 Échantillon E1 et E2.
E1 E2
Pr. A. SOULAYMANI Cours Statistique 2005 44
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
En d’autre termes, le problème peut être posé de 3 manières:
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale)
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)
Pr. A. SOULAYMANI Cours Statistique 2005 45
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Définir H0 et H1
H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale)
1 et 2 sont respectivement les moyennes théoriques des 2
populations dont on a tirées E1 et E2.
H1: On considère que 1≠. La moyenne m1 au niveau de l’échantillon E1 diffère significativement de la moyenne m2 de E2.
Pr. A. SOULAYMANI Cours Statistique 2005 46
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Définir H0 et H1
H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.
1 et 2 sont respectivement les moyennes théoriques des 2
populations dont on a tirées E1 et E2.
H1: On considère que 1>. La moyenne m1 au niveau de l’échantillon E1 es supérieure significativement de la moyenne m2 de E2.
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)
Pr. A. SOULAYMANI Cours Statistique 2005 47
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Définir H0 et H1
H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.
1 et 2 sont respectivement les moyennes théoriques des 2
populations dont on a tirées E1 et E2.
H1: On considère que 1<. La moyenne m1 au niveau de l’échantillon E1 est inférieure significativement de la moyenne m2 de E2.
Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)
Pr. A. SOULAYMANI Cours Statistique 2005 48
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
V.1- Cas des petits échantillons
N1 ou N2 < 30
Pr. A. SOULAYMANI Cours Statistique 2005 49
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
On suppose que les variables au niveau des 2 échantillons suivent une loi normale et que les 2 variances sont égales 1 = 2.
Dans ces conditions; on estime la variance commune aux 2 échantillons:
2)1()1(
21
2
22
2
112
NNSNSN
S
2
2)2(
2
2
2
2
1)1(
1
2
1)(
11
)(1
1mx
NSetmx
NS
ii
Pr. A. SOULAYMANI Cours Statistique 2005 50
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
On calcul l’écart observé en utilisant le test t de student:
2
2
2
1
2
1
21
NS
NSmm
tObservé
La quantité tobs. Suit une loi de student à (N1 +N2-2)ddl sous l’hypothèse nulle.
La quantité tobs. Est donc comparée à la table à(N1+N2-2)ddl et à 5%(test bilatéral) ou à 10% (test unilatéral).
Pr. A. SOULAYMANI Cours Statistique 2005 51
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Pr. A. SOULAYMANI Cours Statistique 2005 52
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Pr. A. SOULAYMANI Cours Statistique 2005 53
TESTS RELATIFS AUX CARACTERES QUANTITATIFS