test de conformité d’une moyenne d’échantillon à une moyenne … · 2019. 3. 24. · tirage...
TRANSCRIPT
Tirage au sort ҧ𝑥 =1
n
𝑖=1
𝑛
𝑥𝑖 : estimation de mҧ𝑥
Test de conformité d’une moyenne d’échantillon à une moyenne de population
m
X : V.A. d’étude
Population caractérisée
par la moyenne exacte m(référence)
Préambule
Tirage au sort
Test de conformité d’une moyenne d’échantillon à une moyenne de population
m
X : V.A. d’étude
Population caractérisée
par la moyenne exacte m(référence)
Préambule
ഥX𝑛 =1
𝑛
𝑖=1
𝑛
𝑋𝑖 : estimateur de m
Sur l’ensemble des échantillons possibles
Tirage au sort
ഥX𝑛m
𝐸 ഥX𝑛 = μ
Test de conformité d’une moyenne d’échantillon à une moyenne de population
m
Population caractérisée
par la moyenne exacte m(référence)
Sur l’ensemble des échantillons possibles
Préambule
X : variable aléatoire suivant une loi N (μ,s)
estimateur de m
𝑉𝐴𝑅 ഥX𝑛 = s2/𝑛
ഥX𝑛 =1
𝑛
𝑖=1
𝑛
𝑋𝑖ҧ𝑥fluctuations d’échantillonnage de
Lorsque s est connu, ഥX𝑛 suit une loi normale N(𝜇, s2/𝑛)
Cas idéal : s connu
Statistique de Test
T𝑛0
𝐸 T𝑛 = 0
Test de conformité d’une moyenne d’échantillon à une moyenne de population
m
Population caractérisée
par la moyenne exacte m(référence)
Sur l’ensemble des échantillons possibles
Préambule
T𝑛=ഥX𝑛 − μ
s/ nStatistique de test
Lorsque s est connu, T𝑛 suit une loi normale centrée réduite N(0,1)
X : variable aléatoire suivant une loi N (μ,s)
𝑉𝐴𝑅 T𝑛 = 1
Cas idéal : s connubase (solide) à laquelle
nous nous réfèrerons
N(0,1)
m ҧ𝑥
Échantillon (n)
Test de conformité d’une moyenne d’échantillon à une moyenne de population
Population caractérisée
par la moyenne exacte m(référence)
X : V.A. d’étude
Préambule > Principe du test
Evènement
m ҧ𝑥
Échantillon (n)
Test de conformité d’une moyenne d’échantillon à une moyenne de population
Population caractérisée
par la moyenne exacte m(référence)
ҧ𝑥 conforme à la valeur attendue m?
X : V.A. d’étude
Préambule > Principe du test
Evènement
m ҧ𝑥
Échantillon (n)
Test de conformité d’une moyenne d’échantillon à une moyenne de population
Ho : m = m
Statistique de test
Test de conformité
Population caractérisée
par la moyenne exacte m(référence)
𝑡0=ҧ𝑥 − 𝜇
s/ 𝑛
ഥX𝑛 : estimateur de m
ҧ𝑥différences entre et m significatives?
ҧ𝑥 conforme à la valeur attendue m?
T𝑛=ഥX𝑛 − μ
s/ 𝑛X : V.A. d’étude
Non rejet de Ho
pval
Rejet Ho Rejet Ho
− z𝛼/2 z𝛼/2
Risque seuil a
a/2
test bilatéral
a/2
Loi N(0,1)
Préambule > Principe du test
H1 : m m
valeur « observée » de T𝑛obtenue à partir des données de l’échantillon :
Cas idéal : s connu
(risque standard : a=5%)Conclusion
𝑡0 > z𝛼/2?
𝑡0 > z𝛼/2?
pval < 𝜶 ?
𝑷(𝒁 < −𝒕𝟎) + 𝑷(𝒁 > 𝒕𝟎) < 𝜶 ?
p-value (valeur-p) : probabilité d’observer sous Ho
un résultat égal ou plus extrême que celui réellement observé
pval = PHo (X ≥ xobs) test unilatéral (DR à droite)
pval = PHo (X ≤ xobs) test unilatéral (DR à gauche)
pval = PHo(X ≥ xobs) + PHo(X ≤ xobs_2) test bilatéral
pval = PHo(X ≤ xobs) + PHo(X ≥ xobs_2) test bilatéral
Utilisée en statistique inférentielle pour conclure sur le résultat d’un test d’hypothèse
Pearson : en la comparant à a, risque seuil (définissant la puissance du test = 1-b)
Ronald Fisher : l’hypothèse nulle ne peut jamais être acceptée; elle peut être seulement rejetée par le test
d’hypothèse, la p-value mesure à quel point les données plaident contre l’hypothèse nulle Ho
pval ≤ 0,1% présomption extrèmement forte contre l’hypothèse nulle ***
0,1% < pval ≤ 1% très forte présomption contre l’hypothèse nulle **
1% < pval ≤ 5% forte présomption contre l’hypothèse nulle *
5% < pval ≤ 10% faible présomption contre l’hypothèse nulle .
pval > 10% pas de présomption contre l’hypothèse nulle
pval
Exemple
Une protéine qui assurera la réputation de la startup
Marc, PDG de la startup Biotech-Sud a demandé à son équipe de
développer un nouveau protocole de purification qui permette d’atteindre
une concentration supérieure en moyenne à 8,3 mg/ml de leur protéine star.
A l’issue de 2 essais de protocoles, l’équipe est réunie pour débriefer les
résultats compilés dans un fichier de données.
On vente à Marc le protocole 2
Qu’en pensez-vous?
(Pouvez-vous proposez une stratégie rentable à Marc ?)
Objectif 8.3
Prêts à en découdre avec R ?
- Utiliser un logiciel ce n’est pas du « clic souris », cela réclame de l’organisation (pour s’y retrouver)
- Il va falloir organiser UN ESPACE DE TRAVAIL (répertoires); un peu de rigueur et d’organisation
vont être de précieux atouts pour conduire proprement une analyse de données.
- Venir en cours avec une clé USB pour sauvegarder son travail
- Il pourra nous arriver, en pleine analyse, d’ouvrir un diaporama pour présenter une synthèse des
résultats (discussion/conclusion, tableaux de synthèse, graphes, paramètres)
- L’utilisation de R n’est pas une fin en soi (Bio Geek); il existe d’autre logiciels de stat (SPSS,
xlstat, Statistica, Stat, …)
- R est utilisé pour réaliser des stats et non pour programmer
(il existe des langages dédiés à la programmation plus performant que R : C++, java, python,…) !
- Le substrat de R : fichiers, bases de données [Input/ouput]
Prêts à en découdre avec R ?
- Il va falloir organiser UN ESPACE DE TRAVAIL (répertoires)
clic droit sur icône
> propriétés
clic droit sur icône
> propriétés