test de conformité d’une moyenne d’échantillon à une moyenne … · 2019. 3. 24. · tirage...

Tirage au sort ҧ𝑥 =1

n

𝑖=1

𝑛

𝑥𝑖 : estimation de mҧ𝑥

Test de conformité d’une moyenne d’échantillon à une moyenne de population

m

X : V.A. d’étude

Population caractérisée

par la moyenne exacte m(référence)

Préambule

Tirage au sort


m

X : V.A. d’étude



Préambule

ഥX𝑛 =1

𝑛

𝑖=1

𝑛

𝑋𝑖 : estimateur de m

Sur l’ensemble des échantillons possibles

Tirage au sort

ഥX𝑛m

𝐸 ഥX𝑛 = μ


m




Préambule

X : variable aléatoire suivant une loi N (μ,s)

estimateur de m

𝑉𝐴𝑅 ഥX𝑛 = s2/𝑛

ഥX𝑛 =1

𝑛

𝑖=1

𝑛

𝑋𝑖ҧ𝑥fluctuations d’échantillonnage de

Lorsque s est connu, ഥX𝑛 suit une loi normale N(𝜇, s2/𝑛)

Cas idéal : s connu

Statistique de Test

T𝑛0

𝐸 T𝑛 = 0


m




Préambule

T𝑛=ഥX𝑛 − μ

s/ nStatistique de test

Lorsque s est connu, T𝑛 suit une loi normale centrée réduite N(0,1)

X : variable aléatoire suivant une loi N (μ,s)

𝑉𝐴𝑅 T𝑛 = 1

Cas idéal : s connubase (solide) à laquelle

nous nous réfèrerons

N(0,1)

m ҧ𝑥

Échantillon (n)




X : V.A. d’étude

Préambule > Principe du test

Evènement

m ҧ𝑥

Échantillon (n)




ҧ𝑥 conforme à la valeur attendue m?

X : V.A. d’étude


Evènement

m ҧ𝑥

Échantillon (n)


Ho : m = m

Statistique de test

Test de conformité



𝑡0=ҧ𝑥 − 𝜇

s/ 𝑛

ഥX𝑛 : estimateur de m

ҧ𝑥différences entre et m significatives?

ҧ𝑥 conforme à la valeur attendue m?

T𝑛=ഥX𝑛 − μ

s/ 𝑛X : V.A. d’étude

Non rejet de Ho

pval

Rejet Ho Rejet Ho

− z𝛼/2 z𝛼/2

Risque seuil a

a/2

test bilatéral

a/2

Loi N(0,1)


H1 : m m

valeur « observée » de T𝑛obtenue à partir des données de l’échantillon :

Cas idéal : s connu

(risque standard : a=5%)Conclusion

𝑡0 > z𝛼/2?

𝑡0 > z𝛼/2?

pval < 𝜶 ?

𝑷(𝒁 < −𝒕𝟎) + 𝑷(𝒁 > 𝒕𝟎) < 𝜶 ?

p-value (valeur-p) : probabilité d’observer sous Ho

un résultat égal ou plus extrême que celui réellement observé

pval = PHo (X ≥ xobs) test unilatéral (DR à droite)

pval = PHo (X ≤ xobs) test unilatéral (DR à gauche)

pval = PHo(X ≥ xobs) + PHo(X ≤ xobs_2) test bilatéral

pval = PHo(X ≤ xobs) + PHo(X ≥ xobs_2) test bilatéral

Utilisée en statistique inférentielle pour conclure sur le résultat d’un test d’hypothèse

Pearson : en la comparant à a, risque seuil (définissant la puissance du test = 1-b)

Ronald Fisher : l’hypothèse nulle ne peut jamais être acceptée; elle peut être seulement rejetée par le test

d’hypothèse, la p-value mesure à quel point les données plaident contre l’hypothèse nulle Ho

pval ≤ 0,1% présomption extrèmement forte contre l’hypothèse nulle ***

0,1% < pval ≤ 1% très forte présomption contre l’hypothèse nulle **

1% < pval ≤ 5% forte présomption contre l’hypothèse nulle *

5% < pval ≤ 10% faible présomption contre l’hypothèse nulle .

pval > 10% pas de présomption contre l’hypothèse nulle

pval

Exemple

Une protéine qui assurera la réputation de la startup

Marc, PDG de la startup Biotech-Sud a demandé à son équipe de

développer un nouveau protocole de purification qui permette d’atteindre

une concentration supérieure en moyenne à 8,3 mg/ml de leur protéine star.

A l’issue de 2 essais de protocoles, l’équipe est réunie pour débriefer les

résultats compilés dans un fichier de données.

On vente à Marc le protocole 2

Qu’en pensez-vous?

(Pouvez-vous proposez une stratégie rentable à Marc ?)

Objectif 8.3

Prêts à en découdre avec R ?

- Utiliser un logiciel ce n’est pas du « clic souris », cela réclame de l’organisation (pour s’y retrouver)

- Il va falloir organiser UN ESPACE DE TRAVAIL (répertoires); un peu de rigueur et d’organisation

vont être de précieux atouts pour conduire proprement une analyse de données.

- Venir en cours avec une clé USB pour sauvegarder son travail

- Il pourra nous arriver, en pleine analyse, d’ouvrir un diaporama pour présenter une synthèse des

résultats (discussion/conclusion, tableaux de synthèse, graphes, paramètres)

- L’utilisation de R n’est pas une fin en soi (Bio Geek); il existe d’autre logiciels de stat (SPSS,

xlstat, Statistica, Stat, …)

- R est utilisé pour réaliser des stats et non pour programmer

(il existe des langages dédiés à la programmation plus performant que R : C++, java, python,…) !

- Le substrat de R : fichiers, bases de données [Input/ouput]

Prêts à en découdre avec R ?

- Il va falloir organiser UN ESPACE DE TRAVAIL (répertoires)

clic droit sur icône

> propriétés

clic droit sur icône

> propriétés

test de conformité d’une moyenne d’échantillon à une moyenne … · 2019. 3. 24. · tirage...

Documents