probabilités & statistiques théorie des tests seconde partie - cours n°3 théorie des tests...

25
Probabilités & Statistiques Théorie des tests Seconde partie - cours Seconde partie - cours n°3 n°3 Théorie des tests Théorie des tests Laurent CARRARO

Upload: ansel-poirier

Post on 04-Apr-2015

110 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

Probabilités & Statistiques Théorie des tests

Seconde partie - cours n°3Seconde partie - cours n°3

Théorie des testsThéorie des tests

Laurent CARRARO

Page 2: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

2

Probabilités & Statistiques Théorie des tests

Test ?

Problème de décision … en contexte incertainExemples :

Le médicament MEDOC est-il efficace ? La machine PROD est-elle bien réglée ? Les OGM sont-ils dangereux ? L’augmentation de 2% de nos ventes ce dernier

mois est-elle significative ?

Page 3: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

3

Probabilités & Statistiques Théorie des tests

Points communs aux exemples

La décision ne peut être certaine ; elle sera prise sur la base d’observations ; tous les facteurs influents ne sont pas connus, et

encore moins mesurés.

Utilisation du formalisme probabiliste

Page 4: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

4

Probabilités & Statistiques Théorie des tests

Vous avez dit hypothèse ?

On oppose deux hypothèses : MEDOC : efficace vs non efficace PROD : bien réglée vs déréglée OGM : dangereux vs inoffensifs

Notations : H0 : hypothèse nulle

H1 : hypothèse alternative

Page 5: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

5

Probabilités & Statistiques Théorie des tests

Qui est H0 ?

Les deux hypothèses n’ont pas le même rôle MEDOC :

• le fabricant pense que le médicament est efficace

H0 : efficace

• les autorités de santé veulent des preuves

H0 : inefficace

OGM ? PROD ?

Page 6: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

6

Probabilités & Statistiques Théorie des tests

Démarche

1. On fixe H0 et H1.

2. On évalue une quantité, appelée score ou statistique de test.

3. Si cette quantité dépasse un certain seuil, on rejette H0.

4. On probabilise notre décision…

Page 7: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

7

Probabilités & Statistiques Théorie des tests

Un exemple simpl(ist)e

Exemple de type PROD Usine de fabrication de tubes pour cosmétiques Procédé par extrusion de polymère, puis

coupure

Paramètre sensible : épaisseur du tube en m

Page 8: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

8

Probabilités & Statistiques Théorie des tests

Problème et hypothèses

En fonctionnement normal, l’épaisseur mesurée d’un tube suit une loi normale N(mold,sold

2), où :

• mold = 208 m

• sold = 10,8 m

Un changement de fournisseur fait suspecter une diminution de la moyenne : mnew = 202 m.

On observe 20 épaisseurs de tubes, réalisations indépendantes d’une v.a. de loi normale N(m,sold

2).

A-t-on m = mold ou m = mnew ?

Page 9: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

9

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

Page 10: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

10

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

Page 11: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

11

Probabilités & Statistiques Théorie des tests

Démarche

H0 : m = mnew

Score = épaisseur moyenne Décision : si > seuil, on rejette H0

On probabilise :Sous H0, est de loi normale N(mnew,sold

2/20)

P( > seuil / H0) = 1 -

e

e

e

seuil−mnewsold

20

⎜ ⎜ ⎜ ⎜

⎟ ⎟ ⎟ ⎟

e

Page 12: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

12

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

Page 13: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

13

Probabilités & Statistiques Théorie des tests

Le risque

On fixe un niveau de risque : = 5% On évalue seuil pour que :

P( > seuil / H0) = Ici, seuil = mnew + 1.64 sold/√20 = 205,97

La région { > seuil} est la région critique. Signification ?

Toujours la loi des grands nombres (simulation)

e

e

Page 14: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

14

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

seuil = 205,97

Page 15: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

15

Probabilités & Statistiques Théorie des tests

Décisions selon les cas

Supposons :1. = 206,4

2. = 207,9

3. = 205,2

Décisions :1. rejet de H0

2. rejet de H0

3. on conserve H0

e

e

e

Page 16: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

16

Probabilités & Statistiques Théorie des tests

Le risque

Si on décide de rejeter H0, on a peu de chances de faire erreur (cf. risque ).

Et si on conserve H0, a-t-on raison ??

Risque de seconde espèce : = P( ≤ seuil / H1)

Ici, = P(N(202,10.82/20) ≤ 205,97) = 20%

est appelé risque de première espèce.

e

Page 17: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

17

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

seuil = 205,97

Page 18: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

18

Probabilités & Statistiques Théorie des tests

Finalement, quelle probabilité d’erreur ?

H0 H1

H0

H1

Réalité

Décision

Page 19: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

19

Probabilités & Statistiques Théorie des tests

Déroulement d’un test

1. On fixe H0.

2. On définit une région critique (rejet de H0) à partir d’un score S :

rejet de H0 si S ≥ seuil

3. On fixe qui détermine seuil tel que :P(S ≥ seuil / H0) =

Ø On décide, et si on conserve H0, on regarde

Page 20: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

20

Probabilités & Statistiques Théorie des tests

Retour sur le choix de H0

Seul est maîtrisé. Exemple PROD :

Situation 1 : grosses séries de moyenne qualité :• Risque majeur : arrêter la production à tort.

= P(arrêt / bien réglé) : H0 = « bien réglé »

Situation 2 : CDC client très strict :• Risque majeur : produire de mauvais composants.

= P(production / mal réglé) : H0 = « mal réglé »

Page 21: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

21

Probabilités & Statistiques Théorie des tests

Dernières remarques

et varient en sens contraire. Diminution simultanée de et possible

en augmentant la taille de l’échantillon. Critiques :

Il se peut qu’aucune des deux hypothèses ne soit correcte (risques de 3ème espèce !!)

Si on rejette H0 avec = 5%, que donnent 4% ? 1% ? …

Page 22: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

22

Probabilités & Statistiques Théorie des tests

Notion de p-valeur

Test de région critique de la forme :rejet de H0 si S ≥ seuil

On observe sobs

On évalue la probabilité :p = P(S ≥ sobs / H0)

p est appelée p-valeur (p-value)

Page 23: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

23

Probabilités & Statistiques Théorie des tests

Retour sur l’exemple

1. Cas où = 206,4 :p-valeur = P(N(202,10.82/20)>206,4) = 0.034

2. Cas où = 207,9 :p-valeur = P(N(202,10.82/20)>207,9) = 0.0073

3. Cas où = 205,2 :p-valeur = P(N(202,10.82/20)>205,2) = 0.093

e

e€

e

Page 24: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

24

Probabilités & Statistiques Théorie des tests

QuickTime™ et undécompresseur TIFF (non compressé)

sont requis pour visionner cette image.

= 205,2

e

p-value = 0.093

Page 25: Probabilités & Statistiques Théorie des tests Seconde partie - cours n°3 Théorie des tests Laurent C ARRARO

25

Probabilités & Statistiques Théorie des tests

Perspectives

Lemme de Neyman et Pearson (construction systématique de la région critique).

Tests avec des hypothèses dites composites, par exemple :

H : m > 208 Tests non paramétriques, par exemple :

H : les données proviennent de la loi normale

etc…