anova(a07)
TRANSCRIPT
-
8/3/2019 ANOVA(A07)
1/37
Analyse de la variance :
ANOVA un facteur
Sir Ronald Fischer 1890-1962
-
8/3/2019 ANOVA(A07)
2/37
Thmes
Le modle linaire gnral
Les postulats de base
La logique de lanalyse de la variance
Exemples
Les tests post-hocs
La taille deffet
-
8/3/2019 ANOVA(A07)
3/37
Le modle gnral linaire
Xij = + Ej + eij Xij - la valeur observe pour le
sujet i du groupe j
- la grande moyenne
Ej - linfluence du traitementsur le groupe j (Ej = j - )
eij - lerreur ou les rsidus -selon les postulats - sontdistribus de manire normaleavec une moyenne de = 0 etun cart-type de W.
Exemple: la taille moyenne
des hommes est 68 et lataille moyenne des femmesest 65
La taille dun homme sera
donc:66.5 + 1.5 + eet la taille dune femme:66.5 - 1.5 + e
-
8/3/2019 ANOVA(A07)
4/37
Rpartition des variances
xij = + Ej + eij avec
:
Ej :
eij :
Donc:
X
Xj X
xij Xj
xij !X Xj X xij Xj
-
8/3/2019 ANOVA(A07)
5/37
Les sommes des carrs
xij X 2
! Xj X 2
xij Xj 2
x ij X 2
! Xj X 2
x ij Xj 2
x ij X 2
! nj Xj X
2
xij Xj
2
SCtotal ! SCeffect SCerreur
-
8/3/2019 ANOVA(A07)
6/37
Les postulats de base
1. Le modle gnral sapplique aux donnes
2. Les valeurs sont distribues normalement
dans la population3. Les chantillons ont des variances
homognes
4. Les chantillons sont indpendants
-
8/3/2019 ANOVA(A07)
7/37
La logique de lANOVA
chantillon Population Moyenne Variance
a A A WI2b B B WI2
c C C WI2
d D D WI2
-
8/3/2019 ANOVA(A07)
8/37
La logique de lANOVA (suite)
Les variances des diffrents chantillons
sont donc gales et elles sont gales la
variance de la population Wp.
W1 = W2 = ... = Wij = Wp avec
W1 = s1 =
Nous pouvons donc estimer la variance de lapopulation partir de la moyenne des variances
des chantillons ou bien:
xij X 2
N J
xi1 X1
2n1 1
-
8/3/2019 ANOVA(A07)
9/37
Selon le thorme des limites centrales: ladistribution dchantillonnage a une moyenne
de et une variance de W2
/nsi lhypothse nulle est vraie il suit donc que:
pour lestim de Wp 2 il faut multiplier par n
E sx2 ! E
Xj X 2
J 1
! Wx2
!W p
2
n
nj Xj X 2
J
1
-
8/3/2019 ANOVA(A07)
10/37
Exemple
Afin de tester lhypothse que la consommation de cafinefacilite lapprentissage trois groupes dtudiants se
prparent un examen: le groupe 1 boit une tasse, le
groupe 2 boit 2 tasses et le groupe 3 boit 3 tasses de caf.Voici leurs scores lexamen:
Groupe 1 Groupe 2 Groupe 3
50 48 57
42 47 59
53 65 48
45 59 46
55 51 45
m = 49 m = 56 m = 51
-
8/3/2019 ANOVA(A07)
11/37
Exemple suite
30
40
50
60
70
0 1 2 3 4
Groupe
-
8/3/2019 ANOVA(A07)
12/37
Sommes des carrs moyens
x ij Xj 2
N J!
50 49 2 42 49 2 ... 46 51 2 45 51 2
15 3
xij
Xj
2
N J!
1 49 ... 25 3612
!46812
! 39
Intra-groupe:
Inter-groupe:
n Xj X J 1
!5 49 52 2 5 56 52 2 5 51 52 2
3 1!
5 9 16 1
2! 65
-
8/3/2019 ANOVA(A07)
13/37
Calcul de F F! SCMint erSCM
int ra
!65
39! 1.667
Valeur critique pour 2,12 df et E = .05 -> 3.89
-
8/3/2019 ANOVA(A07)
14/37
Exemple 2
Groupe 1 Groupe 2 Groupe 3
47 55 54
53 54 50
49 58 51
50 61 51
46 52 49
m = 49 m = 56 m = 51
-
8/3/2019 ANOVA(A07)
15/37
Suite
30
35
40
45
50
55
60
65
0 1 2 3 4
Groupe
-
8/3/2019 ANOVA(A07)
16/37
Sommes des carrs moyens
Intra-groupe:
Inter-groupe:
n Xj X J 1
!5 49 52 2 5 56 52 2 5 51 52 2
3 1!
5 9 16 1
2! 65
x ij Xj 2
N J!
47 49 2 53 49 2 ... 51 51 2 49 51 2
15 3
x ij Xj 2
N J!
4 16 ... 0 412
!9412
! 7.83
-
8/3/2019 ANOVA(A07)
17/37
Calcul de F F!SCMint er
SCMint ra
!
65
7.83! 8.3
Valeur critique pour 2,12 df et E = .05 -> 3.89
-
8/3/2019 ANOVA(A07)
18/37
Tableau ANOVA
Source SC df SCM F p
Intergroup 130 2 65 8.3 .005Intragroup 94 12 7.84
Total 224 14
-
8/3/2019 ANOVA(A07)
19/37
Rsum
La variance intra-groupe (la somme moyenne des carts carrs entrechaque observation et la moyenne du groupe) est un estim de lavariance de la population.
Quand lhypothse nulle est vraie - et seulement dans ce cas - la
variance inter-groupe (la somme moyenne des carts carrs entrechaque moyenne de groupe et la grande moyenne) est, selon lethorme des limites centrales, aussi un estim de la variance de lapopulation
Quand il y a un effet de traitement, donc quand lhypothse nulle estfausse, la variance inter-groupe est plus large que la variance intra-
groupe Lanalyse de la variance consiste calculer le rapport entre la variance
inter-groupe et la variance intra-groupe et de comparer le rsultat avecune distribution dchantillonnage connue: la distribution F.
-
8/3/2019 ANOVA(A07)
20/37
Les tests post-hocs
-
8/3/2019 ANOVA(A07)
21/37
Erreurs Erreur (ou E) par comparaison - le niveau E choisi
pour une seule comparaison de moyennes Erreur par famille - le nombre moyen des erreurs
faites par famille de comparaisons
E e 1- (1-E)c e CE
Exemple: E = .01 et C = 5
E = .049 ou approx. .05
-
8/3/2019 ANOVA(A07)
22/37
Contraste
Dfinition: Une comparaison de J moyennes
telle que la diffrence entre deux des Jmoyennes ou la diffrence entre une moyenneet la moyenne de deux autres moyennes
=!c1Q1c2Q2cjQj!7cjQj
-
8/3/2019 ANOVA(A07)
23/37
Excursion - Orthogonalit Une comparaison est orthogonale si:
7 (c1jc2j)/nj= 0
Exemple:
jth moyenne
1 2 3 4
C 1: 1 -1 0 0
C2: 1 0 -1 0
C3: 0 0 1 -1 1 vs 2: 7 c1jc2j =(1)(1) + (-1)(0) + (0)(-1) + (0)(0) = 1
1 vs 3: 7 c1jc2j =(1)(0) + (-1)(0) + (0)(1) + (0)(-1) = 0
-
8/3/2019 ANOVA(A07)
24/37
T
ukeys-HSD(John Tukey, 1915-2000)
HSD ! q k,df,E SCMintra
n
HSD ! 3.77 7.835
! 4.72
1
49
3
51
2
56
1: 49 - 2 73: 51 - 5
2: 56 -
-
8/3/2019 ANOVA(A07)
25/37
-
8/3/2019 ANOVA(A07)
26/37
La taille deffet
-
8/3/2019 ANOVA(A07)
27/37
Taille de leffet
La corrlation entre la VI et la VD (r)
Le pourcentage de la variance de la VD
expliqu par la VI (r2) La diffrence entre deux moyennes en
units dcart-type (d)
-
8/3/2019 ANOVA(A07)
28/37
T
aille deffet: eta
2
et omega
2
Treatment Ou tcome
Alive D ead
Treatm
ent
66 34 100
Control 34 66 100
100 100
L2
!Fy dfeffet
Fy dfeffet dferreur!SCeffet
SCtotal
f!L2
1 L2
[2
!SStreat k 1 MSerreur
SStotal MSerreur
-
8/3/2019 ANOVA(A07)
29/37
Les tailles
-
8/3/2019 ANOVA(A07)
30/37
Puissance
La probabilit de trouver un effet de taille xdans un chantillon de taille N en utilisantun test statistique avec un E donn.
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0 2 4 6 8 10 12 14 16 18
Value of F
Fcrit
= 2.58
-
8/3/2019 ANOVA(A07)
31/37
Les erreurs
-
8/3/2019 ANOVA(A07)
32/37
Taille deffet et beta
-
8/3/2019 ANOVA(A07)
33/37
Variance et beta
-
8/3/2019 ANOVA(A07)
34/37
Calcul depuissance
-
8/3/2019 ANOVA(A07)
35/37
Calcul de puissance
-
8/3/2019 ANOVA(A07)
36/37
-
8/3/2019 ANOVA(A07)
37/37
http://members.aol.com/johnp71/
javastat.html#Power