2w anova stas-ques cm2 ancova manova cm2 sébas-en couette master 1 ages se gbs vvt anova à 2...

Post on 19-Mar-2018

225 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

TRANSCRIPT

2wANOVAANCOVAMANOVA

Sta-s-quesCM2

Sébas-enCOUETTE

Master1AGES SE GBS VVT

ANOVAà2facteurs

Comparaison de 2 groupes (apparié ou non)

ANOVA Corrélation Régression

Paramétrique Test de Student (apparié ou non)

ANOVA paramétrique

Corrélation de Pearson

Régression

Non paramétrique

Test de Wilcoxon (apparié ou non)

ANOVA de Kruskall-Wallis

Corrélation de Spearman ou de Kendall

________

X

Y

+ TEST DE CHI-DEUX ou TEST DE FISHER pour Tables de contingences

ANOVAà2facteurs

Rappel:l’ANOVAà1facteur

Rappel:l’ANOVAà1facteur

ANOVAà2facteurs

Comparaison de 2 groupes (apparié ou non)

ANOVA Corrélation Régression

Paramétrique Test de Student (apparié ou non)

ANOVA paramétrique

Corrélation de Pearson

Régression

Non paramétrique

Test de Wilcoxon (apparié ou non)

ANOVA de Kruskall-Wallis

Corrélation de Spearman ou de Kendall

________

X Y

ANOVAà2facteurs

1varquan-/1varquali

1varquan-

2ou

plusvarq

uali ANOVAà2facteurs

ANOVAà2facteurs

ANOVAà2facteurs

ANOVAà2facteurs

Exemple:

Unvi-culteurchercheàaméliorersaproduc-on.Ilapplique4traitementsdifférentsà5desescépagesetregarde,sur2années,sonrendementmoyen.

-Premierfacteurà4modalités:traitement(αi)

-Deuxièmefacteurà5modalités:cépage(βj)

-Variablequan-ta-ve:rendementmoyen(Yijk)

ANOVAà2facteurs

Exemple:

cépageTraitement

ANOVAà2facteurs

ANOVAà2facteurs

Graphiquedesinterac-onstraitementsetcépages

Lerendementmoyenparcépagediffèrepartraitementetviceversa

ANOVAà2facteurs

TestdeShapirosurlesrésidus

Bartle`surlesrésidusparfacteur

4)N>30

ANOVAà2facteurs

ANOVAà2facteurs

ANOVAà2facteurs

ANOVAà2facteurs

Rendement

TraitementCépage

ANOVAà2facteurs

Icilesp-value<0,05donconaccepteH1.→Ainsilesfacteurscépageettraitementainsiqueleurinterac;onontuneffetsignifica-fsurlerendement.→L'effetdutraitementsurlerendementdiffèrelecépage,etviceversa.

ANCOVA

Modèles linéaires simples

Procédure Variable dépendante

Variable(s) independante(s)

Régression simple 1 continue 1 continue ANOVA à un facteur 1 continue 1 discrète ANOVA à facteurs multiples

1 continue 2 ou plus discrètes

ANCOVA 1 continue Au moins 1 discrète et au moins une 1 continue

Régression multiple 1 continue 2 ou plus continues

ANCOVA

Comparaison de 2 groupes (apparié ou non)

ANOVA Corrélation Régression

Paramétrique Test de Student (apparié ou non)

ANOVA paramétrique

Corrélation de Pearson

Régression

Non paramétrique

Test de Wilcoxon (apparié ou non)

ANOVA de Kruskall-Wallis

Corrélation de Spearman ou de Kendall

________

X Y

2varquan-

1varq

uali

ANCOVA

ANCOVA

Utilisation de l’ANCOVA

•  Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2)

•  ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)

Taille

Mas

se

Taille

ANCOVA

•  Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète...

•  …autrement ce serait comme comparer des pommes et des oranges!

X1

Y Modèles qualitativement différents

Y Modèles qualitativement similaires

Utilisation de l’ANCOVA

ANCOVA

Le modèle de la régression simple

•  Le modèle de la régression:

•  toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b)

Y a bX ei i i= + +

X ΔX

ΔY

b = ΔY/ΔX (pente)

a(ordonnée

à l’origine)

ei

Xi

Yi

Observées Prédites

ANCOVA

X1

Y a diffèrent même b

X1

Y a & b diffèrent

X1

Y même a, même b

X1

Y même a,différents b

ANCOVA

•  Le modèle complet

•  βi est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2

•  αi est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.

Le modèle complet

Y X Xij i i ij i ij= + + − +µ α β ε( )

Niveau 1 de la variable X2 Niveau 2 de la variable X2

µ

Y1

Y2

X1 X 2

α1

ε1 j

X j1

X Xj1 1−

α 2

β1 β 2

ANCOVA

Le modèle complet

•  Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:

0:constante,:

, les pour tous 0:

03

02

01

==

=

=

ββ

β

α

i

i

i

HH

iH

Niveau 1 de la variable X2 Niveau 2 de la variable X2

µ

Y1

Y2

X1 X 2

α1

ε1 j

X j1

X Xj1 1−

α 2

β1 β 2hypothèses nulles

ANCOVA

HH constanteH

i

i

i

01

02

03

0

0

: ,::

α

β

β β

=

=

= =

,

HH constanteH

i

i

i

01

02

03

0

0

: ,::

α

β

β β

=

=

= =

,

HH constanteH

i

i

i

01

02

03

0

0

: ,::

α

β

β β

=

=

= =

, Y

Y

Y

Le modèle complet

ANCOVA

Conditions d’application

•  Les résidus sont indépendants et distribués normalement

•  La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité)

•  pas d’erreur sur les variables indépendantes

Le modèle complet

ANCOVA

•  Ajuster le modèle complet, tester la différence entre les pentes

•  Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique

•  Si H02 est acceptée, ajuster le modèle d’ ANCOVA.

Niveau 1 de la variable X2 Niveau 2 de la variable X2

X1

Y

ANCOVA Régressions

séparées

H02 acceptée H02 rejetéee

H i02:β = constante

Le modèle complet

ANCOVA

Exemple

•  Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7LAGE

1.5

1.6

1.7

1.8

LFKL

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8LAGE

1.5

1.6

1.7

1.8

1.9

LFKL

Femelles

Mâles

age, sexe et longueur de l’esturgeon

Le modèle complet

ANCOVA

SEX$*LAGE 0.000 1 0.000 0.337 0.563

Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05

Q2: l’ordonnée à l’origine est-elle la même?

Exemple Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697

Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

LAGE 0.143 1 0.143 176.650 0.000SEX$ 0.000 1 0.000 0.504 0.479

Error 0.071 88 0.001

Le modèle complet

ANCOVA

•  Le modèle:

•  β est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2.

•  αi est la différence entre la moyenne pour chaque niveau i et la moyenne générale

Y X Xij i ij i ij= + + − +µ α β ε( )µ

Y1

Y2

X1 X 2

α1

ε1 j

X j1

X Xj1 1−

α 2

β

Ù β int ra =

( (xij − x i)(yij − y i)j∑

i∑

( (xij − x i)2

j∑

i∑

Le modèle additif

ANCOVA

¡  PouruneANCOVAavec2variablesindépendantes,deuxhypothèsesnulles:

H pour tous les iH

i

i

01

02

00

: ,: α

β β

=

= =

Niveau 1 de la variable X2 Niveau 2 de la variable X2

µ

Y1

Y2

X1 X 2

α1

ε1 j

X j1

X Xj1 1−

α 2

β

Le modèle additif

hypothèses nulles

ANCOVA

H pour tous les iH

i

i

01

02

00

: ,: α

β β

=

= =

H pour tous les iH

i

i

01

02

00

: ,: α

β β

=

= =

Y

Y

Y

H pour tous les iH

i

i

01

02

00

: ,: α

β β

=

= =

Le modèle additif

ANCOVA

Conditions d’application du modèle additif

•  les résidus sont indépendants et distribués normalement

•  la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité)

•  les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)

Le modèle additif

ANCOVA

Procédure

Niveau 1 de la variable X2 Niveau 2 de la variable X2

X1

Y

Régression commune

Régressions séparées

H01 acceptée H01 rejetée

¡  Ajusterlemodèled’ANCOVA,tester:

¡  SiH01estrejetée,séparerlesrégressionspourchaqueniveaudelavariablediscon-nue

¡  SiH01estacceptée,ajusterunerégressioncommune.

0 :01 =iH α

Le modèle additif

ANCOVA

Exemple

Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05),

le meilleur modèle est la régression commune. la réduction du R2 est négligeable (.697 to .696).

Le modèle additif

LAGE 0.143 1 0.143 178.163 0.000

Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696 Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

SEX$ 0.001 1 0.001 1.851 0.177

Error 0.072 89 0.001

ANCOVA

Le modèle à droites confondues

¡  Lemodèle:

¡  βestlapentedelarégressiondeYsurX1,regroupéepourtouslesniveauxdelavariablediscrèteX2.

¡  estlamoyennegroupéedeX1.X

Niveau 1 de la variable X2 Niveau 2 de la variable X2

α

X

ε1 j

X j1

X Xj1 −

βµ Y X Xij i ij i ij= + + − +µ α β ε( )

ANCOVA

¡  Onadeuxhypothèsesnullespourlarégressioncommune:

HH01

02

0: ,: .α

β

=

= 0

Le modèle à droites confondues

hypothèses nulles

Niveau 1 de la variable X2 Niveau 2 de la variable X2

α

X

ε1 j

X j1

X Xj1 −

βµ

ANCOVA

1.211 0.031 0.0 . 39.191 0.000LAGE 0.336 0.024 0.830 1.000 14.144 0.000

Exemple

Le modèle à droites confondues

Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690

Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT

ANCOVA

Conditions d’application du modèle à droites confondues

•  Les résidus sont indépendants et distribués normalement

•  la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)

Le modèle à droites confondues

ANCOVA

Conclusion

•  Aller du modèle complexe au modèle simple

•  Donc choisir a priori les variables explicatives

ANCOVA

MANOVA

Comparaison de 2 groupes (apparié ou non)

ANOVA Corrélation Régression

Paramétrique Test de Student (apparié ou non)

ANOVA paramétrique

Corrélation de Pearson

Régression

Non paramétrique

Test de Wilcoxon (apparié ou non)

ANOVA de Kruskall-Wallis

Corrélation de Spearman ou de Kendall

________

X Y

Plusieursvariablesindépendantes

Plusieursv

ariablesdép

endantes

MANOVA

MANOVA

Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes

MANOVA

Variableindépendante

Varia

bledé

pend

ante

2groupes

Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes

MANOVA

Variableindépendante

Varia

bledé

pend

ante

2groupes

Avantage de la MANOVA, contrôler l’erreur de type I Un des protocole possible, tester l’effet « groupe » sur l’ensemble des VD. Si l’effet est significatif, examiner les variables ANOVA par ANOVA

MANOVA

Exemple: Variables mesurées sur des poissons provenant de sites différents. Les variables sont elles conjointement affectées par le fait d’appartenir a l’un ou l’autre site.

MANOVA

Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes

MANOVA

Variableindépendante

Varia

blesdép

endantes

Pasdedifférencesignifica-ve

Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes

MANOVA

Variableindépendante

Varia

blesdép

endantes

Effetsignifica-f

Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes

MANOVA

Variableindépendante

Varia

blesdép

endantes

Effetsignifica-fVecteurdesmoyennes

MANOVA

Pré-requis de la MANOVA: Très similaires à ceux de l’ANOVA -  Normalité multivariée -  Homogénéité des matrices de covariances (test M de Box) -  Indépendance des observations -  Linéarité Relation linéaire entre les variables dépendantes

MANOVA

Limitation des MANOVA: -  Outliers Comme pour l’ANOVA les observations extrêmes affectent beaucoup le modèle -  Multicolinéarité et singularité Une grande corrélation entre les variables dépendantes impliquent de la redondance

MANOVA

Décomposition de la variance On cherche une difference multivariée entre les groupes. Cela signifie que les vecteurs des moyennes de variables sont differents selon les groupes. La décomposition de la variance s’ecrit: T = W + B

Sommedescarrésetcarréscroisésintragroupe

Sommedescarrésetcarréscroisésintergroupe

Sommedescarrésetcarréscroiséstotaux

MANOVA

Décomposition de la variance De cette décomposition de la variance on en tire la statistique λ λ = W = W

T

λ suis une distribution connue aux degrés de liberté choisis. On a donc une valeur de λ seuil et un λ observé. On tombe dans la logique d’un test.

W + B

(m1<-manova(cbind(y1,y2)~group,manova.data))Call:manova(cbind(y1,y2)~group,manova.data)Terms:groupResidualsresp161.8666714.80000resp219.059.20Df29Residualstandarderror:1.2823591.01105Es-matedeffectsmaybeunbalanced>summary(m1,test="Wilks")DfWilksapproxFnumDfdenDfPr(>F)group20.08979.35754160.0004271Residuals9

MANOVA

1varquan-2ou

plusvarq

uali

ANOVAà2facteurs

Plusieursvariablesindépendantes

Plusieursv

ariablesdép

endantes

MANOVA

2varquan-

1varq

uali ANCOVA

top related