anova - univ-oeb.dz

24
Université d’Oum El Bouaghi , Algérie Faculté des sciences de la terre et de l’architecture Prof. Adad Mohamed Cherif 2017 ( One-way ANOVA)

Upload: others

Post on 02-Dec-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANOVA - univ-oeb.dz

Université d’Oum El Bouaghi , Algérie

Faculté des sciences de la terre et de l’architecture

Prof. Adad Mohamed Cherif

2017

( One-way ANOVA)

Page 2: ANOVA - univ-oeb.dz

Dans ce tutoriel, il s’agit de montrer

comment peut-on procéder à l’analyse

ANOVA à 1 facteur entre des

échantillons indépendants par le biais

du logiciel SPSS et quels sont les

résultats à mettre sur le rapport final ?

Introduction

Page 3: ANOVA - univ-oeb.dz

ANOVA est l’abréviation de ANalysis Of VAriance.

L’ANOVA est une méthode d’analyse bivariée. C’est-à-dire le croisement de

2 variables de nature différente.

L’analyse de variance, à un facteur (One way ANOVA), appelée ANOVA est

une techniques permettant de savoir si une variable dépendante Y (variable à

expliquer) est en relation avec une seule variable indépendante X

(variable explicative). En d’autres termes, inférer une relation ente X et Y

variable dépendante

Y(Quantitative)

DÉFINITION

Page 4: ANOVA - univ-oeb.dz

L’hypothèse nulleH0: µ1 = µ2 = µ3 =µ...

Les moyennes de la population sont égales.

L’hypothèse alternative H1: µ1 ≠ µ2 ≠ µ3 ≠ µ…

Au moins une moyenne est différente . C’est-à-dire

qu’au moins une moyenne n’est pas égale aux autres .

HYPOTHESES

Page 5: ANOVA - univ-oeb.dz

La variable dépendante est une variable numérique ou

quantitative. La variable indépendante est appelée aussi

facteur. C’est une variable catégorielle ( discrète, qualitative or

nominale). Exemple le sexe, statut professionnel. On utilise

l’ANOVA quand notre test d’analyse comporte plus de 2 groupes

(variable indépendante ) et que la variable dépendante est

quantitative.

En termes plus simples, ANOVA vise à comparer des

moyennes sur plusieurs échantillons afin de déterminer s'il

existe des preuves que les moyennes des échantillons

associées sont significativement différentes. ANOVA est un test

paramétrique ( la moyenne, l’écart-type)

Page 6: ANOVA - univ-oeb.dz

• Les groupes sont indépendants et aléatoirement tirés de leur population

respective (il n’y a ni relation entre les observations à l’intérieur d’un groupe, ni relation entre

les observations entre les groupes).

• Il n'y a pas de relation entre les sujets ou mesures de chaque échantillon. Cela

signifie que les sujets ou les mesures du 1er échantillon ne peuvent pas être aussi

dans le 2ème échantillon ou le 3ème et ainsi de suite.

• Les échantillons doivent suivent une loi normale ( une normalité parfaite n’est exigée)

• Si les échantillons sont modérés ou de grande taille, une violation de la

normalité peut donner des valeurs de signification assez précises.

• Les données de la variable dépendante présentent des

variances identiques (recours au test de Levene surtout si le la taille des groupes n’est

pas identique). Si le test est significatif sig. < 0,05 , on doit faire, donc, appel au test

Brown-Forsythe ou le Welch Robust F..

• Lorsque la normalité, l’homogénéité des variances ne sont pas respectées, on

peut utiliser le test non paramétrique de Kruskal-Wallis.

Conditions d’utilisation

Page 7: ANOVA - univ-oeb.dz

Le rejet de H0 signifie qu’il y a une grande

probabilité qu’au moins il y a une différence entre

les groupes. L’analyse Post Hoc est nécessaire pour

nous indiquer ou se situe la différence entre la ou

les moyens.

Exemple 1

Variable indépendante (qualitative):

Niveau social (à 3 niveaux)

Classe supérieure

Classe moyenne

Classe inférieure

Variable dépendante ( quantitative)

Satisfaction des services hôteliers

QU’EST CE QUE L’ANOVA PEUT NOUS DIRE

Page 8: ANOVA - univ-oeb.dz

Exemple 2

Variable indépendante (qualitative):

le niveau de formation

BEM

BAC

Ingénieur

Variable dépendante ( quantitative)

Le salaire

Page 9: ANOVA - univ-oeb.dz

AN

OVA

Page 10: ANOVA - univ-oeb.dz
Page 11: ANOVA - univ-oeb.dz

Existe-il de différence dans les salaires des métiers de

menuisier, plombier et électricien dans l’exercice de leur

fonction ?

H0L’hypothèse nulle

les moyennes des salaires desdifférents métiers sont égales.

Ici, nous avons 3 niveaux (ou groupes)

Plombier ------ µ1Menuisier ------ µ1Electricien ---- µ3

µ1 = µ2 = µ3

H1L’hypothèse alternative

Au moins une moyenne des salairesdes différents métiers n’est pas égaleaux autres.

µ1 ≠ µ2 ≠ µ3

Ou µ1 ≠ µ2

Ou µ2 ≠ µ3

Ou µ1 ≠ µ3

Question de recherche

Page 12: ANOVA - univ-oeb.dz

Affichage des données

Affichage des variables

Groupe est une variable nominale dont la

colonne « Valeurs» nous indique le codage des

métiers.

Remarque : dans la colonne « Nom » il ne faut

jamais laisser de vide entre les caractères .

Page 13: ANOVA - univ-oeb.dz

Analyse comparer les moyennes ANOVA 1 facteur

Page 14: ANOVA - univ-oeb.dz

Il faut insérer les deux variables dans la

fenêtre à gauche :

Dans « Liste variables dépendantes » , on

place la variable dépendante ‘ Salaire perçu ‘.

Dans « Critère » la variable indépendante

‘Type de métier’.

Appuyer sur « OPTION »

Cocher: Caractéristiques : statistiques descriptive

Test d’homogénéité de variance : vérification des

variances si elles sont identiques ou non.

Brown-Forsythe et Welch où cas où l’homogénéité des

variances n’est pas vérifiée.

Diagramme des moyennes

Exclure les observations analyse par analyse:

Page 15: ANOVA - univ-oeb.dz

Cliquer sur Post Hoc

Cocher

Turkey pour les comparaisons multiples

Niveau de signification : 0.05

Puis « Poursuivre » et OK

Page 16: ANOVA - univ-oeb.dz

On obtient le résumé des actions et 6 tableaux

Fichier des données

Test d’homogénéité de

variance

Test Post Hoc

1

Page 17: ANOVA - univ-oeb.dz

Analyse descriptive et test d’homogénéité des variances

2

Dans le tableau descriptives,, il est indiqué

les différents métiers et moyennes et les écart-

types des différents métiers . On voit que la

moyenne des salaires la plus élevée est celle du

métier d’électricien , puis vient ensuite celle des

salaires du métier de menuisier .

• Le tableau Test d’homogénéité met en évidence le

test de Levene. Il nous montre la signification =

0.095 > 0.05. Nous pouvons conclure que

l’hypothèse de l’homogénéité des variances est

confirmée, comme on peut le voir sur le 1er

tableau qu’au moins 2 écart-types (4136.55 et

4299.87) sont presque identiques. Donc , on est

autorisé à continuer notre analyse en passant au

tableau ANOVA. donc,

Plombier( M=5000, ET=4136.55, N=10)

Menuisier (M=56000, ET=7102.42, N=10)

Electricien (M=65400, ET=4299.87, N=10)

• Si ce test n’est concluant, on fait appel

aux tests Brown-Forsythe ou le Welch

Robust F..

Page 18: ANOVA - univ-oeb.dz

Si l’hypothèse de l’homogénéité

des variances est confirmée alors

les tests de Welch et Brown-

Forsythe deviennent inutiles, on

passe donc directement au tableau

ANOVA .

Page 19: ANOVA - univ-oeb.dz

Tableau ANOVA 3

Ce qui nous intéresse dans ce tableau est la signification

(SIG.), ici elle est de 0.000 < 0.05 , cela signifie que les

moyennes des salaires des différents métiers sont

différentes. Cependant, il n’est pas indiqué dans le

tableau la signification statistique entre chaque paire

de métiers . Résultat: F(2,27)=21.00, p=0,000

ddl (degré de liberté) 2 et 27

Mesure F = 21.008

Signification = 0.000 < 0.05

Page 20: ANOVA - univ-oeb.dz

Tests Post Hoc 4

Pour voir la signification entre les salaires de chaque paire de

métiers, on a recours au tableau « Comparaisons multiples » à

condition que dans le test ANOVA p< 0.05. Il nous permet de faire

la comparaison entre les groupes . On remarque la présente

d’astérix dans la colonne « Différence de moyenne » , qui signifie

que la différence de salaires entre 2 métiers est statistiquement

très significative. Dans notre cas, la différence des moyennes de

chaque binôme , est statiquement significative .

Par exemple: Menuisier et électricien , la différence des

moyennes est très significative p = 0.002 < 0.05

Page 21: ANOVA - univ-oeb.dz

Un autre moyen pour comparer les moyennes est l’utilisation du diagramme des

moyennes. Il nous donne une idée très claire sur la différence des moyennes des salaires.

Cependant, il ne faut pas se fier à ce graphe avant de consulter d’abord, le tableau des

statistiques descriptives, puis la comparaison des moyens,

Ceci fait, nous pouvons dire que la salaire moyenne du métier d’électricien est le plus élevé

alors que celui du plombier est le moins rémunérant.

5

Page 22: ANOVA - univ-oeb.dz

Une taille d'effet est une mesure de la force

de l'effet observé d'une variable sur une autre

Dans le cadre de l'ANOVA, les conventionsde grandeurs de la taille de l'effet f sont

f=0,1, l'effet est faible.

• f=0,25, l'effet est modéré.

• f=0,4, l'effet est fort.

• Dans notre cas, taille d’effet=0.6, donc c’estun effet fort.Taille d’effet =Somme des carrés ( Inter-groupes) / Total

(voir tableau ANOVA)

6

Page 23: ANOVA - univ-oeb.dz

Il est important de présenter certains résultats dans le rapport scientifique àsoumettre pour une éventuelle évaluation.

La véracité de l’hypothèse d’homogénéité des variances est

confirmée et mise en évidence par le test de Levene .

F=(2,27)=2.56, p=0,095

La variable indépendante est à trois niveaux:

Salaire bas, Plombier( M=5000, ET=4136.55, N=10)

Salaire moyen, Menuisier (M=56000, ET=7102.42, N=10)

Salaire élevé, Electricien (M=65400, ET=4299.87, N=10

A l’issue de cette analyse ANOVA à 1 facteur, nous pouvons dire que l’hypothèse

nulle «les moyennes des salaires des différents métiers sont égales » est rejetée.

Donc, l’hypothèse alternative est retenue “la différence entre les moyennes des

salaires est significative”:

F(2,27)=21.00, p=0.000

La différence entre les moyennes des salaire est forte selon la convention de

Cohen (1988) au sujet de l’interprétation de la taille d’effet: taille d’effet=0.6.

Page 24: ANOVA - univ-oeb.dz

ANOVA à 1 facteur

Prof. Adad Mohamed Chérif

2017