plans d’expériences et méthode d’analyse de la...

44
1 Copyright © Génistat Conseils Inc., 2018, Montréal, Canada Plans d’expériences et Méthode d’analyse de la variance Systèmes et d’études statistiques 1-5 Planification d’expériences 6-12 Modèles / concepts de base exemples : 1 facteur et 2 facteurs 13-22 Formules : cas 2 facteurs 23-27 Modules Statistica 28-31 Modèles linéaires + codage variables 32-44

Upload: others

Post on 28-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

1Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Plans d’expérienceset

Méthode d’analyse de la variance

Systèmes et d’études statistiques 1-5

Planification d’expériences 6-12

Modèles / concepts de base exemples : 1 facteur et 2 facteurs 13-22

Formules : cas 2 facteurs 23-27

Modules Statistica 28-31

Modèles linéaires + codage variables 32-44

Page 2: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

2Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

SYSTÈME / PROCESSUS et ANALYSE STATISTIQUE

Facteurs Xcaractéristiquescontrôlables ou

mesurablesà l’entrée

PROCESSUS Réponses Ycaractéristiques

mesurablesde sortieY = f (X) + ε

X : variables = facteurs MODÈLE ANALYSE

quantitatifs = numériques = continus Régression (MR)catégoriques = qualitatives Variance (MAV)

catégoriques et continus Covariance (MAV)

ε : terme d’erreur f = ?

Page 3: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

3Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Elément de comparaison

Modèle d’analysede régression

Modèles d’analysede variance

But développement d’un modèle prédictif de la

réponse

identification des effets significatifs sur la réponse

Source des données :type d’étude statistique

observationnelles ou historiques

résultat d’un plan d’expérimentation

Nombre d’observations grand nombre : centaines, milliers ou plus

petit nombre : dizaines

Variables d’entrée continues catégoriquesNombre de valeurs distinctesdes variables d’entrée

autant qu’il y a d’observations

nombre restreintgénéralement moins de 10

Utilisation des variables codageindicatrices (1 et 0) oucodage à effets (1 / 0 / -1)

occasionnelle employé pour représenterles modalités

Emphase et difficulté forme et la qualitédu modèle

spécification du modèle reflétant la complexité du

plan expérimentalStructure des donnéesUnités expérimentales

simpleobservées sans

aucun contrôle de l’expérimentateur

complexeplan expérimental :

attribution des traitementsaux unités expérimentales

Page 4: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

4Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

élément qualificatif commentairetype d’étude statistique

expérimentale (mode actif)

observationnelle (passif)

contrôledes X

fixés (étudiés, principaux) mesurés bloqués (secondaires) inconnus

inconnus : tout ce que l’onne connait pas

= l’erreur expérimentalemême si les données n’ontpas été générée par un planexpérimental structuré

nombrede X

1 : simple (one way) ≥ 2 : multifacteurs

(multi way)

nature des X

fixes aléatoires hybrides (« mixed »)

présence des 2 types

fixe : modalités (valeurs)choisies délibérément

aléatoire : échantillon demodalités extraites demanière aléatoire= aucun contrôle sur

modalités

éléments distinctifs

Page 5: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

5Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

élément qualificatif commentairenombre de Y 1 : ANOVA

≥ 2 : MANOVA

Multivariate AnalysisOf Variance

design expérimental(plan, devis, protocole)

=méthode

d’assignationdes traitements

aux unités (sujets) expérimentales

Aléatoire (CRD) Blocs (RCBD) Blocs incomplets (IBD)

Blocs incompletséquilibrés (BIBD)

Carrés Latinset Graeco-Latins

Mesures répétées Fractionnaires Emboités (nested) SplitPlot

= parcelles divisées Crossover …..

mesures répétéesvariable de réponsemesurée plusieursfois sur la mêmeunité expérimentale

SplitPlotunité expérimentale(plot) est subdiviséedans l’assignationdes traitements

aussirestriction à larandomisation

éléments distinctifs

Page 6: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

6Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

ÉTUDES EXPÉRIMENTALES : concepts de base Unité expérimentale : plus petite unité de matériel (vivante ou non)

pouvant recevoir un traitement Facteurs explicatifs = X (variables catégoriques le plus souvent)

facteurs expérimentaux = facteurs contrôlés = facteurs manipulésmodalités (niveaux) choisis par l’expérimentateur

facteurs observationnels : non contrôlés par expérimentateurfacteurs d’arrière plan : associés aux unités expérimentales

ou à l’environnement de l’expérience Traitements : combinaisons des facteurs contrôlés

Structure des traitements : croisés, emboitésnombre: tous (= complet) / fractionnaires (= sous ensemble)

Design expérimental : règles et procédures de l’assignation aléatoiredes traitements aux unités expérimentales (ou vice versa)

Mesure du résultat Y sur les unités expérimentales : output

AUTRES : randomisation / blocage = randomisation sous contrainte n = # répétitions chaque traitement t = # traitementsN = taille expérience = traitements x répétitions = t * n

Page 7: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

7Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Principaux Designs ExpérimentauxNOM DÉFINITIONCRD = Completely Randomized

Designtraitements assignés aux unités expérimentales complètement au hasard

RCB = Randomized CompleteBlock

division des unités expérimentalesen blocs homogènes (strates) (b = # blocs )

randomisation des traitements à l’intérieur de chaque bloc (k = # taille bloc)

IBD = Incomplete Block Design taille du bloc (k) < nombre de traitements (t)

BIBD = Balanced IncompleteBlock Design

chaque traitement apparait avec tous les autres traitements le même nombre de fois dans le même blocfacilite la comparaison des paires traitements

MESURES RÉPÉTÉES même unité expérimentale reçoit plusieurs traitements dans le temps

FACTORIELLE toutes le combinaisons de traitementsFRACTIONNAIRES une partie des traitements

choix traitements : certaines règles … HIÉRARCHIQUE (NESTED) facteurs emboités

souvent : facteurs sont aléatoires

Page 8: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

8

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Types d’expériences

1. Essais et erreurs

2. Production lots sous conditions contrôlées

3. Essais pilotes

4. Expériences avec 1 facteur

5. Comparaison de 2 méthodes

6. Expériences de 2 à 4 facteurs

7. Expériences de 5 à 20 (et plus) facteurs:

tamisage

8. Expériences d’envergure avec plusieurs phases:

modélisation, optimisation

complexité

faible

forte

Page 9: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

9

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Planification et analyse statistique d’expériences (DOE)

Méthode extrêmement importante en R&D, innovation, ….

développement de nouveaux concepts … essentiels

origine en agriculture …. mais s’appliquent

TOUS les domaines de l’activité humaine

Page 10: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

10

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Remarques / définitions• modèle linéaire général : la régression et l’analyse de variance sont des

cas particuliers de ce modèle qui est le plus employé en analysestatistique ;

• en général, les unités (sujets, individus statistiques) sont choisies au hasard parmi une population d’unités statistique ;lorsque l’on contrôle certains facteurs, on fait l’assignation au hasarddes traitements (combinaison des facteurs contrôlés) aux unités :c’est la randomisation des traitements; c’est la caractéristiquefondamentale et essentielle d’un plan d’expérience; sinon les donnéessont de nature observationnelle;

si nécessaire, on fixe (contrôle) des facteurs secondaires sur lesunités pour améliorer l’efficacité de l’étude (plans en blocs, …) :c’est le principe du blocage (stratification);

• facteur intra (within) : si la même unité statistique est mesurée plusieurs fois (temps, différentes conditions), on a un plan en mesures répétées ; le facteur enfoui dans la réponse est appelé facteur intra (« within ») ;on traite ce cas en définissant plusieurs variables de réponse et eneffectuant avec une analyse de variance multidimensionnelle (MANOVA) ; les réponses sont naturellement dépendantes car ellessont mesurées sur le même sujet ; on décompose la variabilité totaleen variabilité intra sujet (within) et en variabilité inter sujet (between) ;

Page 11: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

11

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Remarques / définitions• facteur inter (between) : varie sur des groupes distincts de sujets ;

• analyse de covariance : on mesure (contrôle indirect) une variable quantitative (X) jouant un rôle de facteur et que l’on est en présence de d’autres facteurs catégoriques (A, B, C…);

• facteurs emboités (nested) : si les modalités prisent par un facteur sont spécifiques aux modalités d’un autre facteur, le concept d’interaction entre les 2 facteurs n’est pas défini;

• reconnaître les structures (traitements, assignation) présentent dans les données est nécessaire si l’on veut réaliser la « bonne » analyse statistique ; c’est plus facile si on a participé à laplanification de l’étude et si on connait le domaine (contexte) d’application;l’utilisation d’un logiciel statistique de donne pas laréponse à ces questions ! L’analyse statistique c’est plus que du « point and click » !

Page 12: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

12Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Remarques / définitions• designs (plans) expérimentaux sont généralement identifiés par

la structure des traitements ou la structure d’assignation destraitements aux unités expérimentales

• Exemples de plans expérimentaux: plan factoriel complet,plan fractionnaire, plan complètement aléatoire, plan en bloc, plan blocs incomplets, plan en carré Latin,plan en mesures répétées, plan avec facteurs aléatoires, ….

• On distingue aussi les modèles par la méthode d’analyse statistique employée : ANOVA multifactorielle, analyse de covariance, analyse en mesures répétées, facteurs aléatoires,….

• Écriture mathématique des modèles: différence entre- modèles de régression (MR): design n’intervient pas car on

assigne pas les traitements aux UE : étude observationnelle

- modèle d’analyse de variance (MAV) : structure du designexpérimental prise en comptecar c’est une étude expérimentale

Page 13: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

13

Design classification simple : 1 facteur catégorique A(1) Yi r = μ + α i + ε i r i = 1, 2,…, I (= nombre groupes) r = 1, 2,…, n i

Y i r : valeur de la variable de réponse Y r-ème essai modalité i du facteur Aμ : effet général - comme β0 dans les modèles de régressionα i : effet différentiel de la modalité i du facteur ∑ i α i = 0ε i r : erreur aléatoire distribuée N (0, σ2 )

Design classification double avec 2 facteurs A et B croisés

(2) Yi j r = μ + α i + β j + (αβ) i j + ε i j r i = 1, 2,..., I / j = 1, 2,..., J / r = 1, 2,..., n i j

α i : effet principal de A ∑ α i = 0β j : effet principal de B ∑ β i = 0

(αβ) i j : effet d’interaction entre A et B ∑ i (αβ) i j = 0 ∑ j (αβ) i j = 0

Design classification double avec facteur B emboité dans facteur A(3) Y i j r = μ + α i + β j ( i ) + ε i j r i = 1, 2,.., I / j = 1, 2,…, J / r = 1, 2,…, n i j

α i : effet facteur A et ∑ α i = 0β j (i) : effet facteur B et ∑ β j (i) = 0 pour tout ieffet d’interaction AxB n’existe pas

Copyright © Génistat Conseils Inc.Montréal, Canada, 2018

remarque: terme d’erreur ε i r ε i j r .... sont emboités dans la structure la plus fine(cellules) des données on devrait écrire ε r ( i ) ε r ( i j )

ÉCRITURE MODÈLE D’ANALYSE DE VARIANCE : exemples

déjà vu

à voir

nombreux autres cas non présentés dans ces notes

Page 14: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

14

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

CONCEPTS DE BASE : ANALYSE DE LA VARIANCE (ANOVA)

But de l’analyse de la variance : tester la présence de différencessignificatives ou non entre des moyennes

Cas classique: comparaison de deux moyennes provenantd’échantillons indépendants. ….. test t de Student

L’analyse de la variance: décomposition de la variabilité totale selonles différentes sources présentes dans les données.

Variabilité totale décomposée =variabilité due aux écarts entre les moyennes (INTER groupe)

+ variabilité résiduelle (non expliquée, INTRA groupe)

• Erreur expérimentale : répétitions et modélisation

Généralisation : études statistiques avec plusieurs facteursintervenant dans des plans (designs) expérimentaux complexes.

Page 15: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

15

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple 1 : 2 groupes avec un seul facteur A avec modalités a b

id groupe y-réponse1 a 12 a 23 a 34 b 55 b 66 b 7

groupea

groupeb

moyennesomme de carrés (SS)

22

62

moyenne globalesomme totale de carrés

428

Analyse de la variance (ANOVA) = tableau avec

identification des sources de variabilité

calcul des sommes de carrés (SS)

calcul des degrés de liberté (df)

calcul des carrés moyens (MS) MS = SS / df

calcul du ou des ratios F0 = MS (effet) / MS (erreur)

évaluation de la probabilité p (p-value): p = Prob (F ≥ F0)

Page 16: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

16

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple 1 : 2 groupes avec un seul facteur A avec modalités a b

ANOVASource

variabilitéDegr. de

liberté (df) y-réponse

SSy-réponse

MSy-réponse

Fy-réponse

pIntercept 1 96 96 96 0,00061

Inter groupe 1 24 24 24 0,00805

Intra groupe(erreur) 4 4 1

Totale 5 28

groupes sont statistiquementdifférents car p est « petit »

différence significative peut ne pas être importante en pratique Tous les calculs sont basés sur Y

et la structure des sous-groupes

Page 17: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

17

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Plusieurs facteurs En général, expériences ont plusieurs facteurs, généralement ≤ 5 ANOVA : capable de tenir en compte plusieurs facteurs ainsi que des

designs expérimentaux complexes

Exemple 2 : ajout deuxième facteur, sexe de l’individu

id groupe sexe y-réponse

1 a hom 12 a hom 23 a hom 34 b hom 55 b hom 66 b hom 77 a fem 38 a fem 49 a fem 5

10 b fem 711 b fem 812 b fem 9

moyenne groupea

groupeb

hommes 2 6femmes 4 8

tous 3 7

variabilité Y de 3 sources :

facteur groupe expérimental (INTER)

facteur sexe (INTER)

inexpliquée = résiduelle = INTRA

Page 18: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

18

Copyright © Génistat Conseils Inc., 2017, Montréal, Canada

Exemple 2 : deuxième facteur = sexe de l’individu pas tenu en compte

ANOVA

Source df y-réponseSS

y-réponseMS

y-réponseF

y-réponsep

Intercept 1 300 300 150 0,000000

Inter groupe 1 48 48 24 0,000624

Erreur 10 20 2

Totale 11 68

groupes différents mais une partie de cette différence est due au facteur sexe

Analyse modifiée avec

- effet facteur SEXE

- effet interaction GOUPE*SEXE

MODÈLES d’ANALYSE de la VARIANCE – partie 1

Page 19: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

19

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple 2 : ajout deuxième facteur = sexe de l’individuAnalyse : modèle y = général + groupe + sexe + groupe*sexe

ANOVASource df SS MS F p

Intercept 1 300 300 300 0,0000groupe 1 48 48 48 0,0001

sexe 1 12 12 12 0,0085groupe*sexe 1 0 0 0 1,0000

erreur 8 8 1total 11 68

graphique de visualisationdes données

graphique del’interaction entre les 2 facteurs

parrallélisme=

absence d’interaction

Page 20: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

20Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple 2 : ajout deuxième facteur = sexe de l’individuAnalyse : modèle simplifié y = général + groupe + sexe

ANOVASource SS df MS F p

Intercept 300 1 300 337,5 0,000000groupe 48 1 48 54,0 0,000043

sexe 12 1 12 13,5 0,005121erreur 8 9 0.89total 68 11

Page 21: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

21

Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple 3 : 2 facteurs présence d’interactionid groupe sexe réponse

Ynewréponse

Z1 a hom 1 12 a hom 2 23 a hom 3 34 b hom 5 55 b hom 6 66 b hom 7 77 a fem 3 158 a fem 4 179 a fem 5 1610 b fem 15 311 b fem 17 412 b fem 16 5

Y

Z

id groupe sexe y-réponse

1 a hom 12 a hom 23 a hom 34 b hom 55 b hom 66 b hom 77 a fem 38 a fem 49 a fem 510 b fem 711 b fem 812 b fem 9

données avant

Page 22: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

22Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

ANOVA

Source dfréponse

YSS

réponse Y

MS

réponse YF

réponse Z

SS

RéponseZ

MS

RéponseZF

Intercept 1 588 588 588 588 588 588groupe 1 192 192 192 48 48 48

sexe 1 108 108 108 108 108 108groupe*sexe 1 48 48 48 192 192 192

erreur 8 8 1 8 1

Total 11 356 356

Y Z

Page 23: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

23Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

ANOVA : cas de 2 facteurs

données

exemple

modèle

Page 24: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

24Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

ANOVA : cas de 2 facteurs

Page 25: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

25Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

ANOVA : cas de 2 facteurs

Tableau ANOVA

Page 26: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

26Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

exemple

interaction : température et pression n’est pas significative

Page 27: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

27Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Analyse résidus

- Examen graphique des résidus

- Test de normalité Shapiro-Wilk

Page 28: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

28Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

STATISTICA : modules pour analyse de variance (ANOVA) Basic Statistics / Tables …… Breakdown & one-Way ANOVA ANOVA (nombre facteurs ≤ 4) Advanced Linear / Non linear Models Experimental design (DOE) (designs spécialisés)

Page 29: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

29Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

STATISTICA

Page 30: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

30Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

STATISTICA

Page 31: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

31Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

différentstypes de modèleslinéairesprédéterminés

STATISTICA

Page 32: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

32Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

MODÈLES LINÉAIRES STATISTIQUESY = β0 + β1X1 + β2X2 + . . . + βkXk + ε ε ~ N(0, σ2 )

Y : réponse X1, X2, …, Xk : variables explicativesβ0, β1, β2, …, βk : coefficients du modèle

Codage : méthode 1 1 variable catégorique M avec k modalités m1 m2 … mk peut être représentéepar k – 1 variables indicatrices, chacune prenant les valeurs 0 et 1

Méthodes de codage facteurs catégoriques

Codage : méthode 2 - disjonctif complet1 variable catégorique M avec k modalités m1 m2 … mk peut être représentéepar k variables indicatrices, chacune prenant les valeurs 0 et 1

attention : multicolinéarité …. mais utilisée modèles d’analyse de covariance

Codage à effet : si k = 2 UNE SEULE variable quantitative Xavec 2 valeurs -1 et 1 est nécessaire

X = -1 si m1 et X = 1 si m2 valeur 0 pas nécessaire

Codage : méthode 3 – codage à effet - le plus employé1 variable catégorique M avec k modalités m1 m2 … mk peut être représentée par k - 1 variables Xi prenant les valeurs 1 / 0 / - 1modalité de référence est choisie disons mi :

Xi = 1 si M = mi Xi = 0 si M = mj j ≠ i Xi = - 1 si M = mk

Page 33: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

33Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple : Y : ventes X1 : dépenses publicité - facteur continuF : incorporation (oui, non) - facteur catégoriqueM : management (expérimenté, novice) - facteur catégorique

codage de F et MX2 = 1 si incorporée et X2 = 0 sinon (ou -1)X3 = 1 si expérimenté et X3 = 0 sinon (ou -1)

modèle du premier ordre Y = β0 + β1X1 + β2X2 + β3X3 + ε (*)

modèle du premier ordre avec interactions

Y = β0 + β1X1 + β2X2 + β3X3 + β4 X1X2 + β5 X1X3 + β6 X2X3 + ε

génère 4 équations distinctes pour les 4 combinaisons de F x Mavec le codage 1 / - 1 modèle premier ordre (*) devientY = β0 + β1X1 + β2X2 + β3X3 + ε = γ0 + β1X1 + ε

X2 X3 Y = γ0 + β1X1 + εoui expérimenté γ0 = β0 + β2 + β3oui novice γ0 = β0 + β2 - β3 non expérimenté γ0 = β0 - β2 + β3non novice γ0 = β0 - β2 - β3

Méthodes de codage facteurs catégoriques

Page 34: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

34Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple : Y : usure outil X1 : vitesse d’opérationM : manufacturier (M1, M2, M3, M4)

codage de M : 3 variables (0 / 1) X2 X3 X4

M X1 X2 X3 X4 X2 + X3 + X4

M1 xi1 1 0 0 1M2 xi1 0 1 0 1M3 xi1 0 0 1 1M4 xi1 0 0 0 0

modèle Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + edevient M4 : Y = β0 + β1X1 = β0 + β1X1

M1 : Y = (β0 + β2) + β1X1 = γ1 + β1X1

M2 : Y = (β0 + β3) + β1X1 = γ2 + β1X1

M3 : Y = (β0 + β4) + β1X1 = γ3 + β1X1

4 droites avec pentes égales: β1

l’influence du facteur M : test d’égalité desparamètres H0 : β0 = γ1 = γ2 = γ3

Méthodes de codage facteurs catégoriques

Page 35: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

35Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple : Y : usure outil X1 : vitesse d’opérationM : manufacturier (M1, M2, M3, M4)

autre codage : disjonctif complet (0 / 1) X2 X3 X4 X5

M X2 X3 X4 X5 X2 + X3 + X4 + X5

M1 1 0 0 0 1M2 0 1 0 0 1M3 0 0 1 0 1M4 0 0 0 1 1

modèle Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + e

variables X1 X2 X3 X4 X5 sont colinéaires carX2 + X3 + X4 + X5 = 1

modèle sur paramétré - imposible de résoudre systèmemoindres carrés - utilisation des inverses

dans modèles statistiques d’analyse de covariance: utilisation codage disjonctif complet

Méthodes de codage facteurs catégoriques

Page 36: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

36Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemple : Y : usure outil X1 : vitesse d’opérationM : manufacturier (M1, M2, M3, M4)

codage à effet: 1 / 0 / -1 création 3 variables X2 X3 X4

M X2 X3 X4

M1 1 0 0M2 0 1 0M3 0 0 1M4 -1 -1 -1

modèle Y = β0 + β1X1 + β2X2 + β3X3+ β4X4 + e

variables X2 X3 X4 ne sont pas sont colinéaires

Interprétation de β2 β3 β4 ?

β2 effet sur Y entre modalité M1 et modalité M4β3 effet sur Y entre modalité M2 et modalité M4β4 effet sur Y entre modalité M3 et modalité M4

Possibilité d’ajouter des interactions avec d’autres facteurs

Méthodes de codage facteurs catégoriques

Page 37: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

37Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Modèles d’analyse de variance

Between-Subject Designs One-way ANOVA

Main effect ANOVA

Factorial ANOVA

Nested designs

Balanced ANOVA

Simple regression

Multiple regression

Factorial regression

Polynomial regression

Response surface regression

Mixture surface regression

Analysis of covariance (ANCOVA)

Separate slopes designs

Homogeneity of slopes

Mixed-model ANOVA and ANCOVA

Within-Subject (Repeated Measures) Designs One-way within-subject designs

Multi-way within-subject designs

The multivariate approach to Repeated Measures

Doubly multivariate within-subject designs

Between-Subject Designschaque sujet (unité expérimentale) estmesuré une seule fois; les traitements (combinaisons de facteurs) varient d’unsujet à l’autre.

Within-Subject (Repeated Measures) Designschaque sujet est mesuré plusieurs fois àplusieurs époques (temps) ou selon desconditions différentes; dans les réponsesobservées, il y a un facteur enfoui dans lesréponses (le temps, en général).Par exemple, des expériences comparativesde type avant-après.

Page 38: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

38Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemples de modèles d’analyse de variance

Example 1 1 facteur

3 fertilisants employés sur des plantes individuelles.3 modalités (niveaux) du facteur Fertilisant.

1 variable catégorique A avec 1 cas (répétition) pour

chacune des 3 categories.

codage de A: 2 variables de codage à effet (1/ 0 /-1)

la matrice X

Exemple 2 2 facteurs étude sur les garçons et les filles dans 4 groupes

d’âge : 2 (gender) X 2 (groupe d’âge).

design factoriel complet : toutes les combinaisons

des modalités des variables catégoriques.

cas de 2 variables catégoriques à 2 modalités,

matrice X matrix pour ce design est avec

X3 = X1 * X2 effet d’interaction

Page 39: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

39Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Example 3 : 3 facteurs

3 facteurs catégoriques A, B, C chacun avec 2 modalités

A = (A1, A2) representé par variable X1

B = (B1, B2) représenté par variable X2

C = (C1, C2) représenté par variable X3

design factoriel 2 x 2 x 2 modèle : effets principaux + effets interactions d’ordre 2

gen X1 X2 X3 X1*X2 X1*X3 X2*X3A1B1C1 1 1 1 1 1 1 1A1B1C2 1 1 1 -1 1 -1 -1A1B2C1 1 1 -1 1 -1 1 -1A1B2C2 1 1 -1 -1 -1 -1 1A2B1C1 1 -1 1 1 -1 -1 1A2B1C2 1 -1 1 -1 -1 1 -1A2B2C1 1 -1 -1 1 1 -1 -1A2B2C2 1 -1 -1 -1 1 1 1

Exemples de modèles d’analyse de variance

Page 40: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

40Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemples de modèles d’analyse de variance Exemple 4 2 facteurs A et B - B emboité dans A

facteur A : 3 modalités (A1, A2, A3)facteur B : 2 modalités distinctes

pour chaque modalité de Asi A = A1 alors B = b11 et b12si A = A2 alors B = b21 et b22si A = A3 alors B = b31 et b32

facteur A codé avec X1 X2 X3 disjonctif complet (1 / 0) facteur B codé avec X4 X5 X6 X7 X8 X9 design : 3 effets principaux pour A + 6 effets principaux B

A1b11

A1b12

A2b21

A2b22

A3b31

A3b32

A1 A2 A3

b11 b12 b21 b22 b31 b32

Page 41: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

41Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemples de modèles d’analyse de variance Exemple 5 : design d’analyse de covariance

variable catégorique A avec 3 modalité + variable continue X

Modèle 1 : pas interactionentre A et X

pentes égales= droites parallèles

A facteur catégoriqueavec 3 modalités codé avec X2 et X3codage à effet (1 / 0 / -1)

X1 = X facteur continuY = β0 + β1X1 + β2X2 + β3X3

si A = A1Y = β0 + β1X1 + β2 = γ1 + β1X1

si A = A2Y = β0 + β1X1 + β3 = γ2 + β1X1

si A = A3Y = β0 + β1X1 - β2 - β3 = γ3 + β1X1

Page 42: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

42Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemples de modèles d’analyse de variance Exemple 6 : design d’analyse de covariance

variable catégorique A avec 3 modalités+ variable continue X

Modèle 2interaction entre A et Xdroites avec pentes distinctes selon A2 méthodes équivalentes pour modéliser

méthode 1 facteur continu X représenté par X1A représenté par 3 variables X2 X3 X4avec codage disjontif complet (1 / 0)

modèleY = β0 + β1 X1 + β2 X2 + β3 X3 + β4 X4

+ β5 X1X2 + β6 X1X3 + β7 X1X4 si A = A1 Y = β0 + β1 X1 + β2 + β5 X1

= (β0 + β2) + (β1 + β5) X1 = γ1 + γ2 X1si A = A2 Y = (β0 + β3) + (β1 + β6) X1 = γ3 + γ4 X1

si A = A3 Y = (β0 + β4) + (β1 + β7) X1 = γ5 + γ6 X1

X0 X1 X2 X3 X4 X1X2 X1X3 X1X4

1 7 1 0 0 7 0 0

1 4 1 0 0 4 0 0

1 9 0 1 0 0 9 0

1 3 0 1 0 0 3 0

1 6 0 0 1 0 0 6

1 8 0 0 1 0 0 8

Page 43: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

43Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

Exemples de modèles d’analyse de variance

Modèle 2 interaction entre A et XA facteur catégorique codé disjontif complet

(1 / 0) : X1 X2 X3méthode 2 facteur continu X représenté par

3 variables continues X4 X5 X6 X4 = X si A1 / X5 = X si A2 / X6 = X si A3

Y = β0 + β4X1 + β2X2 + β3X3 + β 4X4 + β 5X5 + β 6X6

si A = A1Y = β0 + β1X1 + β4X4 = γ4 + β4X4

si A = A2Y = β0 + β2X2 + β5X5 = γ5 + β5X5

si A = A3 Y = β0 + β3X3 + β6X6 = γ6 + β6X6

Exemple 6 : design d’analyse de covariancevariable catégorique A avec 3 modalités+ variable continue X

Page 44: Plans d’expériences et Méthode d’analyse de la variancecours.polymtl.ca/.../chap12-PlansExperiences-ANOVA.pdf · plan en bloc, plan blocs incomplets, plan en carré Latin, plan

44Copyright © Génistat Conseils Inc., 2018, Montréal, Canada

modèle de régression par morceaux

Intervention séries chronologiques

banques de données: simplificationremplacement des valeurs par quelques valeurs types- variables continues : points milieux d’intervalles

- variables catégoriques : regroupement de catégories

perte d’informationmais ….appréhension facilitée des données

Variables indicatrices / codages : autres applications