analyse de données quantitatives longitudinale...

82
1 Analyse de données quantitatives longitudinale Introduction à la régression Jean-François Bickel Université de Fribourg Année académique 2009-2010 (SA09)

Upload: vonga

Post on 11-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

1

Analyse de données quantitatives longitudinale

Introduction à la régression

Jean-François Bickel Université de Fribourg

Année académique 2009-2010 (SA09)

Page 2: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

2

Survol

Préambule à SPSSIntroductionLa régression simpleExemple 1 avec SPSSLa régression multipleLes variables indépendantes catégoriellesExemple 2 avec SPSS

Page 3: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

3

Ouvrir le fichier de données

Page 4: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

4

Ouvrir le fichier de données

Page 5: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

5

Le fichier de données SPSS

Page 6: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

6

Statistique univariée

Page 7: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

7

Statistique univariée

Page 8: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

8

Statistique univariée

Page 9: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

9

Statistique univariée

Page 10: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

10

Statistique univariée

Page 11: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

11

Analyse bivariée - corrélation

Page 12: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

12

Analyse bivariée - corrélation

Page 13: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

13

Analyse bivariée - corrélation

Page 14: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

14

Introduction à la régression

La régression est une méthode statistique qui traite les valeurs d’une variable dépendante y comme étant fonction des valeurs prises par une ou plusieurs variables indépendantes x

y = f(xk )pour k=1,2,3… variables indépendantes

Page 15: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

15

Introduction à la régression

De manière équivalente:La distribution de y est conditionnelle: elle dépend des valeurs prises par x1 , x2 ... xk

Page 16: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

16

Introduction à la régression

Dans le cas le plus général et le plus simple, la fonction est traitée comme étant linéaireLa relation entre les « x » et y peut être représentée par une équation ayant la formey = a + b1 x1 + b2 x2 + ... + bk xk

Page 17: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

17

Introduction à la régression

Pour n’importe quelle combinaison de valeurs des variables x2 , x3 , …, xk , la relation entre la variable x1 et la variable y peut être représentée par une ligne droiteEt la même chose pour la relation entre x2 et y, x3 et y, …, xk et y

Page 18: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

18

La régression simple

La régression simple (=bivariée) comprend une seule variable indépendanteL’équation de régression a donc la forme:y = a + bx

Page 19: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

19

La régression simple

Soit la question de la relation entre fécondité et taux d’emploiElle peut être exprimée sous la forme d’une équation de régressiony(fécondité) = a + b(taux d’emploi)

Page 20: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

20

La régression simple

Cette équation a donc deux coefficientsa qui est une constante et qui s’interprète comme étant la valeur de y lorsque x = 0b qui exprime la relation entre y et x et qui s’interprète comme étant le changement moyen de y lorsque x augmente d’une unité

•La variable x est de type quantitatif

Page 21: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

21

La régression simple

Page 22: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

22

La régression simple

L’objectif est de déterminer les coefficients de l’équation pour la droite de régression qui permette la meilleure approximation possible des données observéesMéthode ordinaire des moindres carrésObjectif: minimisation des erreurs de prédiction (voir ci-dessous)

Page 23: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

23

Droite de régression:y = a + bxavec pente

(xi -x ) (yi -y) sy

b = _____________________ = r ___

(xi -x ) 2 sx

et constantea = y - bx

La régression simple

Page 24: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

24

La régression simple

Où:r est la corrélation entre y et xsy est l’écart type de ysx est l’écart type de xy etx sont les moyennes des deux variables

Page 25: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

25

La régression simple

Dans la réalité, les valeurs prédites de y (=ŷ) à l’aide de l’équation de régression sont différentes des valeurs observées pour yOn parle à ce propos d’erreur de prédictionErreuri = valeur observéei - valeur préditei

= yi – ŷi

•i réfère à la ième observation (cas, individu)

Page 26: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

26

La régression simple

En cela, les deux équations ci-dessous sont équivalentesŷ

= a + bx

y = a + bx + erreur

Page 27: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

27

La régression simple

Sur cette base, on peut calculer la somme des erreurs de prédictions pour l’ensemble des observationsLes erreurs sont au préalable élevées au carré pour éviter qu’elles s’annulentLa somme des erreurs équivaut donc à:Σ

(yi – ŷi )2

Page 28: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

28

La régression simple

Cette somme représente la variation de y autour de la droite de régressionOn qualifie cette variation de résiduelle, car c’est la part de la variation de y qui « reste » après qu’on ait pris en compte celle qui dépend des valeurs prises par x

Page 29: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

29

La régression simple

On parle donc de la « somme des carrés des erreurs résiduelles » (en abrégé RSS) ou plus simplement de « résidus »RSS = Σ

résidusi2 = Σ

(yi – ŷi )2

Page 30: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

30

La régression simple

La variation totale de y autour de sa moyenne, c’est-à-dire en ignorant la droite de régression, est également calculée comme étant une somme des carrés des erreurs (en abrégé TSS)Soit:TSS = Σ

(yi –y)2

Page 31: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

31

La régression simple

La différence entre les deux mesures de variation est la quantité de variation qui est expliquée par la régression de y sur xvariation variation variation expliquée = totale - résiduelle

Page 32: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

32

La régression simple

En abrégé:RegSS = TSS – RSS

= Σ

(yi –y)2 - Σ

(yi – ŷi )2

= Σ

(ŷi –y)2

Page 33: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

33

La régression simple

La corrélation élevée au carré (r2) exprime la variation expliquée comme une fraction de la variation totale de y

variation expliquée TSS - RSS r2 = _______________________ = _____________

variation totale TSS

Page 34: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

34

La régression simple

On parle ainsi de r2 comme d’une mesure de « réduction proportionnelle de l’erreur »On l’utilise comme indicateur de la qualité globale (« fit ») de l’équation de régression, c’est-à-dire du degré auquel elle permet de prédire y

Page 35: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

35

La régression simple

Une autre mesure d’intérêt est celle de l’écart type des résidus (des erreurs de prédictions)

______________ ______________ sr = √ Σ résidusi2 / (n-2) = √ Σ (yi – ŷi )2 / (n-2)

Page 36: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

36

La régression simple

Mesure la proximité avec laquelle la droite de régression « colle » aux points observésPlus précisément, sr est la distance moyenne des observations par rapport à la droite de régressionAutrement dit, « l’erreur typique » commise par l’équation de régression en prédisant y à partir de x

Page 37: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

37

La régression simple

De plus, si les résidus sont approximativement distribués selon une courbe normale, 2/3 de ces résidus sont dans un éventail de ±

2 écarts types (autour de ŷ)

et 95% d’entre eux sont dans un éventail de ±

4 écarts types

Page 38: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

38

La régression simple

Nota Bene:Dans SPSS, on parle de « erreur standard de l’estimation »C’est dommage car le terme « erreur standard » est normalement utilisé pour parler de la distribution d’une statistique particulière

Page 39: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

39

Exemple 1 avec SPSS

ExempleAnalyse de l’indice de fertilité comme étant fonction du taux d’emploi des femmes

•Variable pour indice de fertilité: <fertil>•Variable pour taux d’emploi: <tauxemp

L’équation de régression a donc la formeŷ(fertil) = a + b1(tauxemp)

Page 40: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

40

Exemple 1 avec SPSS

Instructions SPSSPar l’interface graphiqueMenu Analyse -> Régression -> Linéaire

Page 41: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

41

Exemple 1 avec SPSS

Page 42: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

42

Exemple 1 avec SPSS

Page 43: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

43

Exemple 1 avec SPSS

Par la syntaxe

REGRESSION/MISSING LISTWISE/STATISTICS COEFF OUTS CI R ANOVA CHANGE/CRITERIA=PIN(.05) POUT(.10)/NOORIGIN /DEPENDENT fertil/METHOD=ENTER tauxemp.

Page 44: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

44

Exemple 1 avec SPSS

Syntaxe simplifiée

REGRESSION/MISSING LISTWISE/STATISTICS DEFAULTS CI/DEPENDENT fertil/METHOD=ENTER tauxemp.

Page 45: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

45

Exemple 1 avec SPSS

Page 46: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

46

Exemple 1 avec SPSS

Page 47: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

47

Exemple 1 avec SPSS

Page 48: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

48

La régression multiple est une extension de la régression simpleLe réel pouvoir heuristique de l’analyse de régression réside en effet dans sa capacité à prendre en compte de manière simultanée plusieurs variables indépendantes

La régression multiple

Page 49: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

49

La régression multiple

D’une part, cela permet de réduire la grandeur des résidus et donc de rendre compte d’une plus grande part de la variation de la variable dépendante yObjectif: prédire y de manière plus précise

Page 50: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

50

La régression multiple

D’autre part et surtout, il est possible d’évaluer plus correctement « l’effet » de x sur y

•Si x est lié à une autre variable indépendante z, qui exerce elle-même un effet sur y, la prise en compte de z permet (a) soit de ne pas attribuer faussement à x un effet qui est dû en réalité à z; (b) soit de spécifier l’effet de x sur y, cet effet « passant » par z

Page 51: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

51

La régression multiple

On étend donc ce que l’on vient de voir dans le cas de la régression simple à k variables indépendantes x1 , x2 , ..., xk

L’équation de régression linéaire prend alors la formey = a + b1 x1 + b2 x2 + ... + bkxk + résidusŷ

= a + b1 x1 + b2 x2 + ... + bkxk

Page 52: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

52

La régression multiple

La procédure est identique et vise à déterminer les valeurs de a, b1 , b2 , ..., bk qui minimise la sommes des résidus (résidus2)Les coefficients de cette équation ont l’interprétation suivantea est la valeur prédite de y quand les variables x1 , x2 , ..., xk valent toutes 0

Page 53: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

53

La régression multiple

b1 est la changement moyen de y qui est associé à l’accroissement d’une unité de x1 , toutes les autres variables indépendantes (càd., x2 , ..., xk ) étant maintenues constantesb2 , ..., bk s’interprètent de la même manière

•Cette interprétation pour x1

(respectivement x2 , ..., xk ) vaut quand x1

(ou x2 , ..., xk ) est une variable de type quantitatif

Page 54: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

54

Des variables catégorielles peuvent également être introduites dans une équation de régression au titre de variables indépendantesCe cours traite de la manière de faire la plus couranteLa procédure comprend 2 étapes successives

Variables indépendantes catégorielles

Page 55: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

55

Variables indépendantes catégorielles

Etape 1:On transforme chaque catégorie, sauf une, de la variable en une nouvelle variable « dummy » (binaire) codée1 pour toutes les observations appartenant à la catégorie en question0 pour toutes les autres observations

Page 56: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

56

Variables indépendantes catégorielles

En procédant ainsi pour toutes les k catégories de la variable sauf une, on obtient k-1 variables dummiesLa catégorie restante est considérée comme catégorie de référence

Page 57: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

57

Variables indépendantes catégorielles

Exemple: types de familialismeSelon la construction adoptée, la variable comprend k=4 catégoriesfamilialisme optionnel / ... explicite / défamilialisme / familialisme impliciteElle est recodée en k-1=3 catégories

Page 58: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

58

Variables indépendantes catégorielles

On aura donc 3 variable dummies telles que, par exempleDummy 1: 1= familialisme explicite, 0=autres types de familialismeDummy 2: 1=défamilialisme, 0=autres types de familialisme

Page 59: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

59

Variables indépendantes catégorielles

Dummy 3: 1=familialisme implicite, 0=autres types de familialisme

Dans cet exemple, la catégorie de référence est donc familialisme optionnel

•N.B. Les observations appartenant à la catégorie de référence sont codées 0 sur toutes les variables dummies

Page 60: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

60

Variables indépendantes catégorielles

Le choix de la catégorie de référence est arbitraireUn choix fréquent est celui de la catégorie majoritaire

•Permet la comparaison de situations « minoritaires » à celle majoritaire ou « normale »

Un intérêt substantiel peut motiver le choix

Page 61: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

61

Variables indépendantes catégorielles

Règle pratique 1Créez vous-mêmes les variables dummiesPuis introduisez-les vous-mêmes dans l’équation de régression (selon la procédure expliquée ci-dessous)

Page 62: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

62

Variables indépendantes catégorielles

Règle pratique 2:Donnez des noms aux variables dummies tels qu’ils désignent de manière synthétique la catégorie codée 1

•Permet de se souvenir aisément de la catégorie cible et du sens de la comparaison avec la catégorie servant de référence

Page 63: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

63

Variables indépendantes catégorielles

Exemples:Nommer explicit la variable dummy codée 1 pour le familialisme explicite et 0 pour les autres types de familialismeEt ainsi de suite

Page 64: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

64

Variables indépendantes catégorielles

Etape 2:Introduire dans l’équation de régression les k- 1 variables dummies « exprimant » la variable originelle

•Les observations appartenant à la catégorie de référence sont aussi dans l’équation: ce sont celles qui sont codées 0 sur toutes les dummies

Page 65: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

65

Variables indépendantes catégorielles

En reprenant notre exemple:Introduire simultanément les trois variables dummies « exprimant » le type de familialisme

Page 66: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

66

Variables indépendantes catégorielles

Le coefficient b de la variable dummy exprime la différence entre la valeur moyenne de y pour la catégorie cible et la valeur moyenne de y pour la catégorie de référenceMode de lecture: y pour catégorie cible par rapport à y pour catégorie de référence

Page 67: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

67

Exemple 2 avec SPSS

ExempleAnalyse de l’indice de fertilité comme étant fonction du taux d’emploi des femmes et du type de familialisme

•Variable pour indice de fertilité: <fertil>•Variable pour taux d’emploi: <tauxemp>•Variable pour types de familialisme: <typfam>

Page 68: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

68

Exemple 2 avec SPSS

Etape 1: création des variables dummiesMot-clé: recode (« recoder »)

recode typfam (1=1) (2,3,4=0) into optional.recode typfam (2=1) (1,3,4=0) into explicit.recode typfam (3=1) (1,2,4=0) into defami.recode typfam (4=1) (1,2,3=0) into implicit.exe.

Page 69: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

69

Exemple 2 avec SPSS

Etape 2: Analyse de régression proprement diteUne procédure pas à pas est adoptée

Page 70: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

70

Exemple 2 avec SPSS

1) Une première équation de régression ne contient que le taux d’emploi des femmes comme variable indépendante2) Puis une seconde équation de régression contient le taux d’emploi des femmes et le type de familialisme comme variables indépendantes

Page 71: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

71

Exemple 2 avec SPSS

L’équation de régression 1 a donc la formeŷ(fertil) = a + b1(tauxemp)

L’équation de régression 2 a donc la formeŷ(fertil) = a + b1(tauxemp) + b2(explicit) +

b3(defami) + b4(implicit)

Page 72: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

72

Exemple 2 avec SPSS

Ces deux équations de régression successives sont enchâssées (nested) l’une dans l’autre:a) Elles portent sur les mêmes observationsb) La seconde équation est plus complète que la première (qualifiée de réduite) car elle utilise davantage d’information (le type de familialisme

Page 73: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

73

Exemple 2 avec SPSS

Ces deux équations peuvent être calculées successivement par SPSS dans une seule et même analyseCeci permet de demander à SPSS de comparer entre elles les deux équations et de déterminer si celle qui est plus complète permet effectivement de mieux prédire y

Page 74: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

74

Exemple 2 avec SPSS

Instructions SPSSPar l’interface graphiqueMenu Analyse -> Régression -> Linéaire

Page 75: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

75

Exemple 2 avec SPSS

Page 76: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

76

Exemple 2 avec SPSS

Page 77: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

77

Exemple 2 avec SPSS

Page 78: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

78

Exemple 2 avec SPSS

Par la syntaxe

REGRESSION/MISSING LISTWISE/STATISTICS COEFF OUTS CI R ANOVA CHANGE/CRITERIA=PIN(.05) POUT(.10)/NOORIGIN /DEPENDENT fertil/METHOD=ENTER tauxemp/METHOD=ENTER explicit defami implicit.

Page 79: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

79

Exemple 2 avec SPSS

Syntaxe simplifiée

REGRESSION/STATISTICS DEFAULTS CI CHANGE/DEPENDENT fertil/METHOD=ENTER tauxemp/METHOD=ENTER explicit defami implicit.

Page 80: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

80

Exemple 2 avec SPSS

Page 81: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

81

Exemple 2 avec SPSS

Page 82: Analyse de données quantitatives longitudinale ...commonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/18285... · 16. Introduction à la régression. Dans le cas le plus général

82

Exemple 2 avec SPSS