l’analyse factorielle non linéaire de données binaires

47
Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004 Trait latent L’analyse factorielle non linéaire de données binaires : modèles et illustrations. Jacques JUHEL CRPCC, Université Rennes 2

Upload: others

Post on 18-Jun-2022

2 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire de données binaires :

modèles et illustrations.

Jacques JUHELCRPCC, Université Rennes 2

Page 2: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Position du problème

Hypothèses fondamentales du modèle classique d’analyse factorielle d’items1) Les items sont linéairement associés les uns aux autres,2) Les items sont linéairement associés au(x) facteur(s) continu(s).

! Aucune de ces hypothèses ne tient pour des items dichotomiques.

1.1) Quand les probabilités de réussite diffèrent beaucoup entre items, le modèle classique surestime le nombre de facteurs (facteurs artéfactuels de « difficulté »).1.2) La similitude des niveaux de difficulté des items réduit l’amplitude des corrélations de Pearson (phi). Les saturations des items sur les facteurs sont donc différentiellement sous-estimées.2) Les réponses aux items dichotomiques n’étant pas normalement distribuées, les erreurs-type d’estimation et les tests de significativité sont biaisés.

Page 3: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Position du problème

Quelles alternatives à l’analyse factorielle classique ?

" Tradition factorielle# Approches strictement linéaires qui corrigent les effets de la difficulté des

items en utilisant les corrélations tétrachoriques.# Approches linéaires « au sens large » qui apportent une solution au

problème de la dépendance entre items et à celui de l’hétérogénéité de la variance d’erreur.

" Tradition des Modèles de Réponse à l’Item.# Approches non linéaires qui analysent l’ensemble des patrons de réponse

aux items.

Page 4: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

PLAN

1. Les Modèles de Réponse à l’Item2. L’analyse factorielle non linéaire de données

binaires3. Illustration: analyse de la structure interne d’un

questionnaire de désirabilité sociale

Page 5: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

PLAN

1. Les Modèles de Réponse à l’Item2. L’analyse factorielle non linéaire de données

binaires3. Illustration: analyse de la structure interne d’un

questionnaire de désirabilité sociale

Page 6: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Au-delà de la théorie classique des items et des tests (TC)

! Xobservé = Xvrai + ε

-Xvrai est test-dépendant: les scores des sujets dépendent des propriétés des items employés.

-Les statistiques classiques des items sont sujets-dépendantes: elles varient d’un échantillon à l’autre selon la moyenne et la variance des scores (toutes choses restant égales par ailleurs, l’alpha de Cronbach par exemple est plus élevé sur un échantillon hétérogène).

Peut-on construire des échelles de mesure ne souffrant pas de cette dépendance?

Page 7: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Une échelle de mesure absolue ?

" Le modèle déterministe de Guttman (1950)

Trait mesuré

Prob

abilit

é de r

éuss

ite

0

1

Page 8: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Un trait latent sous-tend les réponses de l’individu à l’item " Les modèles probabilistes ou Modèles de Réponse à l’Item (MRI)

Trait latent θ

Prob

abilit

é de r

éuss

ite

0.5

-3 -2 -1 0 1 2 30

1

Page 9: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Qu’est-ce qu’un MRI?Un MRI est un modèle de mesure qui fait l’hypothèse que la réponse donnée par un individu est fonction du trait latent et des propriétés de l’item.

La relation entre la probabilité de réponse P(X=1) à un item dichotomique qui possède certaines propriétés psychométriques et le trait latent est décrite par la fonction (ou courbe) caractéristique de l’item (CCI).

La probabilité de réponse P(X=1) est la variable dépendante; les variables indépendantes peuvent se combiner de manière plus ou moins complexe, répondre à certaines lois de distribution (e.g., à ogive normale, logistique).

Page 10: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Hypothèses des MRI

1) Les CCI ont une forme spécifiée. Celle-ci dépend de la relation fonctionnelle dont le modèle fait l’hypothèse.

" Par définition, la valeur qui représente la difficulté b de l’item est égale à la valeur de θ pour laquelle la probabilité de réponse exacte (ou d’agrément) est de 0.5.

" Le pouvoir discriminant de l’item peut être plus ou moins important. La discrimination a de l’item est représentée par la pente de la CCI.

" Les CCI peuvent aussi différer par rapport à leur asymptote basse (paramètre c de l’item).

Page 11: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Hypothèses des MRI

1) Les CCI ont une forme spécifiée. Celle-ci dépend de la relation fonctionnelle dont le modèle fait l’hypothèse.

" Par définition, la valeur qui représente la difficulté b de l’item est égale à la valeur de θ pour laquelle la probabilité de réponse exacte (ou d’agrément) est de 0.5.

" Le pouvoir discriminant de l’item peut être plus ou moins important. La discrimination a de l’item est représentée par la pente de la CCI.

" Les CCI peuvent aussi différer par rapport à leur asymptote basse (paramètre c de l’item).

Page 12: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Item de difficulté moyenneItem plus facile Item plus difficile

Paramètre bi de difficulté ou seuil.

bi =-2 bi = 0 bi= 2

Page 13: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Hypothèses des MRI

1) Les CCI ont une forme spécifiée. Celle-ci dépend de la relation fonctionnelle dont le modèle fait l’hypothèse.

" Par définition, la valeur qui représente la difficulté b de l’item est égale à la valeur de θ pour laquelle la probabilité de réponse exacte (ou d’agrément) est de 0.5.

" Le pouvoir discriminant de l’item peut être plus ou moins important. La discrimination a de l’item est représentée par la pente de la CCI.

" Les CCI peuvent aussi différer par rapport à leur asymptote basse (paramètre c de l’item).

Page 14: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Item très discriminant Item discriminant Item peu discriminant

Paramètre ai de discrimination ou pente.

ai = 2 ai = 0.5 ai = 0.25

Page 15: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Hypothèses des MRI

1) Les CCI ont une forme spécifiée. Celle-ci dépend de la relation fonctionnelle dont le modèle fait l’hypothèse.

" Par définition, la valeur qui représente la difficulté b de l’item est égale à la valeur de θ pour laquelle la probabilité de réponse exacte (ou d’agrément) est de 0.5.

" Le pouvoir discriminant de l’item peut être plus ou moins important. La discrimination a de l’item est représentée par la pente de la CCI.

" Les CCI peuvent aussi différer par rapport à leur asymptote basse (paramètre c de l’item).

Page 16: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Paramètre ci de pseudo-chance ou asymptote basse.

ci = 0.10 ci = 0.25 ci = 0.50

Page 17: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Hypothèses des MRI

2) L’exigence d’indépendance locale.

" Le trait latent est le seul facteur qui détermine la variabilité des réponses à l’item. Les corrélations entre items sont totalement « expliquées » par leurs différences de paramètres (difficulté, pente, etc.) et par les paramètres individuels.

" Si l’espace latent est unidimensionnel, l’exigence d’indépendance locale est nécessairement satisfaite.

" L’exigence d’indépendance locale peut être satisfaite dans un espace latent multidimensionnel si le modèle contient des paramètres individuels pour chaque dimension.

Page 18: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Exemples de MRI

1) Le modèle logistique à 1 paramètre (Rasch, 1PL) : bj

2) Le modèle logistique à 2 paramètres (2PL) : bj , aj

3) Le modèle logistique à 3 paramètres (3PL) : bj , aj , cj

" Les modèles logistiques et modèles à ogive normale (à 2 et 3 paramètres) sont pratiquement équivalents (on peut passer de la métrique logistique à la métrique normale en multipliant θ par un facteur d’échelonnement de 1.7).

" Les modèles à ogive normale offrent l’avantage d’être en étroite relation avec la théorie classique des tests.

Page 19: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

L’estimation des paramètres du modèle"L’estimation des paramètres du modèle (items et individus) s’appuie sur le

principe du maximum de vraisemblance."Illustration : dans le modèle 1PL, la difficulté de l’item doit être estimée sur la

base du patron des réponses des N sujets y ayant répondu.- Le paramètre cible est la réalisation d’une variable aléatoire; on construit une

expression analytique fonction des réalisations de cette variable aléatoire dans un échantillon de taille N: c’est la fonction de vraisemblance du patron de réponses.

- Les changements de la fonction de log-vraisemblance pour différentes valeurs possibles du paramètre de l’item guident le processus de recherche.

- Le pic de la courbe est à la valeur du paramètre qui rend le plus probable les réalisations que l’on vient d’obtenir (estimateur du maximum de vraisemblance).

Page 20: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Log-vraisemblance

Difficulté b (1PL, N=500)

Illustration avec IRT-Lab- modèle à 1 paramètre- b théorique fixé à 1- simulation des réponses de N

individus- Calcul de la fonction du log de

vraisemblance pour b,- estimation ML de b (algorithme itératif

de Newton-Raphson permettant de trouver la valeur de b qui maximalise la fonction de log-vraisemblance).

Page 21: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

La fonction d’information de l’item et l’erreur-type d’estimation de θ" L’information apportée par un item est maximale lorsque sa difficulté correspond au niveau en trait latent du sujet." L’information apportée par un item est d’autant plus grande que la discrimination de l’item est élevée." L’erreur-type d’estimation de θ peut être calculée à partir de la fonction d’information de l’item:

" L’erreur-type dépend du nombre d’items utilisés, de la discrimination des items et de la bonne correspondance entre la difficulté de l’item et le niveau en trait latent du sujet.

)(1)ˆ(θ

=θI

SE

Page 22: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Illustration avec IRT-Lab - Modèle 2PL: a = 1.3; b = 1.5

infor

matio

n

Trait latent θ

Erreur-type d’estimation

Page 23: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Comparaison des règles de mesure de la TC et des MRI

Estimations non biaisées des propriétés de l’item: TC) nécessaire de disposer d’échantillons représentatifs; MRI) pas nécessaire.

Signification des scores: TC) comparaison à une norme de groupe; MRI) comparaison en termes de distance par rapport à des items.

Erreur-type de mesure : TC) la même pour tous les scores des sujets d’une population donnée;MRI) diffère d’un patron de réponse à l’autre mais généralisable.

Propriétés d’échelle d’intervalle: TC) en normalisant les scores ; MRI) en appliquant des modèles de mesure adaptés.

Page 24: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Les Modèles de Réponse à l’Item

Quelques programmes pouvant être employés pour estimer les paramètres des MRI pour données dichotomiques

BILOG-MG (1,2 ou 3 paramètres: métrique logistique et métrique normale)

XCALIBRE (2 ou 3 paramètres: métrique normale seulement)

MULTILOG (1,2 ou 3 paramètres: métrique logistique seulement)

Page 25: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

PLAN

1. Les Modèles de Réponse à l’Item2. L’analyse factorielle non linéaire de données

binaires3. Illustration: analyse de la structure interne d’un

questionnaire de désirabilité sociale

Page 26: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Quelles alternatives à l’analyse factorielle classique de données binaires ?

" Tradition factorielle# Approches strictement linéaires qui corrigent les effets de la difficulté des

items en utilisant les corrélations tétrachoriques.

Page 27: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Méthodes d’estimation des corrélations tétrachoriques

0 1 0 1

X1 X2

Corrélation calculée à partir des proportions observées

adbc

rtetra

+°=

1180cos

Une approximation :

(a: nombre de cellules ++, b: nbre de -+, c: nbre de +-, d: nbre de --)

Page 28: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Méthodes d’estimation des corrélations tétrachoriques (PRELIS)

Corrélation de Pearson estimée entre dimensions latentes continues

Y1 Y2Modèle de mesure avec

hypothèses qui en sous-tendent l’application

0 1 0 1

Le seuil (threshold) est la valeur qui discrétise la variable continue latente pourproduire la catégorisation observée.

Page 29: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

" MAIS :

- les matrices de corrélations tétrachoriques sont souvent singulières;- les ajustements sont souvent très importants pour les valeurs extrêmes de p;- les hypothèses de normalité et de linéarité sont parfois mal respectées;- l’analyse factorielle classique ne porte de toute façon que sur de l’information partielle (une corrélation est un résumé statistique).

Page 30: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Quelles alternatives à l’analyse factorielle classique de données binaires ?

" Tradition factorielle# Approches strictement linéaires qui corrigent les effets de la difficulté des

items en utilisant les corrélations tétrachoriques.# Approches linéaires « au sens large » qui apportent une solution au

problème de la dépendance entre items et à celui de l’hétérogénéité de la variance d’erreur.

Page 31: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

L’analyse factorielle à information semi-complète

" La démarche peut être exploratoire et/ou restrictive-confirmatoire

1) Le modèle multidimensionnel à ogive normale (estimation ULS sur NOHARM)

2) L’analyse factorielle basée sur les modèles structuraux (estimation WLS sur Mplus)

Page 32: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Le modèle multidimensionnel à ogive normale (NOHARM) - Modèle d’analyse en facteurs communs dans lequel les régressions sont des

fonctions linéaires des coefficients et des fonctions non linéaires des traits.- La fonction de régression est approximée par une série de termes polynomiaux

orthogonaux (analyse harmonique). L’approximation est généralement satisfaisante avec une série d’ordre 3 (4 coefficients).

- L’information analysée est la matrice des moments augmentés (matrice des scores bruts multipliée par sa transposée).

- La méthode d’estimation des paramètres de la série polynomiale est celle des moindres carrés non pondérés (ULS).

- L’évaluation de l’ajustement du modèle repose sur l’examen de la matrice des covariances résiduelles.

- Le programme fournit les estimations des seuils (ti) et des saturations des items sur les k facteurs (λ ik).

Page 33: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

L’analyse factorielle non linéaire basée sur les modèles structuraux (Mplus)

- Modèle d’analyse en facteurs communs qui prend en compte les dépendances entre items d’ordre supérieur à 2 (modèle non strictement linéaire).

- L’information analysée est constituée des seuils, des pentes et des corrélations résiduelles des items calculés par régression probit sur les variables latentes. La matrice de pondérations est une estimation de la matrice des variances et covariances asymptotiques.

- Les paramètres du modèle sont estimés par minimisation de la fonction d’ajustement des moindres carrés pondérés (WLS).

- Le programme fournit plusieurs indices permettant l’évaluation de l’ajustement du modèle.

- Les estimations des paramètres apparaissent de manière classique: seuils, saturations des items sur les k facteurs (λ ik).

Page 34: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

Quelles alternatives à l’analyse factorielle classique de données binaires ?

" Tradition factorielle# Approches strictement linéaires qui corrigent les effets de la difficulté des

items en utilisant les corrélations tétrachoriques.# Approches linéaires « au sens large » qui apportent une solution au

problème de la dépendance entre items et à celui de l’hétérogénéité de la variance d’erreur.

" Tradition des Modèles de Réponse à l’Item.# Approches non linéaires qui analysent l’ensemble des patrons de réponse

aux items.

Page 35: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

L’analyse factorielle à information complète (TESTFACT)- Analyse factorielle à information complète basée sur le MRI multidimensionnel à

ogive normale à 2 ou 3 paramètres. - Utilisation de la méthode du maximum de vraisemblance marginale (MML :

Marginal Maximum Likelihood) qui maximise la vraisemblance des paramètres des items (discrimination aj et difficulté bj pour les MRI2P, saturations des items sur les facteurs pour l’analyse factorielle) conditionnellement aux patrons de réponses observés. La solution itérative est basée sur l’algorithme de maximisation d’espérance (EM).

- Le programme fournit de nombreux indices permettant d’évaluer les propriétés métriques des items ainsi que l’ajustement du modèle.

- Les estimations des paramètres apparaissent à la fois dans la paramétrisation des MRI (pente a, seuil b, intercept –a/b) et dans celle de l’analyse factorielle (difficulté standardisée, communauté, saturation).

- Possibilité d’estimer les paramètres de modèles restrictifs bifactoriels.

Page 36: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

L’analyse factorielle non linéaire

L’estimation des scores factoriels (trait ou espace latent)

La distribution de probabilité a priori du trait Pr(θ) est la distribution -normale-choisie lors de l’estimation des paramètres du modèle.

La distribution de probabilité a posteriori pour un sujet donné:Pr(θ|patron de réponses, paramètres du modèle)

est approximée par intégration en divisant le continuum latent en un nombre fini k de niveaux discrets du trait latent (k-1 points de quadrature) ou de régions discrètes de l’espace latent.

Le score factoriel est l’espérance de la distribution de probabilité a posteriori des scores d’un sujet donné pour un patron de réponses donné et les estimations des paramètres du modèle (estimation par « Espérance A Posteriori »).

TH-SCORE

Page 37: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

PLAN

1. Les Modèles de Réponse à l’Item2. L’analyse factorielle non linéaire de données

binaires3. Illustration: analyse de la structure interne d’un

questionnaire de désirabilité sociale

Page 38: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

Analyses factorielles non linéaires du QDS22

Le questionnaire est composé de 22 items dichotomiques indexant deux composantes:« Illusion sur soi » ou AutoDuperie,« Gestion de l’impression » ou HétéroDuperie.

Le QDS22 est administré à 720 adultes lors d’un bilan de compétences.

Juhel, J. & G. Rouxel (à paraître). Effets du contexte d’évaluation sur les dimensions de la désirabilité sociale. Psychologie du Travail et des Organisations.

Page 39: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

Questionnaire de Désirabilité Sociale (QDS22) Type

1 Je suis parfois triste AD -2 Je respecte toujours la loi HD +3 Je doute parfois de mes capacités AD -4 Il peut m’arriver d’enfreindre la loi HD -5 Je me décourage parfois AD -6 Je suis toujours poli(e) HD +7 J’aimerais parfois être quelqu’un d’autre AD -8 Je suis toujours optimiste AD +9 Je me moque quelquefois des autres HD -10 Je me sens parfois seul(e) en groupe AD -11 Je suis toujours poli(e), même avec des gens désagréables HD +12 Je suis parfois inquiet(e) AD -13 J’ai quelques mauvaises habitudes HD -14 J’ai parfois l’impression qu’il y a une barrière entre moi et les autres AD -15 Je me tiens toujours bien à table HD +16 J’ai toujours confiance en mes jugements AD +17 Je dis toujours du bien d’autrui HD +18 Je m’adapte toujours aux situations nouvelles AD +19 Je tiens toujours ce que j’ai promis de faire HD +20 Je contrôle entièrement mon destin AD +21 Je suis parfois grossier(e) HD -22 Je suis toujours attentif(ve) quand on me parle HD +

Page 40: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

1.1. Analyses factorielles non linéaires exploratoires avec MplusFichier QDS22EFAModèle M1 à 1 facteur :

Chi-deux = 1035.929 ; ddl = 209 ; p = 0.000RMSEA (Root Mean Square Error of Approximation) : 0.074

Modèle M2 à 2 facteurs :Chi-deux = 543.209 ; ddl = 188 ; p = 0.000RMSEA : 0.051

Amélioration significative de l’ajustement de M2 par rapport à celui de M1 : Chi-deux partiel = 492.720 ; ddl = 21 ; p = 0.000

Page 41: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

Questionnaire de Désirabilité Sociale (QDS22) TypeF1 F2

1 Je suis parfois triste AD - 0,731 2 Je respecte toujours la loi HD + 0,9513 Je doute parfois de mes capacités AD - 0,824 4 Il peut m’arriver d’enfreindre la loi HD - 0,9525 Je me décourage parfois AD - 0,852 6 Je suis toujours poli(e) HD + 0,8677 J’aimerais parfois être quelqu’un d’autre AD - 0,698 8 Je suis toujours optimiste AD + 0,784 9 Je me moque quelquefois des autres HD - 0,50610 Je me sens parfois seul(e) en groupe AD - 0,736 11 Je suis toujours poli(e), même avec des gens désagréables HD + 0,63412 Je suis parfois inquiet(e) AD - 0,714 13 J’ai quelques mauvaises habitudes HD - 0,360 0,19514 J’ai parfois l’impression qu’il y a une barrière entre moi et les autres AD - 0,718 15 Je me tiens toujours bien à table HD + 0,60516 J’ai toujours confiance en mes jugements AD + 0,571 17 Je dis toujours du bien d’autrui HD + 0,491 0,27518 Je m’adapte toujours aux situations nouvelles AD + 0,541 19 Je tiens toujours ce que j’ai promis de faire HD + 0,391 0,38020 Je contrôle entièrement mon destin AD + 0,490 21 Je suis parfois grossier(e) HD - 0,64422 Je suis toujours attentif(ve) quand on me parle HD + 0,350

Rotation Promax

Saturations <0,20 non présentées

Page 42: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

1.2. Analyses factorielles non linéaires confirmatoires avec Mplus

Fichier QDS22CFAModèle restrictif à 2 facteurs AD et HD (structure du modèle M2 en fixant à 0 les saturations non présentées dans le tableau précédent):

Chi- deux = 412.947 ; ddl = 121 ; p = 0.000 ; RMSEA = 0.058

Fichier QDS22ORTModèle restrictif hiérarchique à 3 facteurs orthogonaux: 1 facteur général et 2 facteurs de groupe (AD d’une part, HD d’autre part)

Chi- deux = 314.112 ; ddl = 117 ; p = 0.000 ; RMSEA = 0.048

!Amélioration significative de l’ajustement du modèle hiérarchique par rapport à celui du modèle à 2 facteurs :

Chi-deux partiel = 98.835 ; ddl = 4 ; p = 0.000

Page 43: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

Questionnaire de Désirabilité Sociale (QDS22) Type DSG AD HD

1 Je suis parfois triste AD - 0,9732 Je respecte toujours la loi HD + 0,068 1,0003 Je doute parfois de mes capacités AD - 0,886 0,6004 Il peut m’arriver d’enfreindre la loi HD - 0,054 0,9525 Je me décourage parfois AD - 1,000 0,3456 Je suis toujours poli(e) HD + 0,499 0,7947 J’aimerais parfois être quelqu’un d’autre AD - 0,7898 Je suis toujours optimiste AD + 0,937 0,3639 Je me moque quelquefois des autres HD - 0,440 0,48610 Je me sens parfois seul(e) en groupe AD - 0,90111 Je suis toujours poli(e), même avec des gens désagréables HD + 0,379 0,58512 Je suis parfois inquiet(e) AD - 0,80913 J’ai quelques mauvaises habitudes HD - 0,542 0,20614 J’ai parfois l’impression qu’il y a une barrière entre moi et les autres AD - 0,92515 Je me tiens toujours bien à table HD + 0,291 0,58516 J’ai toujours confiance en mes jugements AD + 0,712 0,44317 Je dis toujours du bien d’autrui HD + 0,604 0,36618 Je m’adapte toujours aux situations nouvelles AD + 0,690 0,43019 Je tiens toujours ce que j’ai promis de faire HD + 0,320 0,853 0,37120 Je contrôle entièrement mon destin AD + 0,401 1,00021 Je suis parfois grossier(e) HD - 0,429 0,61322 Je suis toujours attentif(ve) quand on me parle HD + 0,474 0,348

Saturations des items pour le modèle restrictif hiérarchique à 3 facteurs orthogonaux

Page 44: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

2.1. Analyses factorielles à information complète exploratoiresavec TESTFACTFichier QDS22F1Modèle à 1 facteur :

Chi-deux = 7350.50 ; ddl = 675 ; p = 0.000Pourcentage de variance expliquée: 22.578

Fichier QDS22F2Modèle à 2 facteurs :

Chi-deux = 7016.28 ; ddl = 654 ; p = 0.000Pourcentage de variance expliquée: 32.897

Amélioration significative de l’ajustement du modèle à 2 facteurs par rapport à celui à 1 facteur :

Chi-deux partiel = 334.22 ; ddl = 21 ; p = 0.000

Page 45: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

2.2. Analyses factorielles à information complète confirmatoiresavec TESTFACTFichier QDS22HIEModèle restrictif hiérarchique à 3 facteurs orthogonaux: 1 facteur général et 2 facteurs de groupe (AD d’une part, HD d’autre part)

Chi-deux = 7269.34 ; ddl = 666 ; p = 0.000Pourcentage de variance expliquée: 32.5710

Page 46: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Structure interne du QDS22

3. Estimation des scores factoriels dans l’espace latent avec TH-SCOREFichier DS22DD1Valeurs des paramètres de discrimination et de difficulté fournies par TESTFACT (estimation EAP – SE: erreur-type).

Sujet 01 0 0 0 0 1 0 0 1 0 1 0 0 0 1 0 1 1 1 1 0 0 1Sujet 02 0 0 0 0 0 1 1 0 1 1 0 0 0 0 1 0 0 1 1 0 1 1Sujet 03 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1Sujet 04 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0 1 1 1 0 0Sujet 05 0 1 0 1 0 1 0 0 1 1 1 0 0 1 1 0 0 1 1 1 1 1Sujet 06 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1Sujet 07 0 1 0 1 0 1 1 0 1 0 1 0 0 1 1 0 0 1 1 1 1 1Sujet 08 1 1 0 1 0 1 1 1 1 1 0 0 1 0 1 1 1 1 1 1 1 1Sujet 09 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 0 1 0 0 0 0Sujet 10 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 0 0 1

0.4894 0.2867 -1.0874 -0.1697 -0.4315 -0.7579 -1.2646 -0.0289 0.9149 -0.7208 0.8111 -1.0001 0.5175 -0.1674 0.9130

-1.3436 -0.0037 -0.4412 0.4562 -0.1407 0.9190 0.8472 0.7120 0.8751 -0.7571 0.7997 -0.7526-0.9988 0.4406 0.2772

0.5686 0.8955 0.6526 0.7312 0.9086 0.4702 0.7142 0.9149 0.4911 0.2579 0.8370 0.6140 0.5434 0.8903 0.5582 0.7378 0.9182 0.6903 0.5957 0.8963 0.5612 0.3718 0.8605 0.5629 0.2366 0.8351 0.4799 0.5639 0.8787 0.7013

DSG AD HD DSG AD HDSE SE SE

Page 47: L’analyse factorielle non linéaire de données binaires

Séminaire LEACM-ISH, LESCOT-INRETS – Lyon, 4 mars 2004

Trait latent

Conclusions# Lorsqu’il s’agit d’effectuer une analyse factorielle de données

dichotomiques, les modèles multidimensionnels de réponse à l’item (MMRI) ou les modèles d’équations structurales (MES) sont à préférer aux méthodes classiques (comme celles disponibles sur SPSS, SAS ou Statistica).

# Les MMRI et les MES pour données dichotomiques sont formellementéquivalents mais éclairent de manière différente les problèmes de mesure auxquels le psychologue est susceptible d’être confronté.

# Les MES ne sont pas aussi intéressants que les MMRI au niveau de mesure des paramètres individuels; les MMRI sont moins aptes que les MES à modéliser les relations entre variables latentes et manifestes.

# Le modèle Mplus est sans doute aujourd’hui l’application la plus intégrée (et la plus facile d’emploi) de ces deux grandes approches.

# Le modèle Mplus peut aussi être appliqué à des données polychotomiques (PolyTESTFACT devrait être disponible courant 2004).