11. problèmes dendogénéité dans les estimations multi- niveaux des inégalités scolaires. tarek...
TRANSCRIPT
11
Problèmes d‘Endogénéité dans les Estimations Multi-
Niveaux des Inégalités Scolaires.
Tarek MOSTAFA
33
Les données PISA 2003.
Les données PISA de l’OCDE:
1 40 Pays, 5000 observations par pays.
2 Données internationales comparables.
3 L’échantillon est sélectionné en fonction de l’âge (15 à 16 ans).
4 Evaluation du savoir (à cet âge) et non pas de la maitrise d’un sujet particulier.
5 Richesse des données.
6 Structure en deux niveaux (étudiant, école).
7 En 2003, Domaine d’évaluation: Mathématiques.
4
Les données manquantes:
Types de manque:
1. Manque aléatoire.
2. Manque non-aléatoire.
3. Manque monotone.
Solutions:
1. Suppression des observations qui contiennent des données manquantes. Suppression de variables.
2. Traitement des valeurs manquantes comme une modalité (variables catégoriques).
3. Imputation ‘Hot Deck’.
4. Imputation par les moyennes.
5. Imputation par les régressions.
6. Imputations multiples.
5
Les variables.
Trois catégories de variables:
1. Variables individuelles.
2. Effets des pairs (agrégation des Variables individuelles au niveau de l’école).
3. Variables pures des écoles (Proxis du financement, environnement scolaire, etc.).
Choix selon la théorie économique de stratification ainsi que les études empiriques.
6
Modèles multi-niveaux.
Le modèle général.
•Avec: et
•Après développement:
ijjjijjjij KXXY 2110
jj 1
ijijjjjjijij XVKXXcY 21
jj Vc 0
7
Problèmes d’endogénéité.
1. Modèle 1: le modèle est estimé sans effets de pairs.
2. Modèle 2: le modèle est estimé sans les caractéristiques de l’école.
3. Modèle 3: estimation du modèle complet avec effets des pairs linéaires.
4. Modèle 4: estimation du modèle complet avec effets des pairs non linéaires (introduction de la variance du statut social des étudiant).
• Les 4 modèles sont estimé après une transformation selon Mundlak.
ijjjjijij VKXXcY 21
8
L’approche Mundlak.
ijjjjjjijjij wKKXXXXcYY )()()( 21
ijjjjijij VKXXcY 21
ijjjjijjij wKXXXcYY 21 )1())(1()(
j 221
bjw
wj
n
9
Identification et estimation.
• On régresse sur pour obtenir les Betas et les composantes de la variance.
• On régresse sur et pour obtenir .• On calcul les lambdas et leur moyenne puis les deltas.• On déduit la valeur de .
)( jij YY )( jij XX
jY jX jK 2̂
1̂
10
Les pays.
La Finlande. Le Royaume Uni. L’Allemagne.
11
Comparaisons entre modèles.
Le test d’Hausman:• Modèle 1 a échoué le test, modèles 2, 3 et 4 ont passé le test.• Le niveau du biais est différent selon les pays.
Les résultats du modèle 1 sont surestimés, certains coefficients dans le modèle 2 sont inconsistants.
Les résultats du rapport de l’OCDE PISA 2003 sont surestimés.
12
Variables Germany Finland UK
Coefficient Coefficient Coefficient
ESCS 17 33 31
INTMAT 10.2 30.5 13.6
DESCS 90 -2 58
DDISCL 18.6 10.4 24.7
Teacbeha -3.4 1.7 20.3
Scmatedu 11 0.2 13
Tcmorale 7.4 5 13.4
Private -66 5 -87
Private after controlling for ESCS and DESCS 14 16 1
Variables Germany Finland UK
Coefficient Coefficient Coefficient
ESCS 11,61 26,85 23,26
INTMAT 4,69 14,51 -1,16
DESCS 61,16 2,82 41,64
DDISCL 25,27 -0,43 10,08
Teacbeha -4,3 -1,47 -2,22
Scmatedu -0,07 0,08 2,34
Tcmorale 0,04 1,76 -1,61
Private -12,56 -18,37 22,75
Résultats OCDE vs. Multi-niveaux.
1313
Institute of EducationUniversity of London20 Bedford WayLondon WC1H 0AL
Tel +44 (0)20 7612 6000Fax +44 (0)20 7612 6126Email [email protected] www.ioe.ac.uk
Merci pour votre attention