inégalités scolaires, ségrégation et effets de pairs

224
THÈSE DE DOCTORAT En vue de l’obtention du grade de Docteur en sciences économiques de l’École des hautes études en sciences sociales École doctorale Économie Panthéon-Sorbonne Unité de recherche Paris-Jourdan Sciences Économiques Inégalités scolaires, ségrégation et effets de pairs Présentée par Arnaud Riegert et soutenue publiquement le 17 juin 2016 devant le jury composé de : M. Éric Maurin — Directeur de thèse Mme Catherine Moisan — Présidente du jury M. Laurent Davezies — Rapporteur Mme Pascaline Dupas — Rapporteure

Upload: nguyentuyen

Post on 05-Jan-2017

228 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Inégalités scolaires, ségrégation et effets de pairs

THÈSE DE DOCTORAT

En vue de l’obtention du grade deDocteur en sciences économiques

de l’École des hautes études en sciences sociales

École doctorale Économie Panthéon-SorbonneUnité de recherche Paris-Jourdan Sciences Économiques

Inégalités scolaires, ségrégation et effets de pairs

Présentée par

Arnaud Riegert

et soutenue publiquement le

17 juin 2016

devant le jury composé de :

M. Éric Maurin — Directeur de thèse

Mme Catherine Moisan — Présidente du jury

M. Laurent Davezies — Rapporteur

Mme Pascaline Dupas — Rapporteure

Page 2: Inégalités scolaires, ségrégation et effets de pairs
Page 3: Inégalités scolaires, ségrégation et effets de pairs

Remerciements

Je tiens en premier lieu à remercier Éric Maurin qui a joué un rôle central dans toute maformation en économie. Après avoir accepté de m’accueillir au master Politiques publiques etdéveloppement, en 2008, il a fortement encouragé la démarche d’évaluation du programme detutorat Talens qui a donné lieu au chapitre 1 de cette thèse. Après quelques errements acadé-miques, c’est encore lui qui m’a donné l’envie de venir terminer ma formation de recherche enéconomie et qui a accepté de diriger cette thèse. Il a été pour moi un directeur idéal, toujoursdisponible, de bon conseil tant sur les questions scientifiques que sur les nombreuses questionsque je me suis posées sur mon parcours personnel. J’ai beaucoup appris auprès de lui et je lui suisgrandement reconnaissant pour toute son aide.

J’ai la très grande chance de travailler avec Son Thierry Ly depuis dix ans sur des projets trèsvariés, dont l’ensemble des chapitres de cette thèse. Au-delà de notre passion commune pour lessujets liés à l’éducation et la réduction des inégalités, nous avons su trouver un équilibre quasiparfait entre similarités et complémentarité, qui nous permet de nous comprendre rapidementet de nous répartir le travail efficacement. C’est un plaisir permanent de travailler avec Thierry,de profiter de sa créativité débordante et de son enthousiasme à toute épreuve. Je le remerciepour ces années de collaborations qui sont loin d’être terminées, mais aussi pour son amitié etson soutien dans les moments de doute.

i

Page 4: Inégalités scolaires, ségrégation et effets de pairs

ii

Je remercie vivement Laurent Davezies et Pascaline Dupas pour leurs remarques et sugges-tions sur les travaux présentés dans cette thèse, en particulier sur le chapitre 1 dont ils ont été lespremiers lecteurs. Merci à eux d’avoir accepté d’être les rapporteurs de cette thèse.

Tous les chapitres de cette thèse reposent sur des bases de données d’une qualité exception-nelle produites par la Direction de l’évaluation, de la prospective et de la performance (Depp)au Ministère de l’Éducation nationale. Je tiens à remercier Catherine Moisan, qui a permis etencouragé les collaborations entre la Depp et les chercheurs et qui a accepté d’être présidentede mon jury de thèse. Un grand merci également à Cédric Afsa, Olivier Monso, Fabrice Mu-rat avec qui j’ai eu de nombreux échanges très enrichissants, à Caroline Simonis-Sueur ainsiqu’à toutes les personnes qui constituent, nettoient et documentent en permanence les bases dedonnées Scolarité et Océan, à la Depp et dans les service statistiques académiques.

Je remercie les très nombreux acteurs de l’éducation avec lesquels j’ai eu l’occasion d’échangerces dernières années sur de nombreux sujets, qu’ils s’agisse des équipes pédagogiques et admi-nistratives des établissements, des associations d’éducation populaire, des membres de l’admi-nistration centrale et des rectorats, de l’ESENESR, de Canopé, des collectivités territoriales oudes cabinets ministériels. Je remercie particulièrement Anne-Christine Lang et l’unité lycées duConseil régionale d’Île-de-France, Bénédicte Robert et l’équipe du DRDIE, ainsi qu’OlivierNoblecourt et le cabinet de Najat Vallaud-Belkacem.

J’ai également beaucoup collaboré avec le Conseil national d’évaluation du système scolaire,notamment dans le cadre du chapitre 3 de cette thèse. Je remercie très chaleureusement NathalieMons avec qui nous avons eu de nombreux échanges qui ont permis de beaucoup améliorer cetétat des lieux de la ségrégation dans les collèges et lycées français, ainsi que toute son équipe dechoc qui nous a aidé à produire et à diffuser cette étude à un large public : Sadiya Barkouss,Amandine Blanchard-Schneider, Thibault Coudroy, Arnaud Galinié, Adeline Gubler,Emily Helmeid et plus particulièrement Arthur Heim. Ils ont fait et continuent à faire untravail remarquable que je tiens à saluer.

J’ai eu le plaisir d’effectuer toute ma formation en économie à l’École d’économie de Paris,

Page 5: Inégalités scolaires, ségrégation et effets de pairs

iii

d’abord dans le master Politiques publiques et développement puis dans le programme doctoralAnalyse et politique économiques, puis d’y enseigner depuis 2015. J’y ai découvert avec beau-coup d’intérêt les méthodes empiriques appliquées à l’économie grâce à des cours de très grandequalité. Je tiens à remercier l’ensemble des professeurs du master, et tout particulièrement LucBehaghel, Thomas Breda, Denis Cogneau, Julien Grenet, Marc Gurgand, Sylvie Lam-bert, Thomas Piketty et bien entendu Éric Maurin. Merci également à mes camarades demaster et de doctorat, en particulier Camille Terrier et Asma Benhenda avec qui j’ai pu beau-coup échanger sur les sujets liés à l’éducation, ainsi qu’aux participants du séminaire d’économieappliquée. Je remercie enfin les équipes administratives pour leur efficacité et leur disponibilité,notamment Caroline Bauer, Marie Font, Véronique Guillotin, Béatrice Havet, DamienHerpe, Weronika Leduc, Pauline Marmin, Marie-Christine Paoletti, Marie Philippon,Sylvain Riffé Stern et Anaelle Six, ainsi que France Artois-Mbaye à l’EHESS.

Merci aux personnes avec qui j’ai eu la chance de travailler lors du stage très enrichissantque j’ai effectué au fonds d’expérimentation pour la jeunesse et qui m’ont beaucoup appris : Jean-Benoît Dujol, Étienne Grass, Malika Kacimi, Jérôme Teillard, Marie-Automne Thépot,Mathieu Valdenaire et Augustin Vicard. Je remercie notamment Martin Hirsch pour sagrande disponibilité, ses conseils et ses encouragements.

Je remercie également mes collègues de l’Insee et du Crest, en particulier Malik Koubi etCorinne Prost pour la confiance qu’ils m’ont accordée dans le choix des sujets des études quej’ai menées à l’Insee, qui m’ont permis d’avancer simultanément sur ma thèse. Je les remercienotamment pour leurs suggestions qui ont permis de beaucoup améliorer le chapitre 4 de cettethèse. J’adresse également des remerciements particuliers à Xavier d’Haultfœuille qui m’a ac-cueilli au laboratoire de microéconomie du Crest, à Roland Rathelot avec qui nous avons puéchanger sur les aspects statistiques de la mesure de la ségrégation et à Alain Trognon qui en-cadre la formation complémentaire décalée et m’a permis de terminer ma thèse tout en débutantun projet entrepreneurial.

Le chapitre 1 de cette thèse repose sur l’investissement des très nombreux acteurs du pro-gramme Talens de l’ENS. Je voudrais remercier ici l’équipe surmotivée qui le fait vivre depuis

Page 6: Inégalités scolaires, ségrégation et effets de pairs

iv

10 ans : Claire Scotton, Son Thierry Ly (encore lui !), Marie Darrason, Gwenaël Roudaut,Muy-Cheng Peich, Adeline Pautrizel, Claire Ripault-Blandin, Pauline Rolland, Quen-tin Louisiade, Matthieu Baillergeau, Tiphaine Malasevic ; les membres de la directionde l’ENS qui l’ont soutenu, notamment Véronique Prouvost, Sophie Fermigier et OlivierAbillon ; les générations de tuteurs, élèves, enseignants, CPE et proviseurs qui ont cru au pro-jet. Merci aux nombreux tuteurs qui se sont investis dans les bureaux de l’association ou auprèsdu pôle PESU au-delà des séances de tutorat pour assurer sa pérennité, en particulier ces der-nières années Marie Huet, Claire Colard et « les chimistes » que je me permets de désignercollectivement.

Ceux qui me connaissent savent que je suis très facilement distrait par les nouveaux projets,et j’ai du compter sur un noyau dur de proches pour persévérer jusqu’au bout de cette thèse. Jevoudrais donc remercier mes parents et mes amis qui m’ont soutenu et encouragé lors de toutesmes hésitations, ceux qui m’ont changé les idées et ceux qui ont entretenu ma passion pour lessujets liés à l’éducation et aux inégalités. Je pense notamment aux amis de Bibliothèques SansFrontières qui font des choses exceptionnelles et que je suis heureux de retrouver régulièrement,et bien entendu à mes associés de Gryzz-Lab : Frédéric Fourcade, Hai Ly, Son Thierry Ly (tou-jours lui !) et Adeline Pautrizel, avec qui nous avons lancé une nouvelle aventure passionnante,et tous les collègues qui nous ont rejoint depuis.

Enfin, merci à Muy-Cheng pour tout ce qu’elle a fait pour moi et que je ne saurais énumérer.

Page 7: Inégalités scolaires, ségrégation et effets de pairs
Page 8: Inégalités scolaires, ségrégation et effets de pairs
Page 9: Inégalités scolaires, ségrégation et effets de pairs

vii

Résumé

Cette thèse porte sur les enjeux de mixité dans l’institution scolaire en illustrant troisproblématiques.

La première est celle de l’égalité des chances : comment promouvoir la mixité dans l’en-seignement supérieur quand l’enseignement secondaire est lui-même ségregé ? À l’aide d’uneexpérimentation aléatoire, nous évaluons l’impact d’un programme de tutorat visant à pro-mouvoir l’accès aux filières d’excellence du supérieur pour des lycées issus de milieux popu-laires et montrons que ces dispositifs peuvent se heurter à des difficultés, notamment face auxélèves de niveau moyen, au risque de creuser les inégalités dans les lycées plus défavorisés.

La deuxième problématique est celle de l’influence des pairs : des modifications dansl’environnement social des élèves peuvent-elles avoir un effet sur la scolarité des jeunes ?Nous exploitons ici une expérience naturelle qui se produit en France lors de la transitioncollège-lycée, où nous montrons qu’un petit pourcentage d’élèves est affecté aléatoirementà sa classe de seconde. L’observation des trajectoires scolaires montre que les élèves fragilesqui retrouvent très peu de camarades de troisième dans leur classe de seconde sont plussusceptibles de redoubler et ont une probabilité moindre d’obtenir le baccalauréat.

La troisième problématique est celle de la ségrégation : dans quelle mesure les élèvesfréquentent-ils des environnements sociaux différents en fonction de leurs caractéristiquespersonnelles ? Nous effectuons ici une analyse statistique détaillée qui permet de quantifierl’ampleur de la ségrégation sociale et scolaire, entre les établissements scolaires et entre lesclasses au sein de ceux-ci.

Mots-clés : éducation, inégalités, ségrégation, effets de pairsClassification JEL : I24, D63

Page 10: Inégalités scolaires, ségrégation et effets de pairs
Page 11: Inégalités scolaires, ségrégation et effets de pairs

ix

Abstract

This thesis examines three issues in relation with diversity in the educational system.The first issue focuses on equal opportunities: how may we promote diversity in higher

education when secondary education is segregated? We implemented a random experimentin order to evaluate the impact of a tutoring program that aims at encouraging underprivi-leged high school students to enroll into the most selective tracks of higher education. Weshow that such programs may face difficulties, especially when dealing with mid-level stu-dents, which may lead to a risk of increased inequality in underprivileged high schools.

The second issue is the influence of the peer group: may modifications in the socialenvironment of high school students have an effect on their subsequent education? Weexploit a natural experiment occuring in France whereby a small fraction of 10th gradestudents are randomly allocated to their classes. We find that the most fragile studentswho end up in classes where they meet very few former classmates from 9th grade are moreenclined to repeat the grade and have a lower probability of graduating high school.

The third issue is segregation: to what extent to students experience different socialenvironments in their classes or schools depending on their individual characteristics? Weprovide a detailed statistical analysis which allows us to measure quantitatively the extentof social and academic segregation between schools and between the classes within thoseschools.

Keywords: education, inequality, segregation, peer effectsJEL classification: I24, D63

Page 12: Inégalités scolaires, ségrégation et effets de pairs
Page 13: Inégalités scolaires, ségrégation et effets de pairs

Tabledesmatières

Remerciements i

Résumé et mots-clefs vii

Abstract and keywords ix

Table des matières xi

Table des figures xvii

Liste des tableaux xxi

Introduction 1L’évaluation du programme Talens . . . . . . . . . . . . . . . . . . . . . . . . . . . 2Le rôle des anciens camarades de classe . . . . . . . . . . . . . . . . . . . . . . . . . 6L’état des lieux de la ségrégation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9La mesure de la ségrégation dans la durée . . . . . . . . . . . . . . . . . . . . . . . 14

1 Elite Tutors and Underprivileged High-School Students 19avec Son Thierry Ly et Éric Maurin

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.2 The experiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

xi

Page 14: Inégalités scolaires, ségrégation et effets de pairs

xii TABLE DES MATIÈRES

1.2.1 Institutional context . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.2.2 The program and its objectives . . . . . . . . . . . . . . . . . . . . . . 241.2.3 Identification of volunteers . . . . . . . . . . . . . . . . . . . . . . . . 251.2.4 Random selection of eligible students . . . . . . . . . . . . . . . . . . 261.2.5 Program content, tutors and take up . . . . . . . . . . . . . . . . . . . 29

1.3 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.4 Effects on achievement and choices . . . . . . . . . . . . . . . . . . . . . . . . 33

1.4.1 Effects on high school achievement . . . . . . . . . . . . . . . . . . . . 331.4.2 Effects on access to selective undergraduate programs . . . . . . . . . . 36

1.5 Mechanisms: the role of tutors and peers . . . . . . . . . . . . . . . . . . . . . 391.5.1 Tutors’ characteristics . . . . . . . . . . . . . . . . . . . . . . . . . . . 391.5.2 Peer group influence . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421.7 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441.A Additional tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2 Persistent Classmates: How Familiarity with Peers Protects from Disruptive SchoolTransitions 55

avec Son Thierry Ly

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562.2 Institutional context and data . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

2.2.1 The high school curriculum in France . . . . . . . . . . . . . . . . . . 602.2.2 The class-assignment mechanism . . . . . . . . . . . . . . . . . . . . . 642.2.3 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

2.3 Identification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682.3.1 Definition of similar-file groups . . . . . . . . . . . . . . . . . . . . . 712.3.2 Empirical evidence of random assignment . . . . . . . . . . . . . . . . 732.3.3 Description of the SF sample . . . . . . . . . . . . . . . . . . . . . . . 79

2.4 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 792.4.1 Freshman-year class characteristics and achievement . . . . . . . . . . . 792.4.2 The protective role of familiarity with classmates . . . . . . . . . . . . . 83

2.5 Robustness checks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

Page 15: Inégalités scolaires, ségrégation et effets de pairs

TABLE DES MATIÈRES xiii

2.5.1 Alternative SF group specifications . . . . . . . . . . . . . . . . . . . 892.5.2 Estimation based on the impact of SF student allocation on their class-

mates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 912.6 Discussion and conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 972.7 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 992.A Additional tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

3 La ségrégation sociale et scolaire en France : un état des lieux quantitatif 107avec Son Thierry Ly

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1073.2 Méthodologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

3.2.1 Comment mesurer la ségrégation ? . . . . . . . . . . . . . . . . . . . . 1113.2.2 L’indice d’exposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1163.2.3 Les données mobilisées . . . . . . . . . . . . . . . . . . . . . . . . . . 117

3.3 La ségrégation sociale et scolaire entre les établissements . . . . . . . . . . . . . 1183.3.1 Au niveau national . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1183.3.2 Disparités géographiques . . . . . . . . . . . . . . . . . . . . . . . . . 122

3.4 La ségrégation sociale et scolaire entre les classes de chaque établissement . . . . 1253.4.1 Analyse macroscopique . . . . . . . . . . . . . . . . . . . . . . . . . . 1283.4.2 Mieux mesurer la ségrégation intra-établissement . . . . . . . . . . . . 1313.4.3 Le rôle des langues et des options . . . . . . . . . . . . . . . . . . . . . 136

3.5 Évolution de la ségrégation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1463.6 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1473.A Les indices de ségrégation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

3.A.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1493.A.2 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

3.B Mesures alternatives de la ségrégation . . . . . . . . . . . . . . . . . . . . . . . 153

4 Measuring Social Environment Mobility 159avec Son Thierry Ly

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

Page 16: Inégalités scolaires, ségrégation et effets de pairs

xiv TABLE DES MATIÈRES

4.2 Literature review . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1624.2.1 Measuring income inequality . . . . . . . . . . . . . . . . . . . . . . . 1624.2.2 The equalizing force of income mobility . . . . . . . . . . . . . . . . . 1644.2.3 Measuring segregation . . . . . . . . . . . . . . . . . . . . . . . . . . 169

4.3 Social environment mobility . . . . . . . . . . . . . . . . . . . . . . . . . . . 1734.3.1 Breaking out of the clusters . . . . . . . . . . . . . . . . . . . . . . . . 1734.3.2 The limited equalizing force of social environment mobility . . . . . . . 1784.3.3 Dealing with attrition . . . . . . . . . . . . . . . . . . . . . . . . . . . 1814.3.4 Nested levels of clustering . . . . . . . . . . . . . . . . . . . . . . . . 184

4.4 Case study: SEM in French middle schools . . . . . . . . . . . . . . . . . . . 1874.5 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1904.A Mathematical proofs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

4.A.1 Equivalence of the two definitions of the Gini index . . . . . . . . . . . 1924.A.2 Normalization of the exposure index . . . . . . . . . . . . . . . . . . . 1934.A.3 Normalized exposure is equal to the exposure gap . . . . . . . . . . . . 1944.A.4 Upper envelope of the Lorenz curve of lifetime social environments . . . 196

Page 17: Inégalités scolaires, ségrégation et effets de pairs
Page 18: Inégalités scolaires, ségrégation et effets de pairs
Page 19: Inégalités scolaires, ségrégation et effets de pairs

Tabledesfigures

2.1 Composition of the typical classroom from a non-repeating student’s point ofview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.2 Class assignment of similar-file students . . . . . . . . . . . . . . . . . . . . 70

3.1 Ségrégation sociale et scolaire inter-établissements au niveau national . . . . . 1193.2 Carte de la ségrégation sociale inter-établissements en classe de troisième . . . 1243.3 Carte de la ségrégation scolaire inter-établissements en classe de troisième . . 1253.4 Ségrégation scolaire entre établissements au niveau troisième par académie . . 1263.5 Corrélation entre la ségrégation sociale et la ségrégation scolaire . . . . . . . . 1273.6 Ségrégation sociale et scolaire inter- et intra-établissement au niveau national . 1293.7 Carte de la ségrégation sociale totale en classe de troisième . . . . . . . . . . 1323.8 Carte de la ségrégation scolaire totale en classe de troisième . . . . . . . . . . 1333.9 Ségrégation scolaire entre classes au niveau troisième par académie . . . . . . 1343.10 Évolution de la ségrégation en sixième . . . . . . . . . . . . . . . . . . . . . 1423.11 Évolution de la ségrégation en troisième . . . . . . . . . . . . . . . . . . . . 1433.12 Évolution de la ségrégation en seconde . . . . . . . . . . . . . . . . . . . . . 1443.B.1 Indice d’exposition mesuré sur les élèves CSP- ou en retard scolaire . . . . . . 1543.B.2 Indice de dissimilarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1553.B.3 Indice de Theil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

xvii

Page 20: Inégalités scolaires, ségrégation et effets de pairs

xviii Table des figures

4.1 The Lorenz curve for income inequality . . . . . . . . . . . . . . . . . . . . 1634.2 A social network graph with interactions in clusters . . . . . . . . . . . . . . 1714.3 Segregation between upper class (full circles) and middle or lower class (plain

circles) students. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1734.4 Social environment mobility in the case of school segregation . . . . . . . . . 1744.5 The Lorenz curve for social environments . . . . . . . . . . . . . . . . . . . 1774.6 The upper envelope of lifetime social environment Lorenz curves . . . . . . . 1804.7 Attrition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1824.8 Normalized exposure in French middle schools, cohort 2009 . . . . . . . . . 188

Page 21: Inégalités scolaires, ségrégation et effets de pairs
Page 22: Inégalités scolaires, ségrégation et effets de pairs
Page 23: Inégalités scolaires, ségrégation et effets de pairs

Listedestableaux

1.1 The characteristics of students who volunteer to participate in the program . . 26

1.2 Take up rates, by cohort and ability group . . . . . . . . . . . . . . . . . . . 30

1.3 The effect of the treatment on performance on high school exit examinations . 34

1.4 The effect of the treatment on access to selective undergraduate programs(CPGE) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.5 The effect of tutor and assigned peers characteristics on grade 11 achievement 41

1.A.1 Balancing test on the baseline survey . . . . . . . . . . . . . . . . . . . . . . 47

1.A.2 Balancing test on the sample of volunteer students . . . . . . . . . . . . . . . 48

1.A.3 The effect of the treatment on performance on high school exit examinations,by cohort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

1.A.4 The effect of the treatment on performance on high school exit examinations,by track . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

1.A.5 The effect of the treatment on scores at the Baccalauréat in the scientific track . 51

1.A.6 The effect of the treatment on scores at the Baccalauréat in the non scientifictracks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.1 Descriptive statistics on students’ characteristics . . . . . . . . . . . . . . . . 69

2.2 Student’s class characteristics regressed on own anonymous exam score: Evi-dence of the random assignment of similar-file students . . . . . . . . . . . . 75

xxi

Page 24: Inégalités scolaires, ségrégation et effets de pairs

xxii Liste des tableaux

2.3 Student’s class characteristics regressed on behavior score: Evidence of therandom assignment of similar-file students . . . . . . . . . . . . . . . . . . . 78

2.4 Effect of class characteristics on high school outcomes . . . . . . . . . . . . . 812.5 Effect of persistent classmates on high school outcomes with and without con-

trolling for other class characteristics . . . . . . . . . . . . . . . . . . . . . . 842.6 Distribution of the PC effect . . . . . . . . . . . . . . . . . . . . . . . . . . 862.7 Which peers do matter? Decomposition of the PC effect on students at risk. . 902.8 Robustness check: effect of PC on low-ability students’ repetition rate using

different specifications of the SF fixed effect . . . . . . . . . . . . . . . . . . 922.9 IV exogeneity test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 952.10 Effect of PC on high school outcomes using the IV strategy . . . . . . . . . . 962.A.1 Student’s class characteristics regressed on own anonymous exam score : Evi-

dence of the random assignment of similar-file students . . . . . . . . . . . . 1022.A.2 Anonymous exam score regressed on class characteristics : Evidence of the

random assignment of similar-file students . . . . . . . . . . . . . . . . . . . 1032.A.3 Raw correlation between class characteristics and high school outcomes . . . . 1042.A.4 Effect of class characteristics on high school outcomes for the sample ”at risk” 105

3.1 Classification des PCS de la DEPP . . . . . . . . . . . . . . . . . . . . . . . 114

Page 25: Inégalités scolaires, ségrégation et effets de pairs
Page 26: Inégalités scolaires, ségrégation et effets de pairs
Page 27: Inégalités scolaires, ségrégation et effets de pairs

Introduction

Cette thèse porte sur les enjeux de mixité dans l’institution scolaire. Elle illustre trois problé-matiques qui se posent dans une démarche de recherche de mixité sociale ou scolaire à l’école.

La première problématique est celle de la promotion de l’égalité des chances : comment peut-on promouvoir la mixité dans l’enseignement supérieur quand l’enseignement secondaire est lui-même ségregé ? À l’aide d’une expérimentation par assignation aléatoire, nous évaluons l’impactd’un programme de tutorat visant à promouvoir l’accès aux filières d’excellence du supérieur pourdes lycées issus de milieux populaires et montrons que ces dispositifs peuvent se heurter à desdifficultés, notamment face aux élèves de niveau moyen, au risque de creuser les inégalités dansles lycées plus défavorisés.

La deuxième problématique est celle de l’influence des pairs : des modifications dans l’envi-ronnement social des élèves peuvent-elles avoir un effet sur la scolarité des jeunes, même à unstade avancé ? Nous exploitons ici une expérience naturelle qui se produit en France lors de latransition collège-lycée, où nous montrons qu’un petit pourcentage d’élèves est affecté aléatoire-ment à sa classe de seconde. L’observation des trajectoires scolaires montre notamment que lesélèves fragiles qui retrouvent très peu de camarades de troisième dans leur classe de seconde sontplus susceptibles de redoubler cette classe et ont une probabilité moindre d’obtenir le baccalau-réat.

1

Page 28: Inégalités scolaires, ségrégation et effets de pairs

Introduction

La troisième problématique est celle de la ségrégation : dans quelle mesure les élèvesfréquentent-ils des environnements sociaux différents, dans leur classe ou dans leur établisse-ment, en fonction de leurs caractéristiques personnelles ? Nous effectuons ici une analyse statis-tique détaillée qui permet de quantifier l’ampleur de la ségrégation sociale et scolaire, entre lesétablissements scolaires et entre les classes au sein de ceux-ci. Nous introduisons également unoutil qui permet de mesurer la diversité des environnement sociaux fréquentés par un élève aucours de sa scolarité.

Ces sujets sont inspirés par des expériences de terrain et des rencontres avec différents acteursde l’Éducation nationale. Ils ont donné lieu aux quatre chapitres de cette thèse, dont le contenuest difficilement accessible aux lecteurs non-spécialistes en économétrie et en statistiques. Lesrésumés ci-dessous ont pour but d’en expliquer les résultats importants et les grands principesde la méthodologie employée, en évitant autant que possible un trop grande technicité.

L’évaluationduprogrammeTalens

Le chapitre 1 évalue l’impact du programme de tutorat Talens, créé à l’École normale supé-rieure en 2006 sous la forme d’une association étudiante et repris par la direction de l’École en2010 afin de le pérenniser. Au moment de cette reprise, le principe a été posé d’évaluer rigou-reusement son impact sur les bénéficiaires du programme, notamment en termes de résultatsscolaires et d’orientation.

Cette évaluation a été rendue possible par un financement du fonds d’expérimentation pourla jeunesse, qui a permis d’augmenter temporairement la capacité du dispositif pour accueillir220 élèves en septembre 2010, afin d’atteindre une taille d’échantillon suffisante pour permettreles analyses statistiques. Elle était motivée par la forte montée en charge, en 2008, des dispositifsde type « cordées de la réussite » qui mettent en relation des élèves des formations sélectives dusupérieur avec des lycéens et collégiens de milieux populaires pour favoriser leur accès à l’ensei-gnement supérieur et notamment aux filières d’excellence. Outre l’investissement bénévole destuteurs des « têtes de cordées », ces dispositifs reposent essentiellement sur des financements pu-blics, et la question de leur efficacité se pose, notamment en comparaison à d’autres dispositifs

2

Page 29: Inégalités scolaires, ségrégation et effets de pairs

L’évaluation du programme Talens

d’accompagnement. Or, il n’existait aucune évaluation quantitative rigoureuse de l’impact de cesdispositifs.

La méthode utilisée pour cette évaluation est celle de l’assignation aléatoire, qui consiste àtirer au sort les bénéficiaires du programme parmi les volontaires, pour comparer ensuite les ré-sultats des élèves sélectionnés (groupe « test » ou « de traitement ») et non-sélectionnés (groupe« témoin » ou « de contrôle »). Cette méthode, souvent utilisée pour les tests cliniques et populari-sée en économie – notamment du développement – par Esther Duflo, permet de s’assurer que lacomparaison des résultats (notes obtenues, orientation, etc.) porte sur des groupes comparables :si la taille d’échantillon est suffisante, les deux groupes auront des compositions similaires danstoutes les dimensions, qu’elles soient observables ou non. Par exemple, nous avons pu vérifier queles notes du brevet et de seconde, les professions des parents et d’autres caractéristiques étaientbien équilibrées entre les deux groupes ; mais la méthode de tirage au sort permet aussi de s’as-surer que les groupes sont similaires, en moyenne, sur des caractéristiques non observées tellesque la motivation ou la curiosité. Ces caractéristiques non observées sont susceptibles d’être liéesaux résultats scolaires et il est donc important que les deux groupes comparés soient similairessur ces points. Il s’agit là d’un avantage important de la méthode de l’assignation aléatoire parrapport aux méthodes où un groupe de contrôle est constitué à partir d’élèves similaires selon descaractéristiques observables et mesurables uniquement.

Cette méthode est encore peu utilisée, notamment en France, pour évaluer l’impact d’un dis-positif expérimental ou d’une politique publique, car elle peut impliquer une logistique complexeet peut poser des questions éthiques de rupture d’égalité. Une des missions du fonds d’expéri-mentation pour la jeunesse était précisément de faire la pédagogie de cet outil d’évaluation et dediffuser les bonnes pratiques. Le principe fondamental est que cette rupture d’égalité entre lesdeux groupes doit être temporaire et ne doit pas priver une partie de l’échantillon des dispositifsde droit commun. Une assignation aléatoire est particulièrement adaptée lorsque le dispositif àévaluer fait face à un excès de demande et qu’une sélection est nécessaire. En ce qui concerne leprogramme Talens, le nombre de volontaires a systématiquement dépassé la capacité d’accueildu programme ; avant l’expérimentation, la sélection se faisait en lien avec les enseignants et surla base d’entretiens pour mesurer la motivation des élèves. Cette sélection avait cependant un

3

Page 30: Inégalités scolaires, ségrégation et effets de pairs

Introduction

côté arbitraire et parfois difficile à expliquer aux élèves non retenus. Pour ces raisons, le principedu tirage au sort a été globalement bien accepté par les lycées partenaires.

Le programme Talens commence à la fin de l’été qui précède l’entrée en première, avec unesemaine de « campus » à l’École normale supérieure à laquelle tous les élèves sélectionnés sontconviés. Les tuteurs volontaires organisent des activités pour préparer la rentrée scolaire et acqué-rir des méthodes de travail efficaces et des animations ont lieu le soir pour renforcer la cohésiondu groupe. En septembre, les élèves choisissent un thème de tutorat (sciences, sciences humainesou littérature) et sont affectés à des groupes de tutorat. Chaque groupe contient six lycéens et untuteur de l’ENS, et ils se retrouvent toutes les deux à trois semaines pour des séances de tutoratdont les objectifs sont de faire découvrir le fonctionnement de l’enseignement supérieur et de lespréparer aux attentes académiques des différentes filières. Cet accompagnement dure pendanttoute l’année de première et, pour ceux qui souhaitent poursuivre, toute l’année de terminale.

Nous avons comparé les résultats obtenus au baccalauréat par les bénéficiaires du programmeavec ceux des élèves qui s’étaient portés volontaires mais n’avaient pas été retenus par le tirageau sort. La comparaison montre une différence de moyennes proche de zéro, c’est-à-dire quel’impact du programme sur les notes obtenues au baccalauréat, que ce soit en fin de premièreou sur la note finale de terminale n’est pas statistiquement significatif. En d’autres termes, leprogramme n’a pas contribué à augmenter les résultats des élèves bénéficiaires au baccalauréat.

Un second objectif du programme était d’augmenter les ambitions des lycéens et de les en-courager à postuler à des formations sélectives. Nous avons donc comparé les taux d’accès auxClasses Préparatoires aux Grandes Écoles (CPGE), formations de deux ans qui mènent auxécoles les plus sélectives et par lesquelles sont passés la plupart des tuteurs de l’ENS. Là encore,la différence entre les deux groupes est non significative, c’est-à-dire que le programme n’a pas eud’impact sur le taux d’accès en CPGE. La différence reste nulle pour le taux d’accès en deuxièmeannée de CPGE, c’est-à-dire qu’il n’y a pas non plus d’impact sur le risque d’abandon en coursde première année de CPGE.

Ces résultats peuvent être surprenants : des élèves motivés et volontaires qui passent une

4

Page 31: Inégalités scolaires, ségrégation et effets de pairs

L’évaluation du programme Talens

partie de leurs samedis après-midis à suivre des séances de tutorat auprès d’élèves de l’ENS nevoient pas leurs notes progresser et ne s’orientent pas plus vers les CPGE que leurs camaradesqui n’ont pas pu bénéficier du programme. Pour mieux les comprendre, nous avons reproduitl’analyse pour deux sous-groupes de l’échantillon, en fonction des notes obtenues en seconde.Nous constatons alors que l’impact du programme de tutorat a été très positif sur la moitié desélèves ayant obtenu les moyennes générales de seconde les plus élevées, alors qu’il a été trèsnégatif sur la moitié des élèves ayant obtenu les moyennes générales de seconde les plus basses.Au final, les inégalités entre ces deux groupes ont été creusées par le programme Talens, qui a euun effet de stimulation sur les élèves les plus solides et un effet déprimant sur les plus fragiles.

Nous avons conduit en 2016 une enquête auprès des anciens bénéficiaires pour tenter d’éclai-rer les raisons de cet effet négatif. La première hypothèse était que le programme a un effetdécourageant sur les élèves les plus fragiles, en leur faisant prendre conscience des difficultés quiles attend dans l’enseignement supérieur ; cette hypothèse n’est pas confirmée par l’enquête, quimontre que les élèves ont pour la plupart trouvé leurs tuteurs compréhensibles et pédagogues, ycompris parmi les élèves les plus fragiles. La deuxième hypothèse était que le programme prenaittrop de temps aux élèves, qui avaient en conséquence moins de temps pour réviser leurs cours eteffectuer leurs devoirs. Le programme était en effet coûteux en temps, si on cumule la durée desséances elles-mêmes, les temps de transport et le temps passé avec les amis d’autres lycées ren-contrés dans le cadre du tutorat. L’enquête confirme que beaucoup d’élèves, notamment parmiles plus fragiles, estimaient que le programme prenait beaucoup de temps et avait une incidencenégative sur leur travail scolaire (le contenu des séances de tutorat n’étant pas directement lié auprogramme de lycée).

Les résultats de cette étude doivent permettre d’ouvrir le débat sur l’efficacité des « cordéesde la réussite ». L’évaluation montre que des élèves peuvent se porter volontaires pour une pré-paration à l’enseignement supérieur et être impactés négativement sur leurs résultats scolaires.L’enquête menée sur les anciens bénéficiaires suggère par ailleurs que cet effet négatif n’est pasuniquement le fait du contenu particulièrement académique du programme Talens en compa-raison avec les autres cordées. La réflexion doit donc s’ouvrir parmi les établissements porteursde tels projets de leur impact sur chaque profil d’élève, ainsi qu’aux implications sur des sujets

5

Page 32: Inégalités scolaires, ségrégation et effets de pairs

Introduction

comme la sélection des élèves, le rythme et le contenu du programme ou encore la formationdes tuteurs.

Lerôledesancienscamaradesdeclasse

Dans le chapitre 2, nous nous intéressons à l’influence de la composition de la classe deseconde sur la suite du parcours scolaire au lycée. La transition collège-lycée est un momentdifficile de l’éducation secondaire : la troisième est la seconde sont les classes les plus redoubléeset la seconde est la dernière année de scolarité obligatoire pour les élèves n’ayant pas d’année deretard. Cette transition se traduit également par un nouvel environnement où les attentes desprofesseurs sont plus élevées, les élèves commencent à préparer leur entrée dans l’enseignementsupérieur, et ils doivent, le plus souvent, changer d’établissement. Ce changement d’établissementa pour effet de modifier profondément les réseaux sociaux des élèves : en moyenne, un élèvede seconde retrouve dans son lycée huit camarades de sa classe de troisième. Parmi eux, 1,7élèves en moyenne sont dans la même classe de seconde : les élèves venant d’une même classe detroisième sont le plus souvent séparés entre les classes de seconde par les proviseurs, notammentpar crainte de problèmes de discipline. Il s’agit du seul moment de la scolarité secondaire où lesélèves connaissent un tel changement.

Nous avons souhaité savoir dans quelle mesure ce changement brutal de composition desclasses pouvait expliquer les difficultés rencontrées par les élèves de seconde. Pour cela, nousavons pu nous appuyer sur une spécificité de la transition entre la troisième et la seconde : ils’agit du seul moment de la scolarité secondaire où les équipes pédagogiques ne connaissent pasles élèves au moment de la constitution des classes. La répartition des élèves entre les classesde seconde, généralement effectuée au tout début de l’été par le proviseur, éventuellement avecl’aide des CPE et de certains professeurs, se fait sur la seule base des dossiers scolaires remis lorsde l’inscription administrative. Il arrive alors que certains dossiers soient extrêmement similaires« sur le papier », correspondant à deux élèves venant du même collège et de la même classe detroisième, ayant choisi les mêmes langues vivantes et options et ayant obtenu des notes trèsproches à la fois dans les matières scientifiques et dans les matières littéraires, et étant de plus dumême sexe, du même âge et de la même origine sociale.

6

Page 33: Inégalités scolaires, ségrégation et effets de pairs

Le rôle des anciens camarades de classe

Cette situation est très rare : elle concerne environ 2% des dossiers. Considérons deux élèvesdans cette situation – appelons-les Aurélien et Benoît –, venant de la même classe de troisièmed’un même collège et ayant des profils quasi identiques sur le papier. Deux options s’offrent alorsau proviseur : il peut les regrouper dans la même classe de seconde, ou les affecter à deux classesdifférentes, par exemple la seconde A et la seconde B. Cette décision peut être motivée par dif-férents critères, par exemple le souhait ou non de regrouper dans une même classe les élèvesayant choisi une certaine option. Dans notre étude, nous nous concentrons uniquement sur lessituations où le proviseur fait le choix de séparer ces élèves similaires. Il a alors, là encore, deuxpossibilités : affecter Aurélien à la seconde A et Benoît à la seconde B, ou affecter Aurélien àla seconde B et Aurélien à la seconde A. Pour prendre cette décision, le proviseur ne disposed’aucune information autre que celles contenues dans les dossiers d’inscription, qui sont quasi-ment identiques pour les deux élèves. Pour départager les deux élèves, il ne reste alors plus quele hasard. Ainsi, par le fruit du hasard, deux élèves quasi identiques sur le papier commencentleur scolarité au lycée dans des classes de seconde différentes.

Il est important de noter que cette affectation aléatoire a un caractère exceptionnel : le plussouvent, le profil de l’élève a une influence sur les caractéristiques de la classe de seconde à laquelleil sera affecté. Il n’est alors pas possible, en général, d’isoler l’effet des caractéristiques de la classesur la suite de la scolarité de l’élève, qui peut être affectée par de nombreux facteurs. Dans notrecas cependant, si nous parvenons à identifier un nombre suffisamment important de scénarioscomme celui décrit ci-dessus, nous pourrons constituer des échantillons d’élèves aux profils quasiidentiques mais ayant connu par le fruit du hasard des environnements de classe de secondedifférents. Il devient alors possible de mesurer l’effet causal de certaines caractéristiques de classesur la réussite scolaire des élèves.

En utilisant les bases de données du Ministère de l’Éducation nationale, qui contiennentla quasi totalité des informations présentes dans les fiches d’inscription dont disposent les pro-viseurs, nous avons identifiés près de 30 000 élèves dans cette situation. Nous avons alors pucomparer les parcours scolaires des lycéens selon que le hasard les avait affecté à une classe ayantplus ou moins de bons élèves, plus ou moins de filles, plus ou moins d’élèves issus de milieuxfavorisés, à une classe plus ou moins grande, ou à une classe dans laquelle il retrouvaient plus ou

7

Page 34: Inégalités scolaires, ségrégation et effets de pairs

Introduction

moins de camarades de leur classe de troisième. Notre analyse montre des effets très faibles surla scolarité de la plupart des caractéristiques énoncées ci-dessus, à l’exception de la dernière : unélève qui, par le fruit du hasard, retrouve plus de ses camarades de classe de troisième en seconde,aura une probabilité moins importante de redoubler la classe de seconde et une probabilité plusimportante d’obtenir le baccalauréat.

Ces résultats ont une portée importante. Les nombreux travaux quantitatifs portant sur leseffets de la composition de classe peinent à se mettre d’accord sur des résultats solides. Surtout,ces résultats ne permettent pas, pour l’heure, de formuler des recommandations précises sur laconstitution des classes : si, par exemple, la présence de filles a un effet bénéfique sur la scola-rité, le fait de déplacer des filles d’une classe à une autre aura un effet positif sur les uns et uneffet négatif sur les autres. Il faut alors compter sur des effets différenciés ou non-linéaires pourespérer pouvoir optimiser les compositions de classe. Le cas des anciens camarades de classe estdifférent : si on considère deux élèves d’une même classe de troisième, chacun isolé dans uneclasse de seconde, le fait de les regrouper aura un effet positif sur ces deux élèves sans impacternégativement les autres élèves qu’ils ne connaissaient pas.

L’objet de cette étude n’est pas d’affirmer que les proviseurs doivent regrouper dans une mêmeclasse de seconde tous les élèves issus d’une même classe de troisième. Tout d’abord, les donnéesdont nous disposons ne permettent d’observer que des classes où le nombre d’anciens camaradesde classes retrouvés en seconde est compris entre zéro et quatre (il existe trop peu de cas oùce nombre est supérieur pour tirer des conclusions statistiquement valables). Il s’agit donc avanttout de veiller à éviter les situations d’isolement complet, en s’assurant dans la mesure du possibleque chaque élève retrouve quelques anciens camarades de troisième dans sa nouvelle classe deseconde. Regrouper dans une même classe de seconde un grand nombre d’élèves d’une mêmeclasse de troisième est par ailleurs susceptible d’avoir pour effet d’augmenter la ségrégation socialeet scolaire entre les classes. Nous observons par ailleurs que les élèves les plus sensibles à lacomposition de la classe de seconde sont les élèves les plus fragiles scolairement et issus desclasses populaires. La transition vers le lycée est en effet particulièrement difficile pour ces élèves ;à l’inverse, les élèves les plus solides ou issus des classes aisées sont peu impactés par le nombrede camarades retrouvés. L’effort doit donc se porter avant tout sur ces élèves fragiles. Enfin, la

8

Page 35: Inégalités scolaires, ségrégation et effets de pairs

L’état des lieux de la ségrégation

recommandation issue de cette étude est de nature statistique, et ne doit pas supplanter desrecommandations individuelles qui pourraient avoir été formulées par l’équipe pédagogique ducollège d’origine (par exemple, de ne pas regrouper deux élèves jugés perturbateurs lorsqu’ils sontensemble).

Un deuxième aspect de cette étude rend notre résultat simple à implémenter : le résultat portesur le nombre de camarades de classe de troisième retrouvés, et non sur le nombre d’amis retrouvés.Il n’est donc pas nécessaire de mettre en place une logistique complexe pour recueillir les souhaitsde regroupement formulés par les élèves, alors même que l’exercice de composition des classes estdéjà particulièrement difficile. Nous montrons que les élèves sont autant impactés par le fait deretrouver des camarades du même sexe ou non, ou des camarades d’un niveau scolaire similaireou non. Ces résultats indiquent qu’il s’agit avant tout d’un effet de familiarité avec le nouvelenvironnement de seconde : le fait de retrouver quelques visages connus a un effet rassurant à unmoment charnière de la scolarité.

L’étatdeslieuxdelaségrégationdanslescollèges

etlycéesfrançais

Le chapitre 3 a pour objet de dresser un portrait de la composition des collèges et des lycéesfrançais. Cette étude permet de décrire quantitativement l’ampleur de la ségrégation sociale etscolaire dans l’enseignement secondaire, un phénomène largement discuté dans le débat publicmais sur lequel des informations chiffrées manquaient. En effet, il s’agit à notre connaissancedu premier état de lieux exhaustif de la ségrégation sociale et scolaire dans les collèges et ly-cées français, portant à la fois sur les dimensions inter- et intra-établissement. L’étude met enévidence une forte différence entre les environnements sociaux fréquentés par les collégiens etlycéens français en fonction de leur origine sociale ou de leur niveau scolaire. Par exemple, unélève issu d’un milieu aisée compte en moyenne dans sa classe deux fois plus d’élèves égalementissus d’un milieu aisé qu’un élève issu d’un milieu populaire ou moyen. De même, les meilleursélèves comptent en moyenne dans sa classe deux fois plus d’élèves également d’un très bon niveauscolaire que les élèves de niveau faible ou moyen. Ces chiffres sont inquiétant à deux titres : les

9

Page 36: Inégalités scolaires, ségrégation et effets de pairs

Introduction

différences d’environnement en fonction de l’origine sociale ou du niveau scolaire sont suscep-tibles d’aggraver les inégalités scolaires ; de plus, cet entre-soi est un obstacle à l’apprentissagede la citoyenneté et du vivre-ensemble.

Afin de quantifier ces différences d’environnement fréquentés par les élèves en fonction deleurs caractéristiques, nous utilisons un indice de ségrégation appelé l’indice d’exposition. Cetteindice est compris entre 0 et 100% : lorsqu’il vaut zéro, tous les élèves ont une composition declasse ou d’établissement similaire quelle que soit leur origine ; lorsqu’il vaut 100%, les élèvessont complètement isolés en fonction de leurs caractéristiques (par exemple, chaque classe necontient que des élèves issus des milieux aisées ou n’en contient aucun). L’indice est défini par ladifférence entre la proportion de camarades de classe appartenant à une certaine catégorie (issusdes milieux aisés ou ayant un niveau scolaire élevé) selon qu’on appartient ou non, soi-même, àcette catégorie. Nous mesurons ici deux formes de ségrégation :

La ségrégation sociale mesure la différence entre la proportion d’élèves issus des milieux aisés,ou « CSP+ » 1, dans l’environnement d’un élève (sa classe ou son établissement scolaire)selon qu’il est lui-même CSP+ ou non. La proportion d’élèves CSP+ dans la populationest d’environ 20% : en l’absence de ségrégation sociale, chaque élève devrait donc compterdans sa classe 20% d’élèves CSP+. Lorsqu’il y a ségrégation, les élèves eux-mêmes CSP+compteront en moyenne plus de CSP+ dans leur classe que les élèves non-CSP+. Si parexemple ils en comptent 36% alors que les non-CSP+ n’en comptent que 16%, l’indice deségrégation vaudra 20% (36− 20).

La ségrégation scolaire mesure la différence entre la proportion d’élèves ayant obtenu lesmeilleures notes au diplôme national du brevet (on considère les élèves du premier quartde la distribution des notes, que l’on appellera les « bons élèves » par souci de simplcité)dans l’environnement d’un élève (sa classe ou son établissement scolaire) selon qu’il faitlui même partie de ce groupe ou non. En l’absence de ségrégation scolaire, chaque élèvedevrait compter dans sa classe 25% de bons élèves. Lorsqu’il y a ségrégation, ces élèvescompteront en moyenne plus d’élèves faisant également partie de ce groupe dans leur classeque les élèves moyens ou faibles. Si par exemple ils en comptent 55% alors que les autresélèves n’en compte que 15%, l’indice de ségrégation vaudra 40% (55− 15).

1. CSP : catégorie socio-professionnelle.

10

Page 37: Inégalités scolaires, ségrégation et effets de pairs

L’état des lieux de la ségrégation

Les définitions ci-dessus mentionnent des proportions d’élèves dans son « environnement »d’établissement ou de classe. La proportion d’élèves CSP+ dans l’environnement d’établissementd’un élève fait référence au nombre d’élèves CSP+ présents dans l’ensemble des classes de l’établis-sement d’un niveau donné (par exemple, toutes les classes de quatrième), divisé par le nombretotal d’élèves de ce niveau. À l’inverse, la proportion d’élèves CSP+ dans l’environnement declasse d’un élève fait référence au nombre d’élèves CSP+ présents dans sa classe (par exemple,la quatrième A) Lorsqu’on effectue la mesure en utilisant les environnements d’établissement,le chiffre obtenu correspond à la ségrégation inter-établissements, c’est-à-dire qu’il mesure à quelpoint les collèges et lycées accueillent des élèves différents. Lorsqu’on effectue la mesure en uti-lisant les environnements de classe, le chiffre obtenu correspond à la ségrégation totale entreclasses, c’est-à-dire à quel point les classes de tous les établissements accueillent des élèves dif-férents. En prenant la différence entre les deux chiffres, on obtient la valeur de la ségrégationintra-établissement, c’est-à-dire à quel point les classes d’un établissement donné accueillent desélèves différents.

Notre premier constat est celui d’une forte ségrégation sociale entre les établissements : l’in-dice de ségrégation sociale inter-établissements varie en effet entre 16 et 19% selon le niveauconsidéré. Ainsi, alors que la proportion de CSP+ parmi les collégiens est d’environ 22%, lesélèves eux-mêmes CSP+ en comptent en moyenne 34% dans leur établissement alors que lesautres n’en comptent que 18%, soit environ deux fois moins. Ces différences s’expliquent enpartie par la ségrégation résidentielle : si tous les collèges de chaque commune avaient exacte-ment la même composition sociale, l’indice de ségrégation baisserait que de 25%. Le résidu estle résultat de deux phénomènes, que les données ne permettent pas de distinguer : la ségréga-tion résidentielle entre les quartiers de chaque commune, et la ségrégation liée directement auxétablissements (par exemple par le biais des dérogations).

La ségrégation en fonction du niveau scolaire, elle, est beaucoup plus variable en fonctiondu niveau. Elle reste limitée au collège, où elle varie entre 7 et 9%. La part des « bons élèves »y est de 21%, mais un bon élève comptera en moyenne 27% bons élèves parmi les élèves dumême niveau (sixième, cinquième, etc.) et du même collège, alors que les autres n’en comptentque 19%. Au lycée, la ségrégation scolaire augmente nettement, pour atteindre 18 à 21%. Cette

11

Page 38: Inégalités scolaires, ségrégation et effets de pairs

Introduction

forte augmentation s’explique notamment par le début de la filiarisation : les élèves fréquententdes lycées différents selon qu’ils choissent la voie générale, technologique ou professionnelle – àl’exception des 20% de lycées polyvalents.

Les indicateurs de ségrégation sont des valeurs moyennes qui cachent une grande variété desituations. On trouve également un petit nombre d’établissements qui accueillent un public soittrès favorisé, soit très défavorisé.. Ainsi, en troisième, 10% des élèves fréquentent des établisse-ments contenant 5% ou moins d’élèves CSP+ dans leur niveau ; à l’inverse, 5% des élèves ont plusde 60% d’élèves CSP+ dans leur cohorte, et même plus de 80% de CSP+ pour les 1% d’élèves(soit plus de 7 000 élèves) dont les environnements sont les plus favorisés. Si on s’intéresse auxélèves issus des milieux les plus populaires (ouvriers, chômeurs et inactifs), qui représentent 37%des élèves de troisième, 10% des élèves en comptent 63% ou plus dans leur établissement ; 5% encomptent 71% ou plus. De tels écarts sont également observés en termes de ségrégation scolaire :10% d’élèves comptent 6% ou moins de « bons élèves » dans leur établissement, et à l’inverse 5%d’élèves en comptent plus de 43%, et 1% en comptent plus de 58%.

La ségrégation entre établissements a une amplitude très variable d’un département à unautre, tant dans la dimension sociale que scolaire (ces deux dimensions étant très corrélées). Parexemple, la ségrégation sociale varie de 2% à 27% ; les départements ayant la plus forte ségré-gation sociale sont essentiellement des départements urbains qui comportent des grandes villes.Dans les départements à faible densité de population, les collèges recrutent sur un rayon pouvantdépasser les dix kilomètres : ils regroupent donc dans un même lieu des élèves d’origines diffé-rentes, ce qui favorise la mixité sociale. La multiplication du nombre de collèges, dans les zonesurbaines, augmente au contraire la ségrégation par deux biais : d’abord, parce que les collèges re-flètent plus précisément la ségrégation résidentielle, et ensuite parce qu’il s’installe une situationde concurrence qui fait émerger des collèges « souhaités » et des collèges « évités ».

Nous nous intéressons également dans cette étude au rôle de la composition des classes dansla ségrégation sociale et scolaire. Cette dimension, souvent absente dans les études quantitatives(par manque d’accès aux données et en raison des difficultés méthodologiques qu’elle pose), aune importance cruciale dans l’étude de la ségrégation. En effet, une politique volontariste de

12

Page 39: Inégalités scolaires, ségrégation et effets de pairs

L’état des lieux de la ségrégation

déségrégation entre les établissements peut être compensée par une reségrégation à l’intérieurde ceux-ci. La ségrégation totale, qui est la somme de la ségrégation entre les établissementset de la ségrégation entre les classes de chaque établissement, risque alors de rester inchangée,et ce simple changement de structure de la ségrégation peut même avoir des effets néfastes.La ségrégation sociale entre les classes, au sein des établissements, varie entre 4 et 6 pointsselon le niveau. Cela signifie que la ségrégation totale entre l’ensemble des classes est supérieureà la ségrégation entre les établissements de 4 à 6 points. En classe de troisième par exemple,la ségrégation sociale entre établissements est de 17%, et la ségrégation entre les classes desétablissements est de 5 points, soit un total de 22%. Ainsi, un élève CSP+ va compter une partd’élèves CSP+ dans son établissement supérieure de 17 points à celle connue par un élève non-CSP+, et une part d’élèves CSP+ dans sa classe supérieure de 22 points à celle connue par unélève non CSP+, soit 5 élèves sur une classe de 25. Globalement, la composition des classesa un effet relativement limité sur la ségrégation sociale, puisqu’elle ne représente que 20% dela ségrégation totale. Cependant, elle joue un rôle beaucoup plus important sur la ségrégationscolaire : la ségrégation scolaire totale vaut le double de la ségrégation scolaire entre établissements,c’est-à-dire que les compositions de classe contribuent autant à la ségrégation scolaire que laségrégation résidentielle et la ségrégation entre établissements. Au total, l’indice de ségrégationscolaire totale vaut 13 à 18% au collège, 28% en seconde, 38% en première et 36% en terminale.

Alors que la ségrégation entre établissements est un phénomène plus prononcé dans les zonesurbaines, la ségrégation entre les classes des établissements varie très peu d’un département à unautre, à l’exception notable des départements d’outre-mer où elle prend des valeurs beaucoup plusimportantes qu’en métropole. La ségrégation entre les classes des établissements concerne à lafois les zones urbaines et les zones rurales, et vient s’ajouter à la ségrégation entre établissements,quelle que soit son niveau : il ne s’agit donc pas d’un mécanisme de compensation de la mixitémais d’un phénomène qui a lieu aussi bien dans des zones de mixité que dans des zones à forteségrégation entre établissements.

Pour évaluer le niveau de ségrégation entre les classes des établissements, nous avons com-paré les valeurs réelles des indices de ségrégation à des valeurs obtenues sur une série de 100affectations aléatoires des élèves aux classes. Le hasard explique une partie non négligeable de la

13

Page 40: Inégalités scolaires, ségrégation et effets de pairs

Introduction

ségrégation, en raison de la petite taille des classes. Mais en troisième, 25% des établissementsont une ségrégation sociale entre les classes qui dépasse ce qui s’explique par le hasard. Dans 45%des collèges, c’est la ségrégation scolaire qui dépasse cette ségrégation « aléatoire » obtenue parles simulations : près de la moitié des établissements créent des classes de niveau. Un instrumentimportant de cette ségrégation au sein des établissements est le jeu des options. Les classes bi-langues en sixième et cinquième, le latin à partir de la cinquième et les sections européennes àpartir de la quatrième sont des options fortement marquées socialement et scolairement et sontdes facteurs de différenciation des établissements et des classes. Les parcours bilangues et lessections européennes ne sont proposés que dans une moitié des collèges environ, à l’inverse dulatin qui l’est dans presque tous les établissements. Dans les trois cas, lLes élèves choisissant cesoptions sont regroupés dans la moitié des classes en moyenne ; dans une minorité de cas, ils sontregroupés dans une ou deux classes seulement, ou répartis dans toutes les classes de l’établisse-ment. Cela donne lieu, dans les établissements où ces options sont proposées, à une hiérarchiesociale et scolaire entre les classes.

Enfin, nous avons étudié l’évolution des indices de ségrégation sur une décennie au niveaunational. Nous observons que la ségrégation sociale a très peu évolué pour les cohortes d’élèvesayant passé le DNB entre 2006 et 2014. Cette stabilité dans les chiffres au niveau national masquedes progressions diverses entre les territoires ; plusieurs études ont notamment relevé une haussede la ségrégation dans certaines agglomérations suite à l’assouplissement de la carte scolaire.Dans la même période, on constate une diminution sensible de la ségrégation scolaire au niveaunational, à la fois entre les établissements et entre les classes au sein des établissements.

Lamesuredelaségrégationdansladurée

Enfin, le chapitre 4 propose une méthode pour mesurer la persistence de la ségrégation dansla durée. Au cours de sa scolarité, un élève est susceptible de connaître des environnementsdifférents : par exemple, il peut être dans une « bonne classe » en sixième et cinquième et dansune « mauvaise classe » en quatrième et troisième. L’existence de ces « bonnes » et « mauvaises »classes est la manifestation concrète d’une ségrégation qui peut exister à chaque instant. Cetteségrégation peut cependant être atténuée si les élèves qui fréquentent les « mauvaises classes » ne

14

Page 41: Inégalités scolaires, ségrégation et effets de pairs

La mesure de la ségrégation dans la durée

sont pas toujours les mêmes. Dans ce chapitre, nous proposons des outils statistiques permettantde mesurer cette diversité des environnements fréquentés, c’est-à-dire la mobilité des élèves entreles environnements sociaux.

Des outils statistiques similaires existent déjà dans le cadre de la mesure des inégalités derevenus. Pour mesurer, à un instant donné, les inégalités de revenus, les statisticiens ont recoursà un ensemble d’indices, le plus connu d’entre eux étant l’indice de Gini. Cet indice mesurel’écart moyen de revenus entre deux personnes choisies au hasard, divisé par le revenu moyende la population considéré. Il varie entre 0 (absence d’inégalité) et 100% (inégalité totale : uneseule personne reçoit tous les revenus). L’existence d’inégalités de revenus peut être atténuée,voire même totalement annulée par la mobilité des individus dans la distribution des revenus.Considérons une situation fictive où chaque individu a le même salaire en fonction de son âge(par exemple, un salaire croissant lié à l’expérience) et a la même espérance de vie. À chaqueinstant, on observerait une inégalité de revenus qui reflèterait tout simplement la pyramide desâges. Mais en considérant les revenus moyens gagnés par les individus au cours de leur vie, ceux-ci seraient identiques pour tout le monde : l’indice de Gini pour ces revenus moyens serait égalà zéro. C’est une situation de mobilité parfaite : des inégalités existent à chaque instant, maiscelles-ci disparaissent lorsqu’on considère les revenus moyens sur une longue période. À partirde cette situation, on peut construire un indice de mobilité de revenus, qui est défini par letaux de diminution de l’indice d’inégalité lorsqu’on passe des revenus instantanés aux revenusmoyennés dans le temps. Dans l’exemple précédent, puisqu’on part d’un niveau d’égalité non nulen utilisant les revenus instantanés et qu’on arrive à un niveau zéro d’inégalités en utilisant lesrevenus moyens, la diminution est de 100% : la mobilité est parfaite. En réalité, la mobilité derevenus est beaucoup plus faible. Aux États-Unis par exemple, elle est de l’ordre de 40% : l’indicede Gini calculé à partir des revenus moyens est 40% plus faible que l’indice de Gini calculé à partirdes revenus instantanés.

Notre démarche consiste à adapter ce raisonnement au cas de la ségrégation. De la mêmemanière que l’indice de Gini mesure les inégalités de revenus, plusieurs indices permettent demesurer les inégalités de composition sociale de l’environnement, c’est-à-dire la ségrégation. Cesindices de ségrégation sont calculés à partir de la proportion d’un groupe donné (par exemple les

15

Page 42: Inégalités scolaires, ségrégation et effets de pairs

Introduction

élèves issus de milieux aisés ou les élèves ayant obtenu les meilleures notes) dans l’entourage dechaque élève à un instant donné. Il est cependant possible de modifier ces indices pour utilisernon pas les environnements à un instant donné, mais la moyenne des environnements fréquentéspendant toute la scolarité au collège, par exemple. En mesurant la différence entre les deux in-dices de ségrégation ainsi obtenus, on obtient un indice de mobilité entre environnements sociaux.Cet indice peut également être interprété comme le degré de diversité des environnements so-ciaux fréquentés par un élève au cours de sa scolarité : s’il vaut zéro, chaque élève a toujoursconnu le même environnement ; plus il augmente, plus cela signifie que les élèves ont fréquentédes environnements différents.

L’indice de mobilité entre environnements sociaux a cependant une différence fondamentaleavec l’indice de mobilité de revenus : il ne peut jamais atteindre 100% dès lors qu’il existe de laségrégation instantanée. Ainsi, si un principal de collège crée des classes de niveau, il ne pourrajamais effacer totalement les inégalités en alternant d’une année sur l’autre les élèves qui y sontaffectés. L’idée est la suivante : par définition, chaque année, il y a plus de places pour les meilleursélèves dans les meilleures classes et plus de places pour les élèves plus faibles dans les classesplus faibles. Il y a donc une marge de manœuvre limitée et les élèves les plus faibles seront, enmoyenne, plus souvent affectés à des classes faibles que leurs camarades de niveau plus élevé.

Notre article permet de préciser cette limite quantitativement : plus la ségrégation moyenneà chaque instant est élevée, moins la mobilité entre environnements sociaux pourra être élevée.La relation mathématique dépend de l’indice de ségrégation utilisé ; en considérant l’indice d’ex-position que nous utilisons notamment dans le chapitre 3, celle-ci s’exprime particulièrementsimplement : par exemple, si la ségrégation à chaque instant vaut en moyenne 30%, la mobi-lité ne pourra en aucun cas excéder 70% (100 − 30). Dans ce scénario de mobilité optimale, laségrégation mesurée en utilisant les environnements moyens vaudrait alors 9%.

L’utilisation de cet indice de mobilité entre environnements sociaux peut poser quelques dif-ficultés dans le cas où de l’attrition est observée, c’est-à-dire si certains élèves ne sont pas présentsdans l’échantillon pendant les quatre années ; notre article propose une méthodologie pour cal-culer l’indice de mobilité entre environnements sociaux sur des données réelles, notamment en

16

Page 43: Inégalités scolaires, ségrégation et effets de pairs

La mesure de la ségrégation dans la durée

présence d’attrition.

À titre d’illustration, nous avons calculé l’indice de mobilité entre environnements sociauxen l’appliquant à la ségrégation sociale au collège. L’indice de ségrégation sociale « instantané »est d’environ 20% dans les collèges français, comme nous le voyons en détail dans le chapitre3. L’indice de mobilité entre environnements sociaux a une valeur proche de 15% : cela signifieque si on mesurait la ségrégation sociale en utilisant les environnements moyens fréquentés aucours des quatre années de collège, l’indice vaudrait 17% au lieu de 20%. Cette valeur de 15%,qui peut paraître faible, doit être lue avec précaution. Elle signifie qu’un collégien moyen connaitau cours de sa scolarité environ 15% de la diversité des environnements de classe existant dansl ’ensemble du pays. Or, même si la mobilité pourrait, mathématiquement, être beaucoup plus éle-vée, elle impliquerait des déplacements d’élèves très importants, non seulement entre classes d’unmême collège mais aussi entre collèges, entre villes, voire entre régions : en effet, les différencesd’environnements sociaux entre établissements sont pour une part importante les conséquencesd’inégalités territoriales qui ne sont pas le seul fait de l’institution scolaire. Notre outil permetcependant de mettre en place un pilotage à un niveau plus local, en calculant des indices demobilité par région, par commune, voire même par établissement.

17

Page 44: Inégalités scolaires, ségrégation et effets de pairs
Page 45: Inégalités scolaires, ségrégation et effets de pairs

Chapitre 1EliteTutorsandUnderprivileged

High-SchoolStudents

Ce chapitre a été écrit avec Son Thierry Ly et Éric Maurin.Nous remercions Laurent Davezies et Pascaline Dupas pour leurs nombreux commentairessur une version antérieure de cet article.

Cette recherche a bénéficié d’un soutien financier du fonds d’expérimentation pour la jeu-

nesse.

1.1 Introduction

In most developed countries, students coming from low-income families are massively under-represented in the most prestigious programs of higher education. It contributes to the exclusionof entire social groups from political and economic elites.

19

Page 46: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

This issue has attracted considerable attention from both policy makers and social scientists,but the mechanisms driving unequal access to higher education are still not well understood(Bailey and Dynarski, 2011). One potential explanation is that low-income high school studentslack basic information about the higher education system and its selectivity. It may lead them todevelop inadequate application strategies (Smith et al., 2013; Hoxby and Avery, 2013; Hoxbyand Turner, 2013b).

In recent years, many initiatives have flourished around the world to address this issue. InFrance, the ministry of Education has encouraged institutions of higher education to developjoint programs with underprivileged high schools in order to help the best students from thesehigh schools to form more ambitious plans and meet more ambitious goals. There exist about350 such programs all over the country. They typically provide free tutoring to help high schoolstudents improve their academic achievement. They also provide students with assistance withcollege choices and applications. These programs are called ”cordées de la réussite” (team for suc-cess) and are becoming increasingly popular. To the best of our knowledge, however, very littleis known about the actual impact of these programs on eligible students. On the one hand, theycontribute to bridge the informational gap between underprivileged students and higher edu-cation. But on the other hand, they are often time consuming and may contribute to distractstudents from basic subjects.

To shed light on this issue, our paper develops a randomized evaluation of the impact of oneof the oldest ”cordée de la réussite”. It is operated by the most prestigious and selective institutionof higher education in France, namely the École normale supérieure (hereafter, ENS). The ENSencompasses both a very selective graduate school and a set of world class research centres. InMath, the ENS is for example the second institution in the world (just below Princeton) interms of Field medals won by former students. This institution has played a leading role in theselection and training of French intellectual elite for more than a century.

Since 2006, the ENS offers each year a two-year mentoring and tutoring program (about150 hours per student and year) to a selection of promising students coming from twelve un-derprivileged high schools of the Paris Region. The tutoring is provided by graduate students

20

Page 47: Inégalités scolaires, ségrégation et effets de pairs

1.1. Introduction

from the ENS itself. The set of eligible students is defined at the end of the first year of highschool (grade 10), while the program itself lasts for the two last high school years (grade 11 and12). Each year, in each school, eligible students are randomly selected from a set of volunteerstudents identified by school principals as having the potential to go to higher education. Af-ter the randomization, the set of eligible students is divided in groups of six students and eachgroup is randomly assigned to a specific ENS tutor. In grades 11 and 12, these groups of eligiblestudents are invited each month to participate in one or two tutoring sessions dedicated to eitherexploring new fields of study, deepening subjects or preparing high school exit examination. Ingrade 12, eligible students are also invited to participate in specific sessions dedicated to helpthem apply to higher education institutions. The travelling costs involved by weekly participa-tion in the program (as well as the cost of attending a one-week introductory meeting at ENSin Paris) are all covered by the program. All in all, the intervention costs about 1,500 euros perstudent and year.

This paper focuses on volunteer students identified by principals in 2010 and 2011. It showsthe results of comparing the achievement and choices of those randomly selected to be eligible(the treatment group) with the achievement and choices of those not selected (the control group).This evaluation reveals that the intervention has very little effects on students’ average outcomes.In particular, there is no significant difference between treatment and control groups in averageperformance on the national high school exams (baccalauréat) taken at the end of grade 11 andgrade 12. Similarly, there is no significant difference in the proportion of students who getaccess to (and are able to persist in) the most selective undergraduate programs (called ClassesPréparatoires aux Grandes Écoles, herafter CPGE).

However, further explorations reveal that the effect of the intervention is very different acrossability groups. Among the 50% eligible students with the highest level of achievement pre-treatment, the intervention induces a significant increase in high school achievement as well asin the probability to get access to (and persist in) the most selective undergraduate programs.By contrast, among the 50% eligible students with the lowest level of ability pre-treatment, theintervention induces a significant decrease in both high school achievement and probability toenter into selective undergraduate programs. All in all, the intervention has no impact on the

21

Page 48: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

average outcomes of eligible high school students, but a very important effect on inequalitiesacross eligible students with different ability levels pre-treatment. The gap in high school grad-uation between ability groups is three times more important in the treatment group than in thecontrol group.

Our paper contributes to the recent and growing literature that explores the impact of pro-viding high school students from underprivileged background with assistance to gain access tohigher education (see e.g. Avery, 2009, 2013; Bettinger et al., 2012; Castleman and Page, 2015;Hoxby and Turner, 2013a). One distinctive feature of the intervention analyzed in this paper isthat it does not simply try to improve students’ information about higher education (or abouthow to apply to higher education institutions), but also their academic readiness for highereducation, which explains the large number of sessions and their academic content. Anotherimportant feature of our experiment is that it is not about the US system, but about a Europeansystem, where higher education is almost free and where tuition fees are not an issue. In thiscontext, our most striking result is maybe that such an intervention can have negative effects ona significant fraction of students, even when targeted on those who volunteer and are identifiedas having the potential to go to higher education. Many high school students with underpriv-ileged background find it pleasurable to spend a lot of time participating in a program which,in the end, happens to have a negative effect on their performance on key exams and a negativeeffect on their probability to gain access to (and persist) in the best undergraduate programs. In2016, we conducted a post-treatment satisfaction survey on the sample of students who partici-pated in the program in 2010 and 2011. It confirms that the vast majority of former participantsfound it enjoyable to participate in the program both because of the quality of their tutor andthe quality of their group of tutees. But it also confirms that many participants perceived theparticipation in the program as very time consuming and difficult to reconcile with school home-works. The overall outcome of participation in the program turned out to be very positive forthe higher-ability participants, but very negative for the lower-ability ones.

The paper is organized as follows. The next section describes the context of the experiment,the content of the intervention and the randomization process. Section 1.3 describes the dataused in the econometric analysis while section 1.4 presents the main results of our experiment,

22

Page 49: Inégalités scolaires, ségrégation et effets de pairs

1.2. The experiment

namely the impact of the intervention on students’ performance on high school exit exams aswell as on their probability to gain access to (and persist in) selective undergraduate program.Section 1.5 builds on the fact that tutors were randomly assigned to groups of tutees to explorethe variation in the effect of the program across the different types of tutors. Section 1.6 buildson the survey on former participants conducted in 2016 to test assumptions about why a programdesigned to help students may end up having a negative effect on a significant fraction of them.

1.2 Theexperiment

1.2.1 Institutionalcontext

In France, compulsory education encompasses 5 years of elementary education (betweenage 6 and 11) and 4 years of middle school (between age 11 and 15). At the end of middleschool (grade 9), about 60% students pursue general education in high school whereas 40% goto a vocational school or enter into the labour market. One year later, at the end of grade 10,about 70% of the students who are still in the general education track (i.e., about 40% of a birthcohort) pursue general education in high school for two additional years (grades 11 and 12)in order to prepare a general education diploma. The other 30% enter into a more technicaleducation program. Students who pursue general education at the end of grade 10 have onaverage a much better academic level than those who pursue technical or vocational education.At the end of grade 10, students pursing general education have to choose a major field of studyand about half of them specialize in science whereas the other half specialize in humanities(either in Literature/Languages or Economics/Social Sciences). As discussed below, studentseligible to the ENS tutoring program are selected among the high-achieving 10th graders of 12underprivileged high schools. Virtually all of them pursue general education at the end of grade10 and about two thirds specialize in science.

In grades 11 and 12, high school students prepare for the different exams required for highschool graduation. There is one exam per subject and graduation is based on the average markacross the different subjects (the average has to be above 10/20). Graduation is a necessarycondition for entering into higher education. Some specific exams take place at the end of grade

23

Page 50: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

11 (most notably oral and written French exams), but most of them take place at the end of grade12. The overall number of exams and the relative importance of the different subjects dependon whether the student chose to specialize in science or in humanities at the end of grade 10.

Students who want to enter into a selective undergraduate program have to apply through aCentralized Assignment System (called Admissions Post-Bac, hereafter APB). They are asked tolist up to 36 specific programs by descending order of preference. Each program then ranks itsapplicants based on the marks obtained during 11th and 12th grade (as well as on high schoolteachers’ assessment). Using a deferred acceptance mechanism (Roth, 2008), the system thenassigns as many students as possible to one of their listed choices.

The most selective undergraduate programs correspond to the Classes Préparatoires auxGrandes Écoles (CPGE). Among students who prepare for a general education high schooldiploma, about 13% are admitted in a CPGE (17% of those who specialize in science), and77% make it to the second year. These programs involve two years of intense preparation (eitherin science or humanities) at the end of which students take competitive exams for entry into themost prestigious graduate programs. Admission to the ENS itself is based on one such com-petitive exam. Most ENS students have gone through a two-year CPGE preparation programbefore entry into ENS. About 22% of second-year CPGE students repeated that year in orderto take the competitive exams again.

1.2.2 Theprogramanditsobjectives

In 2008, the French government initiated programs (called ”cordées de la réussite”) all overthe country in order to increase the proportion of students from underprivileged high schoolsentering higher education programs. At the local level, each specific program corresponds to theassociation of an institution of higher education with a set of high schools located in the sameregion. Each year, a selection of students from these high schools are provided with informationon higher education institutions (selectivity, fields of study, etc.), counsels on how to apply tothese institutions and assistance to improve their high school academic achievement. In mostcases, this assistance is provided by volunteer tutors coming from the higher education institutionitself.

24

Page 51: Inégalités scolaires, ségrégation et effets de pairs

1.2. The experiment

The program analyzed in this paper corresponds to the network constituted by the Écolenormale supérieure (ENS) and twelve underprivileged high schools from Paris and its region. 1

The high schools were selected based on the socioeconomic background of their students as wellas on the proportion of students they send to CPGE programs: only 8% of their students enterinto such selective programs (11% of those who specialize in science) which is about two timesless than the average high school in the region of Paris (14%, and 20% of those who specializein science). As discussed above, the ENS represents one of the most prestigious institutions ofgraduate education in France. It encompasses several highly selective graduate schools as wellas top research centers.

1.2.3 Identificationofvolunteers

Each year, in each school, participants to the program are selected from a set of 10th gradestudents identified as volunteers. The identification of volunteers takes place early April, abouttwo month before the end of the academic year. In each school, the principals starts by iden-tifying 10th grade students who are very likely to pursue in the general education track andinvite them to participate in an information meeting where the managers of the ENS programprovide them with information on the objectives and contents of the program. At the end ofthis information meeting, students who are interested in actual participation are invited to takea questionnaire (about their family background and school experience), to fill it at home andto bring it back one week later. Those who come back one week later with their filled ques-tionnaire have a short interview with the program manager. The manager checks whether thequestionnaire is well filled and also whether the student has well understood the implications ofparticipation. In particular, students are reminded that not all volunteers will eventually be eligi-ble to participate in the program, only a random selection. At the end of this interview, studentswho confirm their willingness to participate in the program are considered as volunteers.

On a typical year, the capacity of the program is about 140 seats and there are about 200volunteers. On academic year 2009-2010 (our first cohort), the ENS agreed to temporarily

1. The Parisian region is divided into three education districs (these districts are called académies), namely thedistrict of the city of Paris itself (académie de Paris), the eastern district (académie de Créteil), and the western district(académie de Versailles). We have five schools in the district of Paris, six schools in the eastern district and one schoolin the western district.

25

Page 52: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

Table 1.1 – The characteristics of students who volunteer to participate in the program

Paris regionExperimentalhigh schools

Volunteerstudents

Volunteers,cohort 2010

Volunteers,cohort 2011

Variable (I) (II) (III) (IV) (V)

Female 0.528 0.536 0.600 0.613 0.567High-SES 0.416 0.200 0.253 0.257 0.242Low-SES 0.188 0.344 0.274 0.262 0.306Ability score (grade 9) 0.000 −0.556 0.153 0.132 0.208Repeat grade 10 0.118 0.131 0.000 0.000 0.000Pursue general education 0.583 0.533 0.996 1.000 0.987Specialize in science 0.304 0.236 0.634 0.586 0.758

Obs. 209,654 7,025 558 401 157

Note: Column (I) shows the average characteristics of general education 10th grade students in the region ofParis. Column (II) shows the same characteristics for general education 10th grade students in the twelve highschools of the experiment and column (III) for the volunteer students in these twelve high schools. Columns(IV) and (V) further show the characteristics of volunteer students in each cohort. The ability score correspondsto the (standardized at the Paris region level) average grade obtained at the national middle school exit examstaken at the end of grade 9.Reading: 60% of volunteer students are female, 25.3% come from a high SES family background, 0% arerepeating grade 10. At the end of grade 10, 99.6% choose to pursue general education, 63.4% choose to specializein science. Their average standardized score at the end of middle school exams (i.e., grade 9) is 0.786.

increase the capacity of the program and school principals were encouraged to boost participationin the information meetings. On this specific year, we ended up with 401 volunteers for 221 seats.On the following year (2010-2011), the capacity was back to normal (137 seats) and the numberof volunteers back to 210 students.

1.2.4 Randomselectionofeligiblestudents

Once the lists of volunteers were completed in the different experimental schools, eligiblestudents were randomly selected from these lists. As discussed below, the randomization wasstratified by school and main field of study. In 2011, 53 volunteer students did not participate inthe random draw (and were automatically selected) because there were too few volunteer students

26

Page 53: Inégalités scolaires, ségrégation et effets de pairs

1.2. The experiment

in their school with similar field of study. Overall, for the two cohorts under consideration, atotal of 558 volunteer students were included in the random draw of eligible students, 401 onyear 2010 and 157 on year 2011.

Building on administrative data that are described below, Table 1.1 provides some basicstatistics on these volunteer students as well as on their non-volunteer schoolmates and on theaverage students in the Parisian region. The Table confirms that volunteer students have a muchbetter academic record not only than their non-volunteer schoolmates, but also than the averagehigh school student in the Parisian region, even though they come more often from a low-SES family than the average high school student. Specifically, the score obtained by volunteerstudents at the end-of-middle-school national examination is about +15% of a SD higher thanthe score obtained by the average student in the Parisian region, even though the proportion ofstudents coming from a low-SES family is about 50% more important among volunteer studentsthan among the average student in the Parisian region. Virtually all volunteer students pursuein the general education track in grade 11 whereas the average proportion in the Parisian regionis only about 63%. Generally speaking the Table confirms that the program was able to targetrelatively high-ability students with relatively low socioeconomic background, compared to theaverage student in the Parisian region.

For both cohorts, the randomization took place in each school just before the start of thesummer holidays and just after the principal pre-assigned each volunteer student to one future11th grade class (based on her choice of field of study). In French high schools, each 11th gradeclass corresponds to either students who specialize in science at the end of grade 10 or to studentswho specialize in humanities (i.e., social sciences or languages/literature). The randomizationwas conducted at the class level and stratified by major field of study (science/humanities). Foreach major field of study, half of the classes – or half rounded up to the nearest integer whenthere were an odd number of classes – were put in the treatment group. In the end, we have 307volunteer students in the treatment group and 251 volunteer students in the control group.

Only the 307 volunteer students in the treatment group were eventually invited to partici-pate in the program. Most of the results in this paper are based on the comparison of volunteer

27

Page 54: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

students in treatment and control groups. Under the assumption that volunteer students incontrol groups remain unaffected by the treatment (SUTVA), this comparison provides an es-timate of an intention-to-treat parameter, namely the impact of being invited to participate inthe program on the subsequent outcomes of volunteer students.

To assess the similarity between the control and treatment groups, Appendix Table 1.A.1compares the responses of treatment and control groups to the questionnaire that students hadto fill in order to be identified as volunteers. 2 Comfortingly, we find little difference in responsesacross the treatment and control groups. Specifically, differences between treatment and con-trol groups are statistically different at the 10% level for one survey item only out of 22 (andsignificant at the 5% level for no item).

To further test for the similarity of the two groups, Appendix Table 1.A.2 (panel A) buildson the information provided by administrative registers to compare the socio-demographic char-acteristics of volunteer students in the treatment and control groups (in terms of gender, graderepetition, parental occupation, pre-treatment grades). Again, we find no significant differencesbetween the two groups.

To test for heterogeneous treatment effects, most of our regression analysis will be conductednot only on the full sample, but also separately on the subsample with the highest academicresults pre-treatment (i.e., in 10th grade) and on the subsample with the lowest academic results.We replicate the comparison of the pre-treatment characteristics of treated and control studentsseparately for the two subsamples in panels B and C of Table 1.A.2. We do not detect anysignificant pre-treatment difference across treatment and control students within both abilitygroups.

2. This survey provides information on students’ family background, main topics of interest, school background,plans for the future, level of information about higher education institutions, type of help they can get for makingchoice. This information is available for 93% of the students identified as volunteer in either 2010 or 2011. Themissing rate is very similar in control and treatment groups.

28

Page 55: Inégalités scolaires, ségrégation et effets de pairs

1.2. The experiment

1.2.5 Programcontent, tutorsandtakeup

Generally speaking, the objective of the ENS program is to provide volunteer students fromunderprivileged high school with information on post-secondary education programs (especiallythe most selective ones) as well as to improve their readiness for these programs. Just afterthe randomization, the program managers sent a letter to the students who participated in therandom draw in order to inform them of the results of the draw and to invite those of thetreatment group to participate in a kick-off week (called the campus week) organized at ENSlate August, just before the start of the following academic year.

During this campus week, students have activities led by tutors from previous cohorts. Theobjective of these activities is to help students improve their methods of work and to preparethem for grade 11. Team building activities are also organized in the evening. Meals and ac-commodation are paid for by the program. In 2010 and 2011, the vast majority of students didparticipate to this kick-off week (see Table 1.2).

After the campus week, students are asked to choose a theme for the tutoring sessions inwhich they are going to be involved throughout the academic year. There are four possiblethemes: science, social sciences and history or literature. Students are also asked to list one ortwo friends with whom they would like to be grouped for these sessions. These lists are used byprogram managers to define triplets of students with similar thematic preferences. The managersthen randomly paired triplets within each theme and randomly assigned each pair of triplets toone of the tutors specialized in its theme.

Each year, about 80% of tutors are new ones whereas 20% have already been involved in theprogram. New tutors are recruited early October at the beginning of the academic year. They areall ENS students. They first benefit from a two-day training session where program managersprovide them with information on the objectives of the program and on the type of high schoolstudents they are going to mentor. Tutors who have already been involved in the program alsoparticipate in this training session in order to share their experience. The tutoring program startsat the end of October, with a first meeting between tutors and their groups of six students atENS. The tutors meet three times a year in order to share experience and get feedback from

29

Page 56: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

Table 1.2 – Take up rates, by cohort and ability group

All Lower ability Higher ability

(I) (II) (III)

Panel A: Cohort 2010

Introductory week (year 1) 0.786 0.694 0.881More than 10 sessions attended (year 1) 0.639 0.615 0.667Re-enlistment 0.559 0.459 0.661Introductory week (year 2) 0.282 0.252 0.312

Obs. 220 111 109

Panel B: Cohort 2011

Introductory week (year 1) 0.724 0.721 0.727Re-enlistment 0.483 0.372 0.591

Obs. 87 43 44

The sample includes eligible students from cohorts 2010 (panel A) and from cohort 2011(panel B). In each panel, column (I) shows take up rates for the full sample whereas column(II) (column (III)) shows the take up rates for the subsamples of students with lower (higher)pre-treatment ability score.Reading: Among eligible students from cohort 2010, 78.6% attended the (year 1) introduc-tory week at ENS, 63.9% attended more than 10 tutoring sessions during the first year ofthe program, 55.9% re-enlisted at the end of the first year and 28.2% attended the (year 2)introductory week at ENS.For cohort 2011, information on attendance was not collected, and there was no introduc-tory week in year 2.

30

Page 57: Inégalités scolaires, ségrégation et effets de pairs

1.2. The experiment

program managers.

The academic year is divided in three terms (September-December, January-March andApril-June). During the first year of treatment, students from cohort 2010 benefited from fourthematic tutoring sessions per term. An additional session of personal coaching was organizedin the first term, as well as a session of improvisation theatre in the second term. All in all, stu-dents from cohort 2010 benefited from 12 tutoring sessions and two additional activities duringthe first year. This number of sessions was deemed excessive by a number of students, and itwas reduced for the second cohort to two tutoring sessions per term, with only one additionalcultural outing between the two sessions of each term, that is a total of 9 sessions for the secondcohort (instead of 12 for the first cohort). We have information (collected by tutors) on atten-dance at the 12 tutoring sessions organized for the first cohort of students. This informationis suggestive that attendance rates were high: about two third of students participate in 10 (ormore) sessions out of 12 (Table 1.2).

At the end of grade 11, students are asked whether they want to pursue the program in grade12. About 54 % of them chose to do so. Students from the first cohort were invited to participateto a second campus meeting. This second campus meeting is organized at ENS jointly with thefirst campus of the next cohort. However, students are not invited to stay at ENS during thecampus (only lunches are covered). 50 % of the students who reenlisted came to the secondcampus.

At the start of the second year of treatment (grade 12), students can change tutoring groupsand theme. As far as students from the first cohort (2010) are concerned, they benefited duringthis second year from seven thematic sessions with their tutors, as well as from one culturalouting and from a one-day forum of information on higher education. Also, starting in March,six additional sessions were organized in order to help students prepare the Baccalaurate examstaken at the end of grade 12. As far as students from the second cohort are concerned, theybenefited during the second year of treatment from four thematic sessions (and two culturaloutings) during the two first terms of the year. They also benefited from two additional sessionsduring the third and last term of the year, dedicated to the preparation of the Baccalaureate exams.

31

Page 58: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

1.3 Data

The high schools participating in the experiment provided us with the ID number of theirvolunteer students as well as their average academic achievement in grade 10 (which we willuse to define our two basic ability groups). Using ID numbers, we first augment this datasetusing exhaustive administrative data on students’ performance on the national exam taken atthe end of 9th grade (exam called the Diplôme National du Brevet, hereafter the DNB) as wellas on the national exam taken that the end of 12th grade (the Baccalauréat). We were alsoable to augment our initial dataset using administrative school registers (Bases Centrales Scolarité,hereafter the BCS) which provided us with information on the field of study chosen by studentsat the end of grade 10 as well as on the schools and classes that they attend in the followingyears.

Overall our working sample consists of the 558 tenth-graders who volunteer to participate inthe program in either 2010 or 2011 with information on their treatment status, their ability levelin grade 10, their pre-treatment performance at the middle school national exam (in grade 9) aswell as information on their future performance at the high school exit exams (in grades 11 and12). Generally speaking, missing rates are very small and unrelated to students’ treatment status.In particular, information on high school graduation (or on high school graduation with hon-ors) is available for 99% of the observations (7 missing) whereas information on pre-treatmentperformance on grade 10 is available for 97% of the observations (16 missing).

Finally, to assess the similarity between the control and treatment groups, we were also ableto use the information coming from the questionnaire that students had to fill in order to be iden-tified as volunteer. This pre-treatment survey provides us with information on students’ familybackground (parents’ country of birth and date of arrival in France, parents’ occupation and edu-cation, age and education of siblings, native language…), their preferred activities (sport, art…),their main topics of interest (politics, economics, literature, technology, etc.), their school recordand school background (elective courses chosen, self-assessment, favorite subjects, whether theycan get help for their homework), their plans for the future (field of study, institution of highereducation, occupation), their level of information about higher education institutions, the typeof help they can get for making choices. There is also a question about their opinion about what

32

Page 59: Inégalités scolaires, ségrégation et effets de pairs

1.4. Effects on achievement and choices

equal opportunities should be. This information is available for 93% of the students identifiedas volunteer in either 2010 or 2011. Appendix Table 1.A.1 presents descriptive statistics fromthis survey, as well as a balancing test showing that responses were very similar in the treatmentand control groups. Differences between treatment and control groups are statistically differentat the 10% level for one survey item only out of 22 (and significant at the 5% level for no item).

1.4 Effectsonachievementandchoices

In this section, we analyse the effect of the intervention on students’ academic performanceon high school national exams at the end of grade 11 and grade 12. We focus on exams (externallyset and marked) that students have to take in order to obtain their high school national diploma(baccalauréat). For each exam, we estimate the following model:

Yi = Ti · α +Xi · β + νi (1.1)

where, for each student i, variable Yi represents the mark obtained at the exam (or a dummyvariable indicating whether i passed the exam), variable Ti is a dummy indicating whether iis in the treatment group, and Xi is a vector of pre-treatment control variables that includesdummies for gender, grade repetition, family background, pre-treatment marks as well as schoolfixed effects and major choice fixed effects. Variable νi represents unobserved error terms. Theparameter of interest is α. Identification is a direct consequence of the experimental nature ofthe treatment assignment variable T . Standard errors are clustered at the class level.

1.4.1 Effectsonhighschoolachievement

Table 1.3 shows the effect of the intervention on the grades obtained at the high schoolexams taken at the end of 11th grade (column I) as well as on the final grades obtained at theend of 12th grade (column II). It also shows the effect on the probability to graduate (columnIII) as well as on the probability to graduate with honors (column IV). The first panel refers tothe full sample of volunteer students and we do not find any significant effect on the differentoutcomes in this sample. The intervention has no impact on the average grades obtained at thebaccalauréat examinations by volunteer students nor on their high school graduation rate.

33

Page 60: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

Table 1.3 – The effect of the treatment on performance on high school exit examinations

Dependent variableGrade 11 average

scoreAverage score Graduation Honours

(I) (II) (III) (IV)

Panel A: All volunteer students

Treatment −0.081 0.012 0.020 0.012s.e. (0.078) (0.080) (0.041) (0.045)Obs. 537 537 551 551Mean dep. var. 0.662 0.428 0.727 0.466

Panel B: Lower ability

Treatment −0.244** −0.208 −0.077 −0.091*s.e. (0.114) (0.131) (0.065) (0.053)Obs. 264 264 273 273Mean dep. var. 0.301 0.156 0.661 0.339

Panel C: Higher ability

Treatment 0.059 0.240** 0.118** 0.108*s.e. (0.110) (0.104) (0.048) (0.063)Obs. 273 273 278 278Mean dep. var. 1.019 0.698 0.792 0.592

Panel D: Differential impact

Treatment × higher ability 0.303* 0.448** 0.195** 0.199**s.e. (0.159) (0.176) (0.078) (0.084)Obs. 537 537 551 551Mean dep. var. 0.718 0.542 0.131 0.253

The sample includes volunteer students from cohorts 2010 and 2011.The table shows the results from reduced-form regressions in which variables measuring performance onhigh school exit examinations (baccalauréat) are regressed on a treatment dummy, using students’ gender,pre-treatment ability score and socioeconomic family background as control variables.Column (I) shows the estimated effect of the treatment when the dependent variable is the average gradeobtained at examinations taken at the end of grade 11 and column (II) when the dependent variable isthe average grade across all examinations. Column (III) shows the estimated effect when the dependentvariable is a dummy indicating high school graduation (average grade is 10/20 or more) and column (IV)when the dependent variable is a dummy indicating high school graduation with honours (average grade is12/20 or more).The first panel refers to the full sample, the second panel to subsample with lower pre-treatment abilityscore, the third panel to the subsample with higher pre-treatment ability score. Finally, the fourth panelshows the estimated difference in the effect of the treatment between lower and higher ability students.To estimate this difference, we use the full sample and regress the dependent variable on the interactionbetween a dummy indicating treatment and a dummy indicating high ability, controlling for the treatmentdummy as well as for the full set of socio-demographic controls and their interactions with the higher abilitydummy.Standard errors clustered at the class level are reported in parentheses.** and * denote significance at the 5% and 10% levels, respectively.

34

Page 61: Inégalités scolaires, ségrégation et effets de pairs

1.4. Effects on achievement and choices

The second panel of Table 1.3 refers to the subset of volunteer students whose pre-treatmentacademic achievement (in grade 10) is above the median whereas the third panel refers to thesubsample whose pretreatment achievement is below the median. They reveal that the interven-tion has completely different effects on the two subpopulations: it contributes to a significantdecrease in the grades obtained by the lower-ability group and to a significant increase in thegrades obtained by the higher-ability one. The last panel confirms that the differences betweenthe two sets of impacts are significant at standard level: the intervention contributes to a signif-icant increase in the academic gap between the higher- and lower-ability groups. Specifically,differences in grades obtained at the end of grade 11 or grade 12 as well as differences in highschool graduation probability between the two ability groups are significantly more important inthe treatment group. For example, the difference in high school graduation probability betweenlower- and higher-ability students is about 13 percentage points in the control group, but thisgap becomes about +20 percentage points larger in the treatment group, namely a tripling of thegap within the group that benefited from the intervention. Appendix Table 1.A.3 shows theresults of replicating this basic analysis separately on the two successive cohorts. It shows thatresults are qualitatively similar results for both cohorts, namely no effect of the treatment onaverage outcomes, but an increase in the gap between lower- and higher-ability students withinthe treatment group. For example, the difference in the probability of high school graduationbetween lower- and higher-ability students increases by about 19 percentage points in the firstcohort and by about 25 percentage points in the second cohort. Because of the small size of thesecond cohort, it is not possible, however, to assess whether the increase in the gap in graduationrates between lower- and higher-ability students is more significant in the first or in the secondcohort.

Higher-ability students chose more often to specialize in science and one explanation forour results may be that tutoring is more efficient for students who specialize in science. Totest for this assumption, Appendix Table 1.A.4 provides a replication of Table 1.3 separatelyfor the subsample of volunteer students who specialize in science and for those who specializein humanities. The estimated gap in the effect of the intervention between lower- and higher-ability students appears to be even stronger for the group of students who specialize in humanities(although the variation in the gap across science and humanities is not significant at standard

35

Page 62: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

level). Hence, the variation in the estimated impact of the intervention across lower- and higher-ability students does not seem to be driven by tutoring being more efficient in science.

In Appendix Table 1.A.5 and Table 1.A.6, we show the impact of the intervention onthe grades obtained at the high school national examination in each subject (French, Math,Physics, Languages, etc.), major choice (Science/Humanities) and ability group. For studentswho specialize in science, the intervention contributes to a significant increase in the gap be-tween lower- and higher-ability students in French written exam (+42% of a SD), Sciences(+65%), History (+42%) and Languages (+46%). The gap also increases in Math, Physics orPhilosophy, event though these increases are not significant at standard level. Similar increasesare also perceptible for students who specialize in humanities. Overall, the increased gap inachievement between lower- and higher-ability groups is not driven by a specific subject, butperceptible in virtually all subjects. These findings further confirm that the intervention did notaffect subject-specific inputs, but more general determinants of performance at school. Overall,the simplest interpretation for the increased academic gap between lower- and higher-abilitystudents is that participation in the program is time consuming and that only the more ablestudents (pre-treatment) can afford spending a significant part of their time in activities that arenot directly related to the preparation of the high school national examinations. Participation inthe program involves additional time constraints that are detrimental in all subjects, especiallyfor lower-ability students. Symmetrically, it likely contributes to an increase in motivation andeducational aspirations, which is beneficial in all subjects, especially for higher-ability students.

1.4.2 Effects on access to selective undergraduate pro-

grams

One of the objectives of the program was to increase the proportion of students who gainaccess to the most selective undergraduate programs in France, namely the Classes Préparatoiresaux Grandes Écoles (herafter, CPGE program). It may be that the intervention has no averageeffect on high school grades, but contributes nonetheless to increase the number of studentsfrom underprivileged high schools who are aware of the existence of CPGE program and aspireto get admitted into one of them. According to our baseline survey, only about 49% of students

36

Page 63: Inégalités scolaires, ségrégation et effets de pairs

1.4. Effects on achievement and choices

who volunteer to participate in the program know about CPGE. By contrast, most tutors getaccess to ENS after two years spent in a CPGE program and it is certainly the undergraduateprogram that they know the best.

To shed light on these issues, Table 1.4 shows the effect of the intervention on the propor-tion of students who get access to (and attend year 1 of ) a CPGE program after high schoolgraduation (column I) as well as on the proportion who are still in a CPGE two years afterhigh school graduation (column II). As the intervention has no effect on students’ average highschool grades, any effects on entry into CPGE would likely reflect an increased level of educa-tional aspiration among eligible students. But we find no significant effect on the proportionattending year 1 of a CPGE program. This result likely reflects that the intervention has noeffect on volunteer students’ awareness of the existence of CPGE nor on their willingness to getadmitted into these classes. Also we do not find any effect on the proportion attending year 2 ofa CPGE program, consistent with the assumption that the program has no effect on the abilityto persist in this type of program.

When we replicate this analysis separately on the lower-ability group, we find a significantnegative effect on the proportion of students who attend year 1 (−6.8 percent points). Thisvery strong negative impact likely reflects the negative effect of the program on high schoolachievement for this subgroup. We find a similar negative effect on year 2 as on year 1 attendance,consistent with the assumption that the intervention did not affect ability to persist for this lower-ability subgroup.

When we replicate this analysis on the higher-ability group, we find positive effects on bothyear 1 and year 2 attendance, but not significant at standard level. This slight improvement islikely driven by their increased academic performance in high school. Overall, there is no effecton the overall proportion of eligible students in CPGE, but a significant increase in variation inthis proportion across lower- and higher-ability students (+12.7 percent points increase).

There are two basic types of CPGE, one specialized in science and one specialized in hu-manities. Columns III to VI explore whether the effect of the intervention is different across

37

Page 64: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

Table 1.4 – The effect of the treatment on access to selective undergraduate programs (CPGE)

Bac major All majors Science major Humanities major

CPGE 1 CPGE 2 CPGE 1 CPGE 2 CPGE 1 CPGE 2

(I) (II) (III) (IV) (V) (VI)

Panel A: All volunteer students

Treatment −0.014 −0.015 0.011 −0.005 −0.062 −0.032

s.e. (0.030) (0.023) (0.040) (0.032) (0.042) (0.027)Obs. 551 551 351 351 200 200Mean dep. var. 0.165 0.112 0.156 0.123 0.179 0.095

Panel B: Lower ability

Treatment −0.065** −0.057** −0.065 −0.073** −0.074* −0.045*s.e. (0.030) (0.022) (0.041) (0.034) (0.043) (0.026)Obs. 273 273 131 131 142 142Mean dep. var. 0.137 0.081 0.105 0.088 0.164 0.075

Panel C: Higher ability

Treatment 0.056 0.037 0.073 0.046 −0.029 0.005s.e. (0.054) (0.038) (0.058) (0.043) (0.129) (0.066)Obs. 278 278 220 220 58 58Mean dep. var. 0.192 0.144 0.186 0.144 0.214 0.143

Panel D: Differential impact

Treatment × higher ability 0.121** 0.094** 0.138** 0.119** 0.045 0.050s.e. (0.060) (0.044) (0.069) (0.053) (0.116) (0.063)Obs. 551 551 351 351 200 200Mean dep. var. 0.055 0.063 0.081 0.056 0.050 0.068

The sample includes volunteer students from cohorts 2010 and 2011.The table shows the results from reduced-form regressions in which the probability to enter into a ClassePrératatoire program (CPGE1) or to gain access to the second year of a Classe Prépératoire program (CPGE2)is regressed on a treatment dummy, using students’ gender, pre-treatment ability score and socioeconomicfamily background as control variables.The first panel refer to the full sample whereas the second panel refers to subsample with lower pre-treatmentability score, the third panel to the subsample with higher pre-treatment ability score. Finally, the fourthpanel shows the estimated difference in the effect of the treatment between lower and higher ability students.To estimate this difference, we use the full sample and regress the dependent variable on the interactionbetween a dummy indicating treatment and a dummy indicating high ability, controlling for the treatmentdummy as well as for the full set of socio-demographic controls and their interactions with the higher abilitydummy.Within each panel, columns (III) and (IV) refer to students who specialize in science at the end of grade 10whereas columns (V) and (VI) to students who specialize in humanities.Standard errors clustered at the class level are reported in parentheses.** and * denote significance at the 5% and 10% levels, respectively.

38

Page 65: Inégalités scolaires, ségrégation et effets de pairs

1.5. Mechanisms: the role of tutors and peers

these two types of programs. It shows that the increased gap in CPGE attendance across abilitygroups is mainly driven by the scientific programs. For humanities, we observe a decline in at-tendance for both higher- and lower-ability students (although not significant at standard levelfor the higher-ability group) and no significant change in the gap.

1.5 Mechanisms: theroleoftutorsandpeers

The previous sections are suggestive that the program has positive effects on volunteer stu-dents with the best academic level pre-treatment, but negative effects on the other volunteers.One important question, however, is whether the intervention induces the same positive andnegative effects regardless of the tutors recruited to implement the program. Had all tutors thesame negative effect on lower-ability students, it would be suggestive that this negative effect isrelated to some of the deep features of the program, its being too time consuming for instance.By contrast, would the negative effect be found for some specific tutors only, the problem wouldlikely lie in the way the program is implemented rather than in its deep characteristics. A betterselection (or training) of tutors would be a way to improve the program.

1.5.1 Tutors’characteristics

To explore this issue, it is possible to build on the fact that students were randomly assignedto their first-year (grade 11) tutor. In this set-up, the difference in outcomes observed at theend of grade 11 between volunteer students assigned to different types of tutors likely providesan evaluation of the effect of tutors. We have information on the gender of tutors, their familysocio-economic background, the time elapsed since their admission at ENS and the design ofour intervention makes it possible to test whether it makes a difference to be assigned to onetype of tutors rather than to another one.

To implement this test, Table 1.5 (panel A) focuses on volunteer students and show theresults of regressing the average grade that they obtained at exams taken at the end of grade 11on a set of dummy variables describing tutors’ gender (male/female), their ENS admission year(ENS freshman/more senior ENS students) and their family socio-economic background (low

39

Page 66: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

SES/high SES) controlling for the same basic set of pre-treatment variables as in the previousregression analysis. Regressions are conducted on the full sample of volunteer students from thefirst cohort (column (I)) as well as separately on the lower- and higher-ability groups (columns(II) and (III)), since the effects of the intervention are very different across the two groups.

The regression results do not show any significant effect of the gender of the tutor. By con-trast, they reveal that the program induces significantly better outcomes when it is implementedby freshmen rather than by more senior tutors. This result holds true for both higher- and lower-ability participants. Within both ability groups, the difference in outcomes between recipientsassigned to a freshman and recipients assigned to a more senior tutor is actually larger than theaverage difference in outcomes between treated and control students shown in Table 1.3. Theseresults suggest that the efficiency of tutors does not really increase with their level of experiencein the program. 3 The enthusiasm and motivation of beginners appear to be a key ingredient forthe success of the program.

The regression results also show that recipients whose tutors come from a higher SES fam-ily background tend to obtain significantly better results than those whose tutors come from alower SES family background. Again these results hold true for both higher- and lower-abilityrecipients, although the effect is statistically significant for the higher-ability ones only. Theyare suggestive that it is the cultural level of tutors which matters the most, not their sociologicalproximity with their tutees.

1.5.2 Peergroupinfluence

Generally speaking, the results shown in Table 1.5 provide clear evidence that tutors matter.They are suggestive that a better selection (or training) of tutors can be a way to improve theefficiency of the intervention. We also explored whether it was possible to improve the programthrough a more careful constitution of the groups of tutees. As discussed above, the programinvolves participating in bi-monthly meetings with a specific tutor, but also with a specific group

3. Another possible explanation is that some unobserved characteristics of tutors explain jointly their persistencein the program and the quality of their tutoring. Tutors that are the most involved in the program may be thosethat are the most likely to persist, but also those that make the program more time consuming for students and,eventually, those that end up having the most negative impact on lower-ability tutees.

40

Page 67: Inégalités scolaires, ségrégation et effets de pairs

1.5. Mechanisms: the role of tutors and peers

Table 1.5 – The effect of tutor and assigned peers characteristics on grade 11 achievement

All Lower ability Higher ability

(I) (II) (III)

Panel A: Tutor characteristics

Female 0.044 0.007 0.001s.e. (0.175) (0.247) (0.233)Freshman 0.367*** 0.616*** 0.316*s.e. (0.124) (0.210) (0.180)High-SES 0.622*** 0.292 1.019***s.e. (0.184) (0.250) (0.266)Obs. 277 130 147

Panel B: Assigned peers characteristics

Prop. of girls 0.354* 0.010 0.367s.e. (0.187) (0.183) (0.247)Prop. of higher-ability 0.263 0.148 0.094s.e. (0.249) (0.274) (0.350)Prop. of high-SES −0.183 −0.555 −0.076

s.e. (0.313) (0.452) (0.461)Obs. 200 97 103

Panel A shows the results of regressing the average grade obtained at national ex-ams taken at the end of grade 11 by eligible students on three dummies indicatingwhether the tutor (to whom they were randomly assigned) is a woman, whetherthe tutor is a ENS freshman and whether the tutor comes from a high SES familybackground.Panel B shows the results of regressing the same dependent variable on variables de-scribing the composition of the group of peers to which the individual was randomlyassigned (proportion of girls, proportion of higher ability students, proportion ofstudents with high-SES family background).The sample includes eligible students from both cohorts in panel A, from cohort2011 only in panel B.Standard errors clustered at the tutoring-group level are reported in parentheses.***, ** and * denote significance at the 1%, 5% and 10% levels, respectively.

41

Page 68: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

of five other tutees. As discussed above, we introduced some controlled randomness in the designof these groups of peers for the first experimental cohort. Specifically, early September, at theend of the introductory week, we first asked students to form (freely) groups of three persons.In a second step, we paired randomly these 3-person groups in order to form the final list of 6-person groups of tutees. In this set-up, it is possible to look whether students randomly assignedto different elementary 3-person groups of peers obtain different results at the end of their 11thgrade.

To implement this test, Table 1.5 (panel B) focuses on the first cohort of recipients andshows the result of regressing their performance at the end of the 11th grade on a variable in-dicating the proportion of girls in the 3-person group of peers with whom they were randomlymatched as well as a variable indicating the proportion of higher-ability students and the propor-tion of students coming from a high-SES family, controlling for the same set of pre-treatmentcharacteristics as in the previous model. We do not find any effect of the proportion of higher-ability or high-SES peers on the performance of recipients at the end of 11th grade, but a positiveeffect of the proportion of girls. Further explorations suggest that the positive effect of femalepeers is particularly significant on higher-ability students.

1.6 Discussion

Generally speaking, our experiment suggests that students can volunteer to participate in aprogram, and persist in this program, even when this program ends up having strongly negativeeffects on a large fraction of them. To shed light on this paradox, we started in 2016 a survey onformer program participants, i.e., 3 to 4 years after their participation in the program. We askedthem about their perceptions of the benefits and drawbacks of the program. We also asked themwhether and why they decided to persist in (or quit) the program before the end, and about thequality of their interactions with the tutor or with their six-person group of peers. At this stage,we collected 206 responses from former participants, 111 of whom are lower-ability. 4

One feature of the program is that it does not simply try to improve students’ information on

4. Data collection is still underway and the sample size should increase in the near future.

42

Page 69: Inégalités scolaires, ségrégation et effets de pairs

1.6. Discussion

higher education, but also tries to improve their readiness for higher education, which explainsthe academic contents of the tutoring session. The potential drawback of such a focus is that itmay have a depressing effect on some students. Put differently, one reason for why we observea negative effect on lower-ability volunteers may be that they get the impression that highereducation is too difficult for them and that they will never be able to be as strong as their ENStutors.

For now, however, the results of the post-treatment survey are not really consistent with thisassumption. About 68% of respondents actually disagree with the statement that the tutor wasdifficult to understand (with no difference between lower-ability and higher-ability students).Also, about 84% of respondents agree that the tutor was close to their students (higher-ability:88%; lower-ability: 80%) and 84% agree that the tutor was positive and encouraging (higher-ability: 86%; lower-ability: 81%). Overall, a very large majority of respondents, including lower-ability ones, had a positive relationship with their tutor.

A second potential explanation for our results is that the program takes too much time andinduces students to allocate less time to their school homeworks. As it happens, the programrequires a fairly large amount of time. There are three to five 3-hour sessions per term. Thesesessions took place on Saturday afternoons in Paris (2pm – 5pm) and many students need 1 houror more to go to Paris. In addition, most tutors used to give specific homeworks to students withthe effect of increasing students’ workload between sessions.

The post-treatment survey confirms that tutoring sessions were perceived by many partici-pants as too time consuming. 52% of respondents agreed with the statement that the travel timewas long (higher-ability: 60%; lower-ability: 46%). 58% of respondents say that they did not doany school home-works on the Saturdays when the sessions took place; 38% of respondents saythey had a lot of work to do for the program between the sessions, and 24% say that they hadless time to do their school homework because of the program. These proportions are similar forlower-ability and higher-ability students. In 2010, several students actually complained aboutthe amount of time required by the program and the workload was reduced for the second co-

43

Page 70: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

hort. 5 Among our survey respondents, 98 respondents quit the program at the end of the firstyear of treatment and the majority explained that the main reason was that it took too muchtime.

The program was also time-consuming by providing participants with new friends and withnew opportunities to spend time with friends. Three or four year after the program, 90% ofrespondents report that the atmosphere of their tutoring was pleasant, 69% say that they becamefriends with other students from their tutoring group and 60% say they had kept in touch withformer participants from the program. 52% of students agreed with the statement that theyspent a lot of time outside of the sessions with the friends they met during the program and50% mentioned the friendships as one of the reasons why they persisted in the program in grade12. Overall, our post-treatment survey does not support the assumption that students werediscouraged by tutors, but rather that the program took up too much time, be it because ofthe length of the sessions themselves, the travel time, the between-session homework or thesocialization.

1.7 Bibliography

Avery, C. (2009). The effects of college counseling on high-achieving, low-income students:Results of a pilot study with a randomized controlled trial september, 2009. Technical Report16359, National Bureau of Economic Research.

Avery, C. (2013). Evaluation of the college possible program: Results from a randomized con-trolled trial. Technical Report 19562, National Bureau of Economic Research.

Bailey, M. J. and Dynarski, S. M. (2011). Gains and gaps: Changing inequality in u.s. collegeentry and completion. Working Paper 17633, National Bureau of Economic Research.

Bettinger, E. P., Long, B. T., Oreopoulos, P., and Sanbonmatsu, L. (2012). The role of ap-

5. As mentionned above, this reform was not followed by any clear improvement in the effect of the program,although the small size of the second cohort makes it difficult to draw any strong conclusion.

44

Page 71: Inégalités scolaires, ségrégation et effets de pairs

1.7. Bibliography

plication assistance and information in college decisions: Results from the h&r block fafsaexperiment*. The Quarterly Journal of Economics, 127(3):1205–1242.

Castleman, B. L. and Page, L. C. (2015). Summer nudging: Can personalized text messagesand peer mentor outreach increase college going among low-income high school graduates?Journal of Economic Behavior & Organization, 115:144–160.

Hoxby, C. M. and Avery, C. (2013). Low-income high-achieving students miss out on attendingselective colleges.

Hoxby, C. M. and Turner, S. (2013a). Expanding college opportunities for high-achieving, lowincome students. Stanford Institute for Economic Policy Research Discussion Paper, (12-014).

Hoxby, C. M. and Turner, S. (2013b). Informing students about their college options: A pro-posal for broadening the expanding college opportunities project. The Hamilton Project, Dis-cussion Paper, 3.

Roth, A. E. (2008). Deferred acceptance algorithms: History, theory, practice, and open ques-tions. International Journal of Game Theory, 36(3-4):537–569.

Smith, J., Pender, M., and Howell, J. (2013). The full extent of student-college academic un-dermatch. Economics of Education Review, 32:247–261.

45

Page 72: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

1.A Additionaltables

46

Page 73: Inégalités scolaires, ségrégation et effets de pairs

1.A. Additional tables

Table 1.A.1 – Balancing test on the baseline survey

Variable Control T − C s.e. Obs.

Interested in politics 0.344 +0.008 (0.049) 475Interested in economics 0.337 +0.024 (0.048) 471Interested in national news 0.689 +0.005 (0.047) 476Interested in international news 0.755 +0.020 (0.046) 475Interested in litterature 0.490 −0.010 (0.052) 474Interested in history 0.637 −0.004 (0.053) 474Interested in science and tech. 0.591 −0.008 (0.045) 472Interested in sports 0.576 +0.088* (0.050) 476Interested in social issues 0.639 −0.018 (0.051) 470Interested in arts 0.534 −0.027 (0.051) 471Gets help for homework 0.657 +0.004 (0.049) 478Positive self-assessment 0.613 +0.062 (0.047) 463Thinks about a job 0.720 −0.043 (0.047) 487Ambitions 5+ years higher ed. 0.593 −0.051 (0.052) 460Knows about Grandes Écoles 0.581 −0.058 (0.053) 473Knows about CPGE 0.563 −0.031 (0.051) 475Knows about university 0.548 +0.023 (0.053) 475Knows about IEP 0.357 −0.045 (0.049) 473Knows about IUT 0.141 +0.047 (0.040) 476Knows about BTS 0.394 −0.030 (0.052) 476Gets help for orientation 0.619 +0.032 (0.051) 469Believes in equal opportunities 0.416 +0.058 (0.054) 453

This table shows differencences between the control and the treatment group in the base-line survey completed by volunteer students at the end of grade 10, just before the randomdraw.For each variable, the first column gives the average of the control group, the secondcolumn gives the difference between the control and the treatment group controlling forcohort, high school and grade 11 major, the third column gives the standard error of thedifference and the last column gives the number of non-missing observations for thatvariable.

47

Page 74: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School Students

Table 1.A.2 – Balancing test on the sample of volunteer students

Variable Control T − C s.e. Obs.

Panel A: All volunteer students

1+ year behing 0.183 +0.041 (0.035) 558Female 0.622 −0.036 (0.044) 558High-SES 0.243 +0.019 (0.038) 558DNB Math score missing 0.072 +0.007 (0.025) 558Std DNB Math score 0.730 −0.104 (0.077) 518DNB French missing 0.068 +0.009 (0.025) 558Std DNB French score 0.557 −0.071 (0.084) 520

Panel B: Lower-ability students

1+ year behing 0.365 +0.038 (0.065) 280Female 0.603 −0.043 (0.064) 280Upperclass 0.262 +0.008 (0.057) 280DNB Math score missing 0.111 −0.002 (0.043) 280Std DNB Math score 0.416 −0.096 (0.123) 248DNB French score missing 0.103 +0.004 (0.043) 280Std DNB French score 0.209 −0.009 (0.129) 250

Panel C: Higher-ability students

1+ year behing 0.000 +0.000 (0.000) 278Female 0.640 −0.013 (0.065) 278Upperclass 0.224 +0.006 (0.055) 278DNB Math score missing 0.032 −0.001 (0.023) 278Std DNB Math score 1.021 −0.035 (0.106) 270DNB French score missing 0.032 −0.001 (0.023) 278Std DNB French score 0.881 −0.077 (0.107) 270

This table shows differences between the control and the treatment group on a set ofvariables from the administrative datasets.For each variable, the first column gives the average of the control group, the secondcolumn gives the difference between the control and the treatment group controllingfor cohort, high school and grade 11 major, the third column gives the standard errorof the difference and the last column gives the number of non-missing observationsfor that variable.

48

Page 75: Inégalités scolaires, ségrégation et effets de pairs

1.A. Additional tables

Tabl

e1.

A.3

–Th

eeffe

ctof

thet

reat

men

ton

perfo

rman

ceon

high

scho

olex

itex

amin

atio

ns,b

ycoh

ort

Coh

ort2

010

Coh

ort2

011

Dep

ende

ntva

riabl

eG

rade

11av

erag

esc

ore

Aver

ages

core

Gra

duat

ion

Hon

ours

Gra

de11

aver

age

scor

eAv

erag

esco

reG

radu

atio

nH

onou

rs

(I)(II

)(II

I)(IV

)(V

)(V

I)(V

II)

(VII

I)

Pane

lA:A

llvo

lunt

eers

tude

nts

Trea

tmen

t−0.031

0.02

40.

030

0.02

30.

004

−0.005

−0.011

−0.034

s.e.

(0.0

81)

(0.0

93)

(0.0

51)

(0.0

49)

(0.1

79)

(0.1

54)

(0.0

72)

(0.0

71)

Obs

.37

838

139

439

414

514

515

315

3

Pane

lB:L

ower

-abi

lity

Trea

tmen

t−0.203*

−0.213

−0.064

−0.086

−0.362

−0.238

−0.133

−0.070

s.e.

(0.1

12)

(0.1

53)

(0.0

76)

(0.0

68)

(0.3

10)

(0.2

30)

(0.1

12)

(0.0

95)

Obs

.18

819

120

220

270

7074

74

Pane

lC:H

ighe

r-ab

ility

Trea

tmen

t0.

152

0.30

9**

0.12

6**

0.12

9*0.

334

0.14

80.

115

−0.027

s.e.

(0.1

17)

(0.1

29)

(0.0

61)

(0.0

77)

(0.2

57)

(0.1

80)

(0.0

90)

(0.1

07)

Obs

.19

019

019

219

275

7579

79

Pane

lD:D

iffere

ntia

limp

act

Trea

tmen

t×hi

gher

abili

ty0.

356*

*0.

522*

*0.

189*

*0.

214*

0.69

50.

386

0.24

8*0.

043

s.e.

(0.1

70)

(0.2

21)

(0.0

93)

(0.1

11)

(0.4

25)

(0.2

87)

(0.1

47)

(0.1

42)

Obs.

378

381

394

394

145

145

153

153

Thet

able

show

sthe

resu

ltsfro

mre

duce

d-fo

rmre

gres

sions

inwh

ichva

riabl

esm

easu

ring

perfo

rman

ceon

high

scho

olex

itex

amin

atio

ns(b

acca

lauréa

t)ar

ereg

resse

don

atre

atm

entd

umm

y,us

ing

stude

nts’

gend

er,pr

e-tre

atm

enta

bilit

ysco

rean

dso

cioec

onom

icfa

mily

back

grou

ndas

cont

rolv

ariab

les.C

olou

mns

(I)to

(IV)s

how

ther

esul

tsfo

rcoh

ort2

010

and

colu

mns

(V)t

o(V

III)

forc

ohor

t201

1.C

olum

ns(I)

and

(V)s

how

thee

stim

ated

effec

toft

hetre

atm

entw

hen

thed

epen

dent

varia

blei

sthe

aver

ageg

rade

obta

ined

atex

amin

atio

nsta

ken

atth

eend

ofgr

ade1

1an

dco

lum

ns(II

)an

d(V

I)wh

enth

edep

ende

ntva

riabl

eist

heav

erag

egra

deac

ross

allex

amin

atio

ns.C

olum

ns(II

I)an

d(V

II)s

how

thee

stim

ated

effec

twhe

nth

edep

ende

ntva

riabl

eisa

dum

myi

ndica

ting

high

scho

olgr

adua

tion

(ave

rage

grad

eis1

0/20

orm

ore)

and

colu

mns

(IV)a

nd(V

III)

when

thed

epen

dent

varia

blei

sadu

mm

yind

icatin

ghi

ghsc

hool

grad

uatio

nwi

thho

nour

s(av

erag

egr

adei

s12/

20or

mor

e).

Fore

ach

coho

rt,th

efirst

pane

lref

erst

oth

eful

lsam

ple,

thes

econ

dpa

nelt

osu

bsam

plew

ithlo

werp

re-tr

eatm

enta

bilit

ysco

re,t

heth

irdpa

nelt

oth

esub

sam

plew

ithhi

gher

pre-

treat

men

tab

ility

scor

e.Fi

nally

,the

four

thpa

nels

hows

thee

stim

ated

diffe

renc

ein

thee

ffect

ofth

etre

atm

entb

etwe

enlo

wera

ndhi

gher

abili

tystu

dent

s.To

estim

atet

hisd

iffer

ence

,weu

seth

eful

lsa

mpl

eand

regr

esst

hede

pend

entv

ariab

leon

thei

nter

actio

nbe

twee

nad

umm

yind

icatin

gtre

atm

enta

ndad

umm

yind

icatin

ghi

ghab

ility,

cont

rolli

ngfo

rthe

treat

men

tdum

mya

swell

asfo

rthe

full

seto

fsoc

io-d

emog

raph

icco

ntro

lsan

dth

eirin

tera

ction

swith

theh

ighe

rabi

lityd

umm

y.St

anda

rder

rors

cluste

red

atth

eclas

slev

elar

erep

orte

din

pare

nthe

ses.

**an

d*d

enot

esig

nific

ance

atth

e5%

and

10%

levels

,res

pecti

vely.

49

Page 76: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School StudentsTa

ble

1.A

.4–

Thee

ffect

ofth

etre

atm

ento

npe

rform

ance

onhi

ghsc

hool

exit

exam

inat

ions

,byt

rack

Non

-scie

ntifi

ctra

cks

Scien

tifict

rack

Dep

ende

ntva

riabl

eG

rade

11av

erag

esc

ore

Aver

ages

core

Gra

duat

ion

Hon

ours

Gra

de11

aver

age

scor

eAv

erag

esco

reG

radu

atio

nH

onou

rs

(I)(II

)(II

I)(IV

)(V

)(V

I)(V

II)

(VII

I)

Pane

lA:A

llvo

lunt

eers

tude

nts

Trea

tmen

t−0.075

−0.186

−0.070

0.01

0−0.007

0.10

70.

063

−0.001

s.e.

(0.1

23)

(0.1

18)

(0.0

74)

(0.0

68)

(0.0

96)

(0.0

98)

(0.0

48)

(0.0

50)

Obs

.19

519

620

020

032

833

034

734

7

Pane

lB:L

ower

-abi

lity

Trea

tmen

t−0.210

−0.274*

*−0.147

−0.068

−0.285

−0.168

−0.020

−0.102

s.e.

(0.1

48)

(0.1

22)

(0.0

92)

(0.0

73)

(0.1

83)

(0.2

23)

(0.0

87)

(0.0

77)

Obs

.14

014

114

414

411

812

013

213

2

Pane

lC:H

ighe

r-ab

ility

Trea

tmen

t0.

657*

*0.

232

0.26

9*0.

284*

0.10

90.

276*

*0.

107*

*0.

057

s.e.

(0.3

35)

(0.2

38)

(0.1

57)

(0.1

42)

(0.1

13)

(0.1

12)

(0.0

51)

(0.0

68)

Obs

.55

5556

5621

021

021

521

5

Pane

lD:D

iffere

ntia

limp

act

Trea

tmen

t×hi

gher

abili

ty0.

868*

**0.

505*

*0.

416*

*0.

352*

*0.

394*

0.44

4*0.

126

0.15

9s.e

.(0

.319

)(0

.236

)(0

.171

)(0

.136

)(0

.219

)(0

.257

)(0

.095

)(0

.109

)Ob

s.19

519

620

020

032

833

034

734

7

Thet

able

show

sthe

resu

ltsfro

mre

duce

d-fo

rmre

gres

sions

inwh

ichva

riabl

esm

easu

ring

perfo

rman

ceon

high

scho

olex

itex

amin

atio

ns(b

acca

lauréa

t)ar

ereg

resse

don

atre

atm

entd

umm

y,us

ings

tude

nts’

gend

er,pr

e-tre

atm

enta

bilit

ysco

rean

dso

cioec

onom

icfa

mily

back

grou

ndas

cont

rolv

ariab

les.C

olum

ns(I)

to(IV

)sho

wth

eres

ults

fort

heno

n-sc

ientifi

ctra

cksa

ndco

lum

ns(V

)to

(VII

I)fo

rthe

scien

tifict

rack

.C

olum

ns(I)

and

(V)s

how

thee

stim

ated

effec

toft

hetre

atm

entw

hen

thed

epen

dent

varia

blei

sthe

aver

ageg

rade

obta

ined

atex

amin

atio

nsta

ken

atth

eend

ofgr

ade1

1an

dco

lum

ns(II

)an

d(V

I)wh

enth

edep

ende

ntva

riabl

eist

heav

erag

egra

deac

ross

allex

amin

atio

ns.C

olum

ns(II

I)an

d(V

II)s

how

thee

stim

ated

effec

twhe

nth

edep

ende

ntva

riabl

eisa

dum

myi

ndica

ting

high

scho

olgr

adua

tion

(ave

rage

grad

eis1

0/20

orm

ore)

and

colu

mns

(IV)a

nd(V

III)

when

thed

epen

dent

varia

blei

sadu

mm

yind

icatin

ghi

ghsc

hool

grad

uatio

nwi

thho

nour

s(av

erag

egr

adei

s12/

20or

mor

e).

Fore

ach

track

,the

first

pane

lref

erst

oth

eful

lsam

ple,

thes

econ

dpa

nelt

osu

bsam

plew

ithlo

werp

re-tr

eatm

enta

bilit

ysco

re,t

heth

irdpa

nelt

oth

esub

sam

plew

ithhi

gher

pre-

treat

men

tab

ility

scor

e.Fi

nally

,the

four

thpa

nels

hows

thee

stim

ated

diffe

renc

ein

thee

ffect

ofth

etre

atm

entb

etwe

enlo

wera

ndhi

gher

abili

tystu

dent

s.To

estim

atet

hisd

iffer

ence

,weu

seth

eful

lsa

mpl

eand

regr

esst

hede

pend

entv

ariab

leon

thei

nter

actio

nbe

twee

nad

umm

yind

icatin

gtre

atm

enta

ndad

umm

yind

icatin

ghi

ghab

ility,

cont

rolli

ngfo

rthe

treat

men

tdum

mya

swell

asfo

rthe

full

seto

fsoc

io-d

emog

raph

icco

ntro

lsan

dth

eirin

tera

ction

swith

theh

ighe

rabi

lityd

umm

y.St

anda

rder

rors

cluste

red

atth

eclas

slev

elar

erep

orte

din

pare

nthe

ses.

**an

d*d

enot

esig

nific

ance

atth

e5%

and

10%

levels

,res

pecti

vely.

50

Page 77: Inégalités scolaires, ségrégation et effets de pairs

1.A. Additional tables

Tabl

e1.

A.5

–Th

eeffe

ctof

thet

reat

men

ton

scor

esat

theB

acca

lauréa

tin

thes

cient

ifict

rack

Gra

de11

Gra

de12

,scie

ntifi

csub

jects

Gra

de12

,litt

erar

ysub

jects

Fina

lres

ult

Dep

ende

ntva

riabl

eAv

erag

eFr

ench

(writ

ten)

Fren

ch(o

ral)

TPE

Aver

age

Mat

hPh

y-C

hem

Biol

ogy

Aver

age

Hist

ory

Philo

soph

yLa

ng.1

Aver

age

Pass

Hon

ours

(I)(II

)(II

I)(IV

)(V

)(V

I)(V

II)

(VII

I)(IX

)(X

)(X

I)(X

II)

(XII

I)(X

IV)

(XV

)

Pane

lA:A

llvo

lunt

eers

tude

nts

Trea

tmen

t−0.087

−0.044

−0.036

−0.086

0.17

0*0.

061

0.22

5**

0.16

2*−0.081

0.06

00.

041

−0.174*

0.10

20.

063

0.01

9s.e

.(0

.096

)(0

.092

)(0

.101

)(0

.101

)(0

.097

)(0

.093

)(0

.096

)(0

.093

)(0

.067

)(0

.095

)(0

.095

)(0

.103

)(0

.102

)(0

.051

)(0

.054

)O

bs.

338

338

338

338

337

337

337

326

338

338

338

338

338

351

351

Pane

lB:L

ower

-abi

lity

Trea

tmen

t−0.270

−0.322*

*−0.043

−0.185

−0.017

−0.040

0.16

7−0.173

−0.238

−0.114

0.02

3−0.465*

*−0.194

−0.021

−0.121

s.e.

(0.1

75)

(0.1

57)

(0.1

86)

(0.1

82)

(0.2

02)

(0.1

79)

(0.2

14)

(0.2

11)

(0.1

66)

(0.2

03)

(0.2

19)

(0.2

18)

(0.2

20)

(0.0

91)

(0.0

73)

Obs

.12

212

212

212

212

212

212

211

312

212

212

212

212

213

113

1

Pane

lC:H

ighe

r-ab

ility

Trea

tmen

t0.

028

0.11

7−0.043

−0.017

0.27

6***

0.10

30.

289*

*0.

376*

**0.

032

0.18

90.

100

−0.032

0.28

5**

0.10

6**

0.10

5s.e

.(0

.113

)(0

.109

)(0

.120

)(0

.132

)(0

.102

)(0

.095

)(0

.113

)(0

.104

)(0

.075

)(0

.117

)(0

.134

)(0

.112

)(0

.114

)(0

.053

)(0

.066

)O

bs.

216

216

216

216

215

215

215

213

216

216

216

216

216

220

220

Pane

lD:D

iffere

ntia

limp

act

Trea

tmen

t×hi

gher

abili

ty0.

298

0.43

8**

0.00

10.

168

0.29

30.

143

0.12

20.

549*

*0.

270

0.30

20.

078

0.43

3*0.

479*

0.12

80.

226*

*s.e

.(0

.209

)(0

.182

)(0

.216

)(0

.222

)(0

.217

)(0

.186

)(0

.245

)(0

.233

)(0

.191

)(0

.236

)(0

.277

)(0

.244

)(0

.254

)(0

.096

)(0

.097

)Ob

s.33

833

833

833

833

733

733

732

633

833

833

833

833

835

135

1

Thes

ampl

einc

lude

svol

unte

erstu

dent

sfro

mco

horts

2010

and

2011

who

spec

ialize

din

scien

cein

grad

es11

and

12.

Thet

able

show

sthe

resu

ltsfro

mre

duce

d-fo

rmre

gres

sions

inwh

ichva

riabl

esm

easu

ringp

erfo

rman

ceon

high

scho

olex

itex

amin

atio

ns(b

acca

lauréa

t)ar

ereg

resse

don

atre

atm

entd

umm

y,us

ings

tude

nts’

gend

er,pr

e-tre

atm

ent

abili

tysc

orea

ndso

cioec

onom

icfa

mily

back

grou

ndas

cont

rolv

ariab

les.

Col

umn

(I)sh

owst

hees

timat

edeff

ecto

fthe

treat

men

twhe

nth

edep

ende

ntva

riabl

eist

heav

erag

egra

deob

tain

edat

exam

inat

ions

take

nat

thee

ndof

grad

e11;

colu

mns

(II),

(III)

and

(IV)s

how

thee

ffect

fore

ach

subj

ect

take

nth

atye

ar.C

olum

n(V

)sho

wsth

eeffe

ctwh

enth

edep

ende

ntva

riabl

eist

heav

erag

egra

deob

tain

edat

exam

inat

ions

take

nat

thee

ndof

grad

e12

insc

ientifi

csub

jects;

colu

mns

(VI),

(VII

)and

(VII

I)sh

owth

eeffe

ctfo

rea

chsc

ientifi

csub

jectt

aken

that

year.

Col

umn

(IX)s

hows

thee

ffect

when

thed

epen

dent

varia

blei

sthe

aver

ageg

rade

obta

ined

atex

amin

atio

nsta

ken

atth

eend

ofgr

ade1

2in

litte

rary

subj

ects;

colu

mns

(X),

(XI)

and

(XII

)sh

owth

eeffe

ctfo

reac

hlit

tera

rysu

bjec

ttak

enth

atye

ar.C

olum

n(X

III)

show

sthe

effec

twhe

nth

edep

ende

ntva

riabl

eist

heav

erag

egra

deac

ross

allex

amin

atio

ns,c

olum

n(X

IV)w

hen

thed

epen

dent

varia

blei

sadu

mm

yin

dica

ting

high

scho

olgr

adua

tion

(ave

rage

grad

eis1

0/20

orm

ore)

and

colu

mn

(XV

)whe

nth

edep

ende

ntva

riabl

eisa

dum

myi

ndica

ting

high

scho

olgr

adua

tion

with

hono

urs(

aver

ageg

rade

is12

/20

orm

ore)

.Th

efirst

pane

lref

erst

oth

eful

lsam

ple,

thes

econ

dpa

nelt

osu

bsam

plew

ithlo

werp

re-tr

eatm

enta

bilit

ysco

re,t

heth

irdpa

nelt

oth

esub

sam

plew

ithhi

gher

pre-

treat

men

tabi

lity

scor

e.Fi

nally

,the

four

thpa

nels

hows

the

estim

ated

diffe

renc

ein

the

effec

toft

hetre

atm

entb

etwe

enlo

wera

ndhi

gher

abili

tystu

dent

s.To

estim

ate

this

diffe

renc

e,we

use

the

full

sam

ple

and

regr

esst

hede

pend

entv

ariab

leon

the

inte

racti

onbe

twee

na

dum

my

indi

catin

gtre

atm

enta

ndad

umm

yind

icatin

ghi

ghab

ility,

cont

rolli

ngfo

rthe

treat

men

tdum

mya

swell

asfo

rthe

full

seto

fsoc

io-d

emog

raph

icco

ntro

lsan

dth

eirin

tera

ction

swith

theh

ighe

rabi

lityd

umm

y.St

anda

rder

rors

cluste

red

atth

eclas

slev

elar

erep

orte

din

pare

nthe

ses.

***,*

*and

*den

otes

igni

fican

ceat

the1

%,5

%an

d10

%lev

els,r

espe

ctive

ly.

51

Page 78: Inégalités scolaires, ségrégation et effets de pairs

1. Elite Tutors and Underprivileged High-School StudentsTa

ble

1.A

.6–

Thee

ffect

ofth

etre

atm

ento

nsc

ores

atth

eBac

calau

réati

nth

enon

scien

tifict

rack

sG

rade

11G

rade

12,s

cient

ifics

ubjec

tsG

rade

12,l

itter

arys

ubjec

tsFi

nalr

esul

t

Dep

ende

ntva

riabl

eAv

erag

eFr

ench

(writ

ten)

Fren

ch(o

ral)

TPE

Mat

hSo

cialS

c.Sc

ience

sAv

erag

eH

istor

yPh

iloso

phy

Lang

.1Av

erag

ePa

ssH

onou

rs

(I)(II

)(II

I)(IV

)(V

)(V

I)(V

II)

(VII

I)(IX

)(X

)(X

I)(X

II)

(XII

I)(X

IV)

Pane

lA:A

llvo

lunt

eers

tude

nts

Trea

tmen

t−0.098

−0.110

−0.061

−0.137

−0.064

−0.115

0.05

8−0.088

−0.216

0.06

5−0.194

−0.164

−0.072

0.00

9s.e

.(0

.117

)(0

.144

)(0

.130

)(0

.148

)(0

.119

)(0

.241

)(0

.137

)(0

.079

)(0

.132

)(0

.160

)(0

.127

)(0

.117

)(0

.074

)(0

.068

)O

bs.

199

199

199

199

184

110

198

196

199

199

196

199

200

200

Pane

lB:L

ower

-abi

lity

Trea

tmen

t−0.230*

−0.202

−0.125

−0.359*

−0.131

−0.014

0.08

6−0.107

−0.337*

*0.

082

−0.253*

−0.277*

*−0.159

−0.082

s.e.

(0.1

24)

(0.1

58)

(0.1

53)

(0.1

82)

(0.1

59)

(0.3

17)

(0.1

61)

(0.0

82)

(0.1

52)

(0.2

05)

(0.1

50)

(0.1

21)

(0.0

96)

(0.0

66)

Obs

.14

214

214

214

212

971

141

139

142

142

139

142

142

142

Pane

lC:H

ighe

r-ab

ility

Trea

tmen

t0.

325

0.01

60.

209

0.43

00.

127

−0.243

0.48

2*−0.229

−0.096

−0.137

−0.322

0.06

70.

193

0.19

6s.e

.(0

.294

)(0

.325

)(0

.279

)(0

.329

)(0

.221

)(0

.441

)(0

.280

)(0

.208

)(0

.282

)(0

.299

)(0

.364

)(0

.206

)(0

.117

)(0

.174

)O

bs.

5757

5757

5539

5757

5757

5757

5858

Pane

lD:D

iffere

ntia

limp

act

Trea

tmen

t×hi

gher

abili

ty0.

555*

*0.

218

0.33

40.

789*

*0.

258

−0.229

0.39

7−0.123

0.24

1−0.219

−0.069

0.34

40.

352*

*0.

278*

s.e.

(0.2

66)

(0.3

03)

(0.2

80)

(0.3

26)

(0.2

63)

(0.4

89)

(0.2

84)

(0.1

90)

(0.2

75)

(0.3

10)

(0.3

52)

(0.2

08)

(0.1

45)

(0.1

54)

Obs.

199

199

199

199

184

110

198

196

199

199

196

199

200

200

Thes

ampl

einc

lude

svol

unte

erstu

dent

sfro

mco

horts

2010

and

2011

who

spec

ialize

din

hum

aniti

esin

grad

es11

and

12.

Thet

able

show

sthe

resu

ltsfro

mre

duce

d-fo

rmre

gres

sions

inwh

ichva

riabl

esm

easu

ringp

erfo

rman

ceon

high

scho

olex

itex

amin

atio

ns(b

acca

lauréa

t)ar

ereg

resse

don

atre

atm

entd

umm

y,us

ing

stude

nts’

gend

er,pr

e-tre

atm

enta

bilit

ysco

rean

dso

cioec

onom

icfa

mily

back

grou

ndas

cont

rolv

ariab

les.

Col

umn

(I)sh

owst

hees

timat

edeff

ecto

fthe

treat

men

twhe

nth

edep

ende

ntva

riabl

eist

heav

erag

egra

deob

tain

edat

exam

inat

ions

take

nat

thee

ndof

grad

e11;

colu

mns

(II),

(III)

and

(IV)s

how

thee

ffect

for

each

subj

ectt

aken

that

year.

Col

umn

(V)s

hows

thee

ffect

when

thed

epen

dent

varia

blei

sthe

aver

ageg

rade

obta

ined

atex

amin

atio

nsta

ken

atth

eend

ofgr

ade1

2in

scien

tifics

ubjec

ts;co

lum

ns(V

I)an

d(V

II)

show

thee

ffect

fore

ach

scien

tifics

ubjec

ttak

enth

atye

ar.C

olum

n(V

III)

show

sthe

effec

twhe

nth

edep

ende

ntva

riabl

eist

heav

erag

egra

deob

tain

edat

exam

inat

ions

take

nat

thee

ndof

grad

e12

inlit

tera

rysu

bjec

ts;co

lum

ns(X

),(X

I)an

d(X

II)s

how

thee

ffect

fore

ach

litte

rary

subj

ectt

aken

that

year.

Col

umn

(XII

)sho

wsth

eeffe

ctwh

enth

edep

ende

ntva

riabl

eist

heav

erag

egra

deac

ross

allex

amin

atio

ns,c

olum

n(X

III)

when

thed

epen

dent

varia

blei

sadu

mm

yind

icatin

ghig

hsc

hool

grad

uatio

n(a

vera

gegr

adei

s10/

20or

mor

e)an

dco

lum

n(X

IV)w

hen

thed

epen

dent

varia

blei

sadu

mm

yind

icatin

ghig

hsc

hool

grad

uatio

nwi

thho

nour

s(av

erag

egra

deis

12/2

0or

mor

e).

Thefi

rstpa

nelr

efer

sto

thef

ulls

ampl

e,th

esec

ond

pane

lto

subs

ampl

ewith

lowe

rpre

-trea

tmen

tabi

litys

core

,the

third

pane

lto

thes

ubsa

mpl

ewith

high

erpr

e-tre

atm

enta

bilit

ysco

re.F

inall

y,th

efou

rthpa

nel

show

sthe

estim

ated

diffe

renc

ein

thee

ffect

ofth

etre

atm

entb

etwe

enlo

wera

ndhi

gher

abili

tystu

dent

s.To

estim

atet

hisd

iffer

ence

,weu

seth

eful

lsam

plea

ndre

gres

sthe

depe

nden

tvar

iable

onth

eint

erac

tion

betw

een

adum

myi

ndica

ting

treat

men

tand

adum

myi

ndica

ting

high

abili

ty,co

ntro

lling

fort

hetre

atm

entd

umm

yasw

ellas

fort

hefu

llse

tofs

ocio

-dem

ogra

phic

cont

rols

and

their

inte

racti

onsw

ithth

ehig

her

abili

tydu

mm

y.St

anda

rder

rors

cluste

red

atth

eclas

slev

elar

erep

orte

din

pare

nthe

ses.

***,*

*and

*den

otes

igni

fican

ceat

the1

%,5

%an

d10

%lev

els,r

espe

ctive

ly.

52

Page 79: Inégalités scolaires, ségrégation et effets de pairs
Page 80: Inégalités scolaires, ségrégation et effets de pairs
Page 81: Inégalités scolaires, ségrégation et effets de pairs

Chapitre 2PersistentClassmates : HowFamiliarity

withPeersProtectsfromDisruptiveSchool

Transitions

Ce chapitre a été écrit avec Son Thierry Ly.

Il a été publié en tant que document de travail de l’École d’économie de Paris (numéro2013-21).

Nous remercions Éric Maurin, Julie Berry Cullen, Luc Behaghel, Gordon Dahl, VictorLavy, Thomas Piketty, Corinne Prost, Gwenaël Roudaut, Camille Terrier et Margaux Vi-nez pour leurs commentaires et suggestions. Nous remercions également les participants desconférences SOLE (Arlington, 2014) et IWAEE (Catanzaro, 2013), du séminaire d’écono-mie appliquée de l’École d’économie de Paris ainsi que du séminaire interne du Crest. Noussommes également reconnaissants à la Direction de l’évaluation, de la prospective et de laperformance au Ministère de l’Éducation nationale et en particulier à Cédric Afsa qui afacilité notre accès aux bases de données.

Cette recherche a bénéficié d’un soutien financier du CEPREMAP.

55

Page 82: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

2.1 Introduction

If peer effects exist, policies that influence the allocation of individuals with their peers couldimprove welfare. This idea has aroused a huge amount of interest by economists, despite thegreat empirical challenges raised by endogenous sorting. For example, many papers investigatethe role of neighborhood (Goux and Maurin, 2007; Kling et al., 2007) and school composition(Hoxby, 2000; Angrist and Lang, 2004; Cullen et al., 2006; Lavy et al., 2012b) on students’outcomes. The literature is much less extensive when it comes to estimating peer effects withinclasses, although most students’ interactions are likely to occur at this level. It is also unfortunatefrom a policy point of view, because school administrators have much more leeway in setting upclasses than policymakers have in influencing neighborhood and school choice. The main studieson the subject are based on experimental data either in primary schools in developing countries(Duflo et al., 2011) or in colleges in developed countries (Carrell et al., 2011). Evidence basedon observational data is rare (see e.g. Lavy et al., 2012a; Fruehwirth, 2013), since it requires bothrich data at class level and conclusive natural experiments that are rarely available.

In this paper, we identify classroom peer effects by using natural experiments aroused by thespecific institutional features of student allocation across classes, within schools, in the first yearof high school in France (10th grade). 1 By definition, a high school principal does not know herfirst-year students before the beginning of the school year. As she has to allocate them acrossclasses before that time, she has only a finite set of information observed in their registration filesto go on, including e.g. gender, socioeconomic status (SES), middle school and 9th grade classof origin, the list of optional courses and scores obtained in their grade 9 class. Using a uniqueadministrative dataset, we are able to observe almost all characteristics observed by principalsabout their cohort of freshmen.

Usually, the registration files a given principal has to consider in a given school year are alldifferent from one another. But there are rare cases where she gets two freshmen registrationfiles that are exactly or very similar with regard to all these characteristics (denoted ”similar-file”or SF students). For example, these two students, call them Aurélien and Benoit, are both low-

1. In France, secondary education consists of two blocks: middle school (grades 6 to 9) and high school (grades10 to 12). High schools are generally separate from middle schools.

56

Page 83: Inégalités scolaires, ségrégation et effets de pairs

2.1. Introduction

SES boys coming from the same 9th grade class from the same middle school, who got verysimilar scores in grade 9, and ask for the same optional courses in grade 10. If the high schoolprincipal decides to separate them across two 10th grade classes X and Y, the key intuition isthat the choice of assigning Aurélien to class X and Benoit to class Y or the other way around should beas good as random, because she does not have any additional relevant information to distinguishbetween them (see Figure 2.2). Note that we do not assume that the decision to separate thestudents or to keep them in the same class is exogenous, but only that the assignment is randomin case she decides to separate them. We are able to provide strong evidence supporting thisassumption, using the anonymous scores obtained at the national exam taken by students at theend of 9th grade, which is unobserved by principals.

Our estimation strategy is as follows. First, we restrict our analysis to students who have asimilar-file mate who ends up in a different class in the same high school. This is the case foronly 0.8 percent of the population of high school freshmen, leaving us with a sample of 28,053students over the 2004-2011 period. Then, our strategy is to compare a student with his orher similar-file mate only. We do this by controlling in all regressions for a single fixed effectaccounting altogether for freshmen’s high school, cohort, middle school and class of origin, andall other characteristics observed in registration files. Finally, we investigate how the outcomegap between two similar-file students relates to differences in the characteristics of their 10thgrade classes. In other words, the random assignment of Aurélien and Benoit between classesX and Y can be seen as a given lottery or quasi-experiment, and the whole set of comparablelotteries happening in French high school between 2004 and 2011 allows us to estimate theeffect of a number of classroom environment dimensions.

Note that our strategy differs fundamentally from matching strategies. In a matching strat-egy, econometricians use observed variables to match students in order to reduce the confound-ing bias, though the bias does not vanish to zero because of unobserved variables that are likelyto be correlated to potential outcomes. In our case, the set of variables that we observe is almostexactly identical to the set of variables that determine the class assignment by the high schoolprincipal. This would not be the case if, for instance, high school principals had a personalknowledge of the students, or if the students had to write application essays. We provide strong

57

Page 84: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

evidence that class assignment is indeed random conditional to our fixed effect.

Common measures of peer characteristics are considered in our main regressions, such aspeer ability, gender and socioeconomic status (SES). Yet surprisingly, the most robust effectthat emerges comes from the number of persistent classmates (PC) a student gets, i.e. classmateswho were already in the freshman’s class in the last year of middle school. Not only does thenumber of PCs significantly reduce the risk of repeating freshman year, but by contrast withother measures of peer characteristics, the effect also endures in the long run and is associatedwith differences in graduation rates at the end of high school.

The second part of this paper sets out to understand why the presence of these persistentclassmates generates positive spillovers. Although the number of PCs might capture some omit-ted class characteristics associated with peer ability for instance, our investigations suggest thatstudents benefit from having more persistent classmates only because of a familiarity mecha-nism, i.e. because they know each other well. Three findings lead us to this conclusion. First,the estimates are extremely robust to the inclusion or not of controls for the other classmates’characteristics (ability, gender and SES). Second, we find that the PC effect is highly heteroge-neous and mainly driven by low-achieving, low-SES students. Also, the effect seems slightlystronger when these students are suddenly more exposed to high-SES students. This is consis-tent with our interpretation, as being surrounded by familiar faces should matter more when thetransition to high school is highly disruptive. Third, these students at risk of underachievementin high school are not more impacted by their high- than their low-achieving persistent class-mates, which would be expected if the PC effect was driven by their higher unobserved ability.Robustness checks are provided for our main results.

This study makes three important contributions to the literature. First, it sheds light on theongoing debate on the complexity of peer effects. While some recent studies offer an insightinto the role of social networks during school transitions (see e.g. Lavy and Sand, 2012), we usenatural experiments that provide a stronger identification of the impact of classmates’ charac-teristics, including their social links. In keeping with Foster (2006), our results also take issuewith popular belief that agents are more influenced by their friends than by other peers (see also

58

Page 85: Inégalités scolaires, ségrégation et effets de pairs

2.1. Introduction

Halliday and Kwak, 2012). In particular, students could be influenced by former classmates thatare not friends, though there was no theoretical reason to expect classmate persistence to havepositive effects. 2 As a matter of fact, recent results found by De Giorgi and Pellizzari (2013)on Bocconi University were suggesting the opposite, as they find a decrease in performance forundergraduate students that are assigned more often together across classes. Our results showthat former peers generate positive spillovers when reassigned together in the context of schooltransitions, emphasizing how peers may not have the same effect depending on the timing andcontexts.

Second, our findings need to be considered in relation to the strand of literature on the impactof mobility across environments. Several papers find that policies that enhance neighborhoodor school choice, or expand students’ access to high-performing schools have been unexpectedlyinefficient in improving students’ educational outcomes (Angrist and Lang, 2004; Cullen et al.,2006; Kling et al., 2007). In line with other recent works (Lavy and Sand, 2012; Gibbons et al.,2013), this paper suggests that these results could be due to the disruption caused to a student’senvironment by such policies.

The third contribution is more policy-oriented. Policy recommendations to improve achieve-ment in high school are particularly relevant, in view of the issues at stake. In many countries,formal tracking is implemented in high school, such that short-term low achievement in thefirst year may end up with mismatched enrollment in low-skill tracks. In addition, the start ofhigh school is often simultaneous with the end of compulsory schooling, meaning that under-achievement may lead to drop-out at that stage compared to previous stages. As our analysisshow, principals could substantially raise the achievement in high school of low-ability students

2. On the one hand, former classmates may be friends, and recent evidence suggest that friends may have apositive effect on well-being and achievement (Calvò-Armengol et al., 2009; Lavy and Sand, 2012) Yet formerclassmates may also simply be peers with whom it is easier to talk during the early weeks, to sit next to in theclassroom or to ask for help, thus making it easier to adapt to higher academic expectations and less supervisionfrom teachers. Even without friendship bonds, familiarity within the classroom could therefore reduce anxiety,prevent social isolation and foster a student’s sense of belonging in the new school and class. On the other hand,former classmates could prevent students from socializing with new peers, or be conducive to bad behavior in theclassroom if disruptive students stay together. Former classmates may also be enemies rather than friends, and theirpresence could be detrimental to welfare and achievement. Mora and Oreopoulos (2011); Lavy and Sand (2012)show that ”non-reciprocal friends” (peers that consider you as a friend while you do not, or vice versa) seem to haveno or negative effects on outcomes.

59

Page 86: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

by assigning them in freshman year with some familiar classmates. Our estimates suggests thattheir risk of repeating freshman year could be reduced by 4.5 percentage points, and their grad-uation rate raised by the same amount. This simple recommendation on class composition maythus improve their performance by around 13 percent at no cost, while highly expensive policiesusually target this population of students at risk. Moreover, moving these students across classesbased on their former networks is not a zero-sum game, in contrast to their ability or gender.Although a high-ability student or a female student might be of benefit to everyone, 3 groupingtogether freshmen from the same class should not affect freshmen from other classes.

Section 2.2 describes the institutional context and the data. Section 2.3 describes the identi-fication strategy. We present the results and discuss the distribution of the effect and its mecha-nisms in section 2.4. Robustness checks are then provided in section 2.5. Section 2.6 discussesthe implications of our results and concludes.

2.2 Institutionalcontextanddata

2.2.1 ThehighschoolcurriculuminFrance

2.2.1.1 Enrollingingeneralhighschools

By the end of middle school (grades 6 to 9), students apply for either vocational or generalstudies, with the approval of middle school teachers. Around two-thirds of 9th grade studentsopt for the general track, in which case they apply to general high schools in their district. 4 Rulesof admission then differ by school district and year, but they usually depend on the students’home address, socioeconomic status and school performance (9th grade scores). Allocation isover by the end of June and high school administrations receive the registration files on theirfuture 10th graders in the first week of July.

3. Carrell et al. (2011) built an algorithm designed to optimize peer effects and failed to do so partly for thisreason.

4. Students opting for the vocational track have to choose a specialty, and vocational high schools usually haveplaces in only one or two classes per specialty. We have therefore decided to exclude vocational high schools fromthis study, since class composition is highly constrained and is not really policy-relevant in these schools.

60

Page 87: Inégalités scolaires, ségrégation et effets de pairs

2.2. Institutional context and data

At the same time, 9th grade students take national anonymous exams in the end of June inthree core subjects: mathematics, French and history-geography. These exams are not gradedby teachers from the student’s middle school, but externally (with scores between 0 and 40).The resulting anonymous scores are combined with continuous assessment scores, i.e. scores obtainedin 9th grade in all courses and graded by the students’ own teachers (between 0 and 20). Theanonymous scores and continuous assessment scores are combined to compute a total score thatdetermines whether they pass the middle school graduation diploma (Diplôme national du brevetor DNB hereinafter). 5

The anonymous scores are only available in mid-July. By that time, students have completedtheir administrative registration for high school and class compositions are already determined.In addition, these scores are not sent to the high school during the summer 6. Therefore, theprincipals assign freshmen to grade 10 classes without knowing their anonymous scores, andonly having their continuous assessment scores.

2.2.1.2 Thecurriculumingeneralhighschools

In France, freshman year marks a difficult milestone for students attending general highschools. The average ability of peers raises suddenly as one third of students, usually the lowestachieving ones, has enrolled in vocational studies after middle school. This may not only in-crease teachers’ expectations, but it might also affect negatively students’ self-esteem. Students’percentile rank within their class drops from 64 to 52 in average between grade 9 and 10. Nat-urally, this change hits students asymmetrically. While students in the top half of the abilitydistribution only fall from the 78th to the 71st percentile rank, the other half drops from the49th to the 32nd percentile rank. 7 Students also undergo a shock in the sociocultural dimen-sion, as reflected by the share of high-SES that increases from 22 percent in middle school to30 percent in general high school.

5. Note that students do not need to pass to go on to high school.6. Some students do inform the high school of their results in the anonymous exams once they receive them

(although this is not a requirement), but informal discussions we have had with some high school administrationssuggest that this hardly ever happens. In any case, principals do not have these scores for all students, so they arehighly unlikely to use them to assign students across classes.

7. These figures are computed using the anonymous exam scores at the DNB exam.

61

Page 88: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

At the same time, the school change triggers an intense disruption in students’ networks,as illustrated by the amount of persistent classmates in their class. Figure 2.1 plots the typicalstudent’s class composition for each grade. As a benchmark, the share of persistent classmatesremains fairly constant throughout middle school at around 30 percent. 8 Yet in grade 10, thenumber of PCs drops dramatically. Only 5 percent of their classmates come from the same classand 20 percent from the same middle school. Assuming that students rarely know the studentsfrom other middle schools, this means that students do not know at least 80 percent of theirclassmates at the beginning of the year. This figure decreases again in the subsequent grades,coming to 45 percent in grade 12 due to the partial carryover of major-specific classes fromgrade 11.

It turns out that these disruptions happen precisely at a time when achievement is highlydeterminant for long-term outcomes. By the end of the year, students have to apply for a majorthat will determine their 11th and 12th grade courses, their baccaulauréat (high school graduationexam) specialty, and the university tracks they will be able to apply for at the end of high school.First, students have to opt for the academic or technological track, the former being historicallymore prestigious with harder, more academic courses. If students are not accepted for any ofthe majors they apply for, they can opt for an alternative major suggested by teachers, if any.Otherwise, they have to repeat grade 10 with a view to applying again the following year. 9 As aresult, repetition rate is exceptionally high in the first year of high school (10 percent comparedto 5 percent in average in middle school).

Lastly, high school ends at grade 12 with the baccaulauréat exam. This high school graduationexam includes anonymous tests in different subjects depending on the student’s major, and isalmost entirely graded by teachers outside the student’s high school. Passing the baccaulauréatis required in most higher education tracks, and it is sufficient to access most university tracks.

8. In grade 6, we are only able to identify students from the same elementary school, as we do not have anyinformation on the classes in grade 5.

9. Students not allowed to move up to the next grade may appeal the decision to a committee external to theschool, whose decision is final. Those refused permission to enroll in the major of their choice may appeal thedecision to the principal or even negotiate with a different high school. In any case, the final decision to award astudent a place on a given major rests with the principal of the high school attended in 11th grade. The principalswe met reported that very few students in each year actually go against their teachers’ advice.

62

Page 89: Inégalités scolaires, ségrégation et effets de pairs

2.2. Institutional context and data

6 7 8 9 10 11 120 %

10 %

20 %

30 %

40 %

50 %

60 %

70 %

80 %

90 %

100 %

Middle school High school

APersistentclassmates

BFrom thesame school

C Other origin

DRepeating

students

This graph shows the typical composition of a student’s classroom when he or she enters a given gradeg ∈ 6, . . . , 12. For each grade g, the sample consists of students entering that grade for the first time (i.e.repeating students are excluded) for cohorts 2000 to 2008 (when they never repeat, students from cohort2000 enter grade 6 in 2000, grade 7 in 2001, etc.).Reading: Among the classmates of a student entering grade 9, 32 percent are persistent classmates from8th grade, 82 − 32 = 50 percent are classmates who were in different classes from the same school in 8thgrade, 94 − 82 = 12 percent are non-repeating students who were in a different school in 8th grade, and6 percent are students repeating 9th grade.Notes about the data: Cohorts 2000 and 2001 are missing for grades 6 and 7; cohort 2008 missing forgrade 12. We only know the school attended in grade 5, not the classroom, therefore we cannot distinguishbetween persistent classmates and former schoolmates (stacks A and B) in grade 6.Note that during middle school, the average share of persistent classmates is around 30 percent. This is dueto the fact that classes are generally reshuffled from one year to another.

Figure 2.1 – Composition of the typical classroom from a non-repeating student’s point of view

63

Page 90: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

2.2.2 Theclass-assignmentmechanism

In France, students are assigned to the same class for all subjects for the entire school year.Classmates therefore have even more potential influence over each other’s outcomes, as theyspend most of the day together throughout the school year. In practice, classes are assigned inearly July immediately following student registration for high school, and two months beforethe start of the school year in September. Classes are assigned entirely by hand, without theaid of computer algorithms. This process is non-random, even for first year students. However,unlike with the other grades, high school principals do not know the students personally whenthey assign them to classes. Consequently, high school principals rely solely on the set of formalregistration data given in the students’ files and observable, for the most part, in our dataset. 10

First, principals look at the options chosen by students. While most courses are part of thecommon core curriculum and are the same for all (e.g. mathematics and French), students havecertain subjects to choose from such as which foreign language they prefer to study (e.g. Englishor Spanish) and some additional optional courses (e.g. Latin and ancient Greek). Students whotake the same options are often grouped in the same class, for the sake of convenience whentimetabling classes.

Conditional on students’ options, school principals generally (but not necessarily) try tobalance classes in terms of gender and ability. 11 They rely on the formal data contained instudents’ personal registration files: personal details on the students and their families (mainlygender, age and parents’ occupations), scores obtained in 9th grade subjects (between 0 and 20)and 9th grade teachers’ comments. These short comments are not written for principals but for

10. High schools are usually separate from middle schools. However, 16 percent of French students attendschools that cover the entire secondary curriculum (mostly private schools). In these schools, principals mightknow 10th grade students coming in from their own middle school. Nonetheless, middle school and high schoolstill have separate deputy heads to whom principals generally delegate class composition. These deputy heads donot necessarily coordinate over class assignment of 10th grade students, such that the high school deputy heads maywell not use any more information than the registration file. This is supported by our exogeneity test (see section2.3.1), which suggests that students are conditionally randomly assigned even in this case. We have therefore chosento keep students from these schools in our sample. Taking them out of the sample has virtually no impact on theresults.

11. There is no legal requirement to do so, but the 1975 Haby Act that made middle schools comprehensiveestablished a tacit rule for schools to favor within-class heterogeneity. Besides, principals probably want to avoidputting all low-achieving students together in one class that consequently risks being unruly.

64

Page 91: Inégalités scolaires, ségrégation et effets de pairs

2.2. Institutional context and data

parents, to assess student performance and behavior in each subject. For example, teachers maywrite that they are satisfied with the student’s effort and participation in class, or that the studenttalks too much with his or her classmates in class (without naming names). These reports donot include recommendations to high school principals such as, ”Do not put these two studentstogether”. Only on the rarest of occasions would such advice be given to principals, and thenvia an informal channel.

Unlike with other grades where principals know their students, they cannot count on anypersonal knowledge of them such as motivation or emotional resilience. 12

In addition, in French high schools, neither parents nor students can ask for placement inspecific classes or with friends. As a rule, families do not liaise directly with principals over classassignment. 13 Instead, tactics to get children assigned to a better class mainly take the formof choosing specific options. In particular, families may encourage their children to take ”elite”options (e.g. German as a first foreign language, or Latin) to get them assigned to a better class.This has no impact on our identification since we only compare students taking the same options.Lastly, students are only notified of their class assignment the week before the first day of school,and they are not allowed to change it.

There are good reasons to believe that principals do not use all the detailed formal datathey have on students to assign them to a class. As revealed by the class assignment sessionswe attended, simply allocating classes on the basis of options is already complicated and time-consuming enough as it is. Again, they have to do it by hand and take a large number of con-straints into account, while a host of other tasks are pending both to wind up the current schoolyear and prepare for the new one. Therefore, if two freshmen’s registration files look broadlysimilar, principals are highly unlikely to spend time studying their characteristics to try to findsome minor detail to differentiate between them. In particular, principals do not telephone fam-ilies or middle school principals to get further information on students. In practice, then, two

12. With other grades, they might, for example, separate two friends who are disrupting lessons, or place afragile student with his or her friends for emotional support.

13. They do so only in very special cases, such as where car sharing needs to be organized for students in ruralareas.

65

Page 92: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

10th grade students do not need to be exactly identical on paper to be deemed indistinguishableduring the class assignment process. Section 2.3 provides empirical evidence in support of thisfield observation.

2.2.3 Data

2.2.3.1 Datasets

The empirical analysis is based on two administrative datasets from the French Ministry ofEducation.

— Administrative registration records: for all students enrolled in French public and publicly-funded private middle and high schools from 2001 to 2012. This dataset contains stu-dents’ personal details (e.g. date and region of birth, gender and parents’ occupation) andinformation on their education: in particular grade, school and class attended, optionstaken, grade and school attended in t− 1 (but not the class attended in t− 1).

— Examination records: for all students from 2004 to 2011. This dataset contains personaldetails and informal scores in the 9th grade DNB (both the anonymous exam and con-tinuous assessment scores) and 12th grade baccaulauréat exams.

These datasets are exhaustive and the variables we make use of are well reported for almost100 percent of the population. Unfortunately, students do not have personal identification num-bers so that they can be tracked through the different datasets. Yet for each 10th grade student,we need to know at least which class they attended in 9th grade, their grade in t+ 1 (repeating10th grade or moving to 11th grade) and chosen major if they do move to 11th grade. We alsohave to match the administrative and the examination records.

In order to find this missing information, we use a matching procedure taking the students’personal details in each dataset. The procedure is based mainly on date and region of birth,gender, grade and school attended in years t and t − 1. We manage to match 9th grade classfor 94 percent and DNB exam scores for 81 percent of new 10th grade students. The remainingstudents either had no match in the auxiliary dataset (60 percent of occurrences) or multiple

66

Page 93: Inégalités scolaires, ségrégation et effets de pairs

2.2. Institutional context and data

matches (40 percent of occurrences). 14 The online appendix provides further details on thematching procedure. In the rest of the paper, all regressions include controls for the share ofmissing observations in the class, although they do not change the estimates.

Our identification compares the set of information on students observed in our dataset tothe information observed by principals in their registration files at the time of class allocation.So it is useful at this stage to summarize which variable is observed by whom:

— Covariates observed by both the principal and the econometrician: Date of birth, city of res-idence, gender, parents’ occupation, foreign languages and options chosen, 9th gradecontinuous assessment scores in all subjects, middle school and 9th grade class. We alsoobserve a numerical measure of student behavior as graded by the student’s head teacher;this information is missing for the first two cohorts (out of eight) and it will therefore beused only for robustness checks.

— Covariates observed by the principal, but not the econometrician: Students’ first and lastname (from which, in particular, ethnicity could be inferred), and exact home address.The principal also observes the 9th grade teachers’ written comments, which may informof behavioral issues. Again, these comments are very short (one sentence from eachteacher), written for parents, and do not include information about the relationshipswith specific students.

— Covariates observed by the econometrician, but not by the principal: Anonymous DNB examscores.

Most information observed by the principal is thus contained in the dataset. Although we donot observe the teachers’ written comments, we do observe a behavioral score for three-quartersof the sample, which contains precisely the information we expect the principals to infer fromthe written comment 15. As we will show, the anonymous DNB exam scores are key in this study,since they allow us to test our main ientification assumption.

14. A multiple match means that two students are found in the same school × grade × year with the same dateof birth, gender, etc.). This may occur only randomly and is not likely to bias our results.

15. Note that it would be hard, in any case, to work directly with the written comments even if we could observethem. If we were to do so, we would try to build a score to summarize the information contained in the comment,which is the purpose of this behavioral score.

67

Page 94: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Descriptive statistics are presented in Table 2.1 for the entire population of 10th gradestudents (column I). In particular, it is interesting to note that the average freshman has 1.7persistent classmates out of the 8.3 former classmates enrolled in their high school. 16

2.3 Identification

The identification strategy used in this paper is based on a quasi-experimental setting. Sinceprincipals do not know first-year students personally, principals cannot easily distinguish be-tween two students who are similar ”on paper”, i.e. who exhibit identical or very close registra-tion files. If such students are separated into different classes, it is credible to assume that theywere randomly assigned to their classes. Therefore, classroom peer effects are identified by stick-ing to comparisons between students coming to a given high school with the same observablecharacteristics, but ending up in different classes. Such students form what we call ”similar-file”groups (or SF groups), and all comparisons throughout the paper are made between studentsbelonging to the same SF group.

Figure 2.2 illustrates this approach, where students A and B have close observable character-istics. If the high school principal has to split them between classes X and Y, we assume that thedecision between assigning A to X and B to Y (case 1) or the reverse (case 2) is as good as random.Therefore, the differences between students A and B’s classes (e.g. characteristics of classmatesC-D-E compared to F-G-H) are uncorrelated with differences in individual unobserved factorsof achievement, allowing for causal inference of peer effects. Classroom peer effects can be esti-mated by examining the correlations between students A and B’s gap in outcome and differencesin their class characteristics.

Formally, we estimate the following model using OLS: 17

yigc = αg + β · Cigc + ϵigc (2.1)16. The ratio is roughly equal to 5, the average number of classes in high schools, suggesting that principals do

not try to group students having the same class of origin when allocating them among 10th grade classes.17. Although our estimation strategy is similar in spirit to exact-matching methods, we choose not to use

matching estimation as the regressors examined in this paper are not binary. To our knowledge, the literature isvery poor when it comes to the estimation of average causal effects of multi-valued treatments by propensity scoreor exact matching methods (see Imbens, 2000, from this point of view).

68

Page 95: Inégalités scolaires, ségrégation et effets de pairs

2.3. Identification

Table 2.1 – Descriptive statistics on students’ characteristics

Population1 SF sample At risk

(I) (II) (III)

Girl 0.547 0.618 0.609(0.498) (0.486) (0.488)

High-SES 0.301 0.301 0.000(0.459) (0.459) (0.000)

High quality optional course 0.145 0.093 0.021(0.352) (0.291) (0.143)

DNB national exam score 23.9352 25.140 20.114(5.077) (5.551) (3.879)

Normalized DNB national exam score 0.0002 0.246 −0.757

(1.000) (1.099) (0.762)Had repeated at least once before grade 0.147 0.037 0.101

(0.354) (0.188) (0.301)

Repeats 10th grade 0.151 0.150 0.359(0.358) (0.357) (0.480)

Attrition (drop out or unmatched in panel) 0.083 0.040 0.078(0.276) (0.197) (0.269)

Academic major in grade 11 0.590 0.694 0.303(0.492) (0.461) (0.460)

Technological major in grade 11 0.175 0.117 0.259(0.380) (0.321) (0.438)

Takes Bac on schedule 0.658 0.737 0.482(0.474) (0.441) (0.500)

Graduates high school 0.529 0.630 0.314(0.499) (0.483) (0.464)

Number of PC in 10th grade class 1.7183 1.999 1.503(2.528) (2.256) (1.760)

Number of former classmates in high school 8.3273 12.680 10.934(6.466) (5.924) (4.936)

N 3,589,710 28,053 8,981

Standard deviations are reported in parentheses.1 The population is made of the 10th grade students in the general track coming from the 9th grade (i.e. ex-

cluding repeating students). The general track typically contains more girls and more high-SES students.2 Only students whose DNB score is known: N = 2,897,986.3 Only students whose 9th grade class is known: N = 3,381,271.

69

Page 96: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

A

BSimilar-file students

Case1

Case 2

9th grade 10th grade

Class X

A C

D E

Class Y

B F

G H

Class X

B C

D E

Class Y

A F

G H

Consider two ”similar-file” students A and B, i.e. two first-year students who share the same characteristicsfor all the information included in the registration files. Our key assumption is that they are not distinguishedby the high school principal during class assignment, because she does not know personally her first-yearstudents at that time.The principal has two options when she allocates these students: she can either assign them to the same classor separate them into two classes X and Y. We do not compare these two scenarios. We focus exclusivelyon the scenario where the students are separated. In this scenario, there are two possible cases: student Ais assigned to class X and student B is assigned to class Y (case 1) or student A is assigned to class Y andstudent B is assigned to class X.We argue that the choice between case 1 and case 2 is random and can be seen as a lottery that affects thetwo students’ social environments in 10th grade. For instance, student A will be with students C, D and Ein case 1, students F, G and H in case 2.Differences in outcomes between students A and B can by credibly attributed to differences in classroomcharacteristics.

Figure 2.2 – Class assignment of similar-file students

70

Page 97: Inégalités scolaires, ségrégation et effets de pairs

2.3. Identification

where yigc denotes high school outcomes for student i, assigned to 10th grade class c and be-longing to SF group g, as in model (2.3), Cigc is a vector of class characteristics (e.g. peer ability,female share, or i’s number of persistent classmate), and ϵigc captures individual unobserved fac-tors of achievement. αg is the SF group fixed effect that restricts the analysis to comparisonswithin groups of students with similar registration files and is the key to identification. Indeed, βcaptures the peer effects of interest under the key assumption that 10th grade class characteristicsCigc are not correlated with ϵigc conditional on g:

Cigc ⊥ ϵigc|g i.e. Cov(Cigc, ϵigc|g) = 0 (2.2)

By controlling for SF group fixed effects, model (2.1) estimates β parameters only by com-paring separated similar-file students with each other, as long as their classrooms differ on Cigc

dimensions (in particular, we do not compare students who are separated versus students whoend up in the same class).

In what follows, we describe how we define SF groups before providing empirical evidencesupporting assumption (2.2).

2.3.1 Definitionofsimilar-filegroups

The natural experiments consists in students who enrolled in a given high school and yearwith the same or very similar observable characteristics from the principal’s perspective, butassigned to different classrooms. These groups of students, denoted g ∈ 1, . . . , G and calledSF groups, are defined using all variables that we observe on first-year students’ registration files.We consider that students belong to the same ”similar-file” groups only if they come from thesame 9th grade class in middle school; enroll in the same high school in the same year; select thesame options (i.e. same foreign language and optional courses); share the same gender, age 18 andsocial background (low- or high-SES) based on father’s occupation; belong to the same quintileof average 9th grade continuous assessment score in scientific subjects (mathematics, physics-chemistry, and biology); belong to the same quintile of average 9th grade continuous assessment

18. We do not look at the exact date of birth but only at whether the students have repeated at least one year:age is broken down to just one dummy variable.

71

Page 98: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

score in humanities (French, history and foreign languages) 19; and belong to the same decileof average 9th grade continuous assessment score across all subjects listed above. 20 Note thatcontinuous assessment scores are binned into deciles or quintiles in order to have enough caseswhere at least two students share the exact same values for all observed characteristics. We showin section 2.5.1 that our estimates are unsensitive to using narrower or wider bins.

This definition of SF groups leaves us with 32,492 groups of SF students, 13,680 of which in-clude students who were not assigned by their principal in the same 10th grade class. 21 The totalsample of SF students for which class effects can be estimated thus comprises 28,053 studentsout of an initial population of 2,897,986 10th grade students covering eight cohorts. 22

Model (2.1) is estimated on this ”SF sample” of 28,053 students that have at least one similar-file mate (”SF mate”) while ending up in separate classes, corresponding to 13,680 separatenatural experiments. Each student is only compared to his SF mate since we control for αg fixedeffects. This single fixed effect controls altogether for years, class and middle school of origin,high school of destination and all other characteristics observed in students’ registration files.Therefore, there is no need to control separately for high school or year fixed effects, or for individualcharacteristics.

Overall, these students are allocated to 22,162 different classes. Over the whole SF sample,19. The foreign languages score is the weighted average of the student’s main foreign language (weight = 2/3)

and second foreign language (weight = 1/3). Using different weights does not change the paper’s results. Notethat the continuous assessment score in history is missing for 5.4 percent of observations. For these students, theaverage humanities score is the average of the French and foreign languages scores only.

20. Two students who belong to the same average score decile across all subjects may have very different subject-specific profiles: one may have high marks in sciences but not in humanities, or vice versa. Principals most probablydifferentiate between such students. This explains why we add quintiles of scientific and humanities scores separately,aside from the average score decile.

21. A total of 8,341 of the 32,492 SF groups are characterized by a set of optional courses that are only available inone high school class. Thus, these groups could not have been split up in any case. We conclude that the principalssplit up 13,680 SF groups out of 24,151 (57 percent) groups that could be split. The reason for separating out agroup of SF students across different classes might be endogenous to potential outcomes, but does not affect ourstrategy. We only assume that, conditional on separating out SF students across different classes, principals deciderandomly which students they assign to which class.

22. This population excludes 10th grade repeaters, but also newcomers for whom data on 9th grade exam scoresis missing. Note that our definition of SF groups allows only 1 percent of the population to come to high schoolwith at least one other student (only one out of 93 percent) who shares the same values for Xi, while ending upin different classes. This illustrates just how much our identification approach calls for a very rich database: only alarge initial pool of students can yield a sample of SF students large enough to get accurate estimates of peer effects.

72

Page 99: Inégalités scolaires, ségrégation et effets de pairs

2.3. Identification

10,461 students are assigned to the same class as at least one student from another SF group.When estimating model (2.1), standard errors are therefore clusterized by 10th grade class, al-though this only impacts standard errors at the margin as the clusters are very small in size.

2.3.2 Empiricalevidenceofrandomassignment

The definition of SF groups we just described is already very restrictive. Considering princi-pals’ time constraint, they may not look for additional information to decide which one of thetwo students they assign to which class. As we described in section 2.2 however, there is stilla few information they have that might be used. Assume, for instance, that there is substantialvariation in ethnicity captured by names, even conditional on g, and that these variations arecorrelated with potential outcomes. If they are also taken into account by the principal whenassigning these similar-file students to different classes, and if they are correlated to ϵigc, thenassumption (2.2) is false and our results would be biased. The same argument holds for teachers’small written comments on students’ behavior, that we do not observe.

2.3.2.1 Balancingtestusinganonymousexamscores

A first way to provide supporting evidence of the validity of assumption (2.2) is to exploit oneinformation we do observe that principals do not: the students’ anonymous scores Ai obtainedin the national DNB exam just before entering high school. If conditional on g, principalsdo assign students based on some information we do not observe and that is correlated withpotential outcomes, then some correlation between class characteristics Cigc and anonymousexam scores Ai should be observed, again, conditional on g. For instance, if 9th grade teachersfeel a student is disruptive enough to warrant mentioning it in their written report, then theyprobably underscore his or her performance in class (as measured by continuous assessmentscores). Therefore, disruptive students should display higher anonymous exam scores on averagethan their SF mate(s) with no behavioral issues, since SF students have very close continuousassessment scores by construction. This can be shown empirically taking our data on 2006-2011cohorts, for which the behavior score NVS is available. A regression of Ai on NVSi controllingfor g (which includes continuous assessment scores) exhibits a negative correlation of −0.059

with a 0.020 standard error. It shows that when teachers report that a student’s behavior is worse

73

Page 100: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

than his or her SF mate, this student gets a higher score in the anonymous DNB exam, provingthat they have been underscored in class.

Ai can thus be used to examine whether assumption (2.2) of a random assignment condi-tional on g is credible. We do so by estimating the following model:

Cigc = αg + β · Ai + uigc (2.3)

where Cigc is any of class c’s characteristics and g is the index denoting ”similar-file” (SF) groups,i.e. the groups of students sharing a specific vector of values for Xi. Adding αg to the modelconstrains the regression to compare students solely with their SF mate(s). Under assumption(2.2), we expect β to be equal to zero.

Table 2.2 reports the estimated β parameters of model (2.3) for the entire SF sample fora number of class characteristics Cigc (columns I and II). Column I measures the raw samplecorrelations between ability and class characteristics, i.e. without the αg fixed effect. In the SFsample, more able students are assigned to larger classes and with more persistent classmates;their classmates are also higher-achieving students, more often female and high-SES. All thesecorrelations are statistically significant at the 1 percent level, except for the number of females.However, these correlations vanish within SF groups: as soon as we include the SF fixed effect,the estimates for β become very small and non-significant for all class characteristics (column II).In other words, for students who were similar with respect to Xi at the time of class assignmentin a given high school and year, remaining differences in ability (unobserved by principals) haveno correlation with differences between class characteristics. 23

This is a very strong result in favor of assumption (2.2). It clearly suggests that principals donot use any achievement-related information we do not observe to decide on class assignmentfor separated SF students, and thus split them up randomly (or at least exogenously to potentialoutcomes). In actual fact, this result is far from unrealistic since SF students are similar across

23. We provide two additional tests in the online appendix. First (Table 2.A.1), we show that the results holdwhen we use more detailed class characteristics regarding the number of persistent classmates of each type (low- orhigh-ability, same or opposite gender). Second (Table 2.A.2), we estimate equation (2.3) the other way around, i.e.regressing Ai on all class characteristics Cigc at the same time, thus measuring partial correlations between abilityand each of the class characteristics. The conclusions of both these tests are identical to Table 2.2.

74

Page 101: Inégalités scolaires, ségrégation et effets de pairs

2.3. Identification

Table 2.2 – Student’s class characteristics regressed on own anonymous exam score: Evidenceof the random assignment of similar-file students

All All At risk At risk

Dependent variable (I) (II) (III) (IV)

Number of PCs 0.062*** 0.000 0.037*** −0.008

(0.003) (0.005) (0.005) (0.008)

Average DNB score1 0.040*** 0.001 0.047*** 0.002(0.001) (0.001) (0.001) (0.002)

Number of girls 0.004 0.001 −0.014 −0.030

(0.006) (0.011) (0.014) (0.020)

Number of high-SES students 0.316*** 0.013 0.255*** 0.019(0.008) (0.009) (0.014) (0.015)

Class size 0.067*** 0.002 0.063*** 0.000(0.004) (0.006) (0.009) (0.012)

N 28,053 28,053 8,981 8,981SF fixed effect No Yes No Yes

Each cell is from a separate regression of the class characteristic of interest on the student’s standard-ized average anonymous score at the DNB exam.The ”at risk” sample consists of low-ability, low-SES students, on which the main effects’ magnitudesare the highest.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class and middle schoolof origin, high school of destination and individual characteristics, as defined in section 2.3.1. Bycontrolling for the SF fixed effect, we compare each student only with her similar-file mate assignedrandomly to another class.All regressions include quadratic controls for the share of retained students and of missing DNBscores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 This is the normalized DNB score. The normalization is done over the whole population: thesample’s mean is 0.245.

75

Page 102: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

many variables, and the remaining vector of information is very small in comparison (namesand teachers’ written comments). It is absolutely consistent with our field observations thatprincipals do not have time (or do not take time) to differentiate between very similar students.

Another possible scenario is that principals do consider the remaining information and thatthe latter are indeed correlated with potential high school outcomes, but without being correlatedwith DNB test scores. In other words, testing for imbalances in Ai would not be relevant sinceanonymous DNB scores are not a good measure of all unobserved determinants ϵigc of achieve-ment in high school. 24 Yet we argue that this is very unlikely, since principals do not observeDNB scores. It is therefore hard to imagine that principals would use the few information wedo not observe to separate SF students in a way that is correlated with ϵigc but without anycorrelation with Ai as shown in Table 2.2.

Table 2.2 also reports the results of the exogeneity test for a subsample of ”at risk” SFstudents (columns III and IV). We define them as SF students who are low-achievers (below themedian score of their middle school of origin) and low-SES. As we show in section 2.4.2.1, ourmain results regarding the positive effect of keeping classmates in the transition to high schoolare driven mostly by this specific subsample. For this reason, we check that the exogeneity testperforms well for these students, as reported in columns III and IV of Table 2.2. Therefore,we conclude that the SF students driving our main results are credibly exogenously assigned totheir classes.

All in all, our definition of SF groups appears to be most suitable to estimate the causal effectof class environment on students’ outcomes. Checking the robustness of our results to otherspecifications, we show in section 2.5.1 that our results barely change when using alternativespecifications that are more or less restrictive.

24. For instance, a student’s level of autonomy may be more important to high school achievement than achieve-ment in the DNB exam.

76

Page 103: Inégalités scolaires, ségrégation et effets de pairs

2.3. Identification

2.3.2.2 Additionalevidenceofrandomassignment

When defining the g groups of SF students, we do not require students to share a similar be-havioral score (Note de vie scolaire or NVS). This is because this score is not available for the firsttwo cohorts, so including it would force us to remove one-quarter of our sample. However, Ta-ble 2.2 suggests that it does not constitute a threat to our identification assumption. Otherwise,the resulting allocation of SF students would create a correlation between Cigc and Ai condi-tional on Xi, since anonymous DNB scores are correlated with behavioral issues conditional onteachers’ grades (see above).

Additional evidence that principals do not take behavioral considerations to differentiate SFstudents can yet be provided. This is done by checking whether differences in class characteristicsCigc are correlated with potential differences in the NVS score in cohorts 2006 to 2011 (whenthe NVS score is available). We do so by estimating (2.3) after substituting Ai with a dummyfor having an NVS score beneath the 10th percentile (equal to 15 out of 20). 25 Results arepresented in Table 2.3. Most correlations between student behavior and class characteristicsare both very small and non-significant at standard levels as long as comparisons are restrictedwithin groups of SF students. This is true for both the entire SF sample (column II comparedto column I) and the subsample of SF students at risk who drive our main results (column IVcompared to column III).

Lastly, we run additional tests whose results are not reported for the sake of brevity. Firstly,all the analysis work presented in this paper is repeated for the 2006-2011 cohorts, constrainingSF students to share a similar NVS score. Similar results are systematically found, though theestimates are less accurate. Secondly, we check whether differences in the continuous variablesincluded in the definition of g groups (notably continuous assessment scores) conditional ontheir binned values are correlated with class characteristics Cigc. Once again, the correlationsare mostly small and not significantly different from 0, especially for the subsample of studentsat risk of underachievement.

25. The NVS score has a very specific, negatively skewed distribution. 33 percent of students have the maximumscore of 20 since they exhibit no disruptive behavior. The average score is 18, while the median score is 19. Therefore,we choose to define students with disruptive behavior as students with a score below the 10th percentile, which isprecisely equal to 15 out of 20. Our results are not sensitive to the choice of threshold.

77

Page 104: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.3 – Student’s class characteristics regressed on behavior score: Evidence of the randomassignment of similar-file students

All All At risk At risk

Dependent variable (I) (II) (III) (IV)

Number of PCs −0.173*** −0.105 −0.117* 0.017(0.059) (0.084) (0.061) (0.091)

Average DNB score −0.157*** −0.005 −0.129*** −0.012

(0.014) (0.013) (0.017) (0.018)

Number of girls −0.557*** −0.039 −0.706*** 0.115(0.136) (0.162) (0.188) (0.224)

Number of high-SES students 0.027 0.065 −0.023 −0.028

(0.202) (0.122) (0.189) (0.165)

Class size −0.280*** −0.030 −0.179 −0.023

(0.093) (0.110) (0.116) (0.126)

N 15,775 15,775 4,952 4,952SF fixed effect No Yes No Yes

Each cell is from a separate regression of the class characteristic of interest on a dummyfor having an NVS score beneath the 10th percentile (equal to 15 out of 20).The behavior score is not avaiable for the first two cohorts, hence the smaller samplesize.The ”at risk” sample consists of low-ability, low-SES students, on which the main effects’magnitudes are the highest.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class andmiddle school of origin, high school of destination and individual characteristics, asdefined in section 2.3.1. By controlling for the SF fixed effect, we compare each studentonly with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students and of miss-ing DNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

78

Page 105: Inégalités scolaires, ségrégation et effets de pairs

2.4. Results

Overall, the empirical evidence strongly supports assumption (2.2) that high school princi-pals randomly assign separated SF students (as defined in section 2.3.1) to their classes, or at leastexogenously to achievement potential outcomes. The separation of similar-file students across10th grade classes creates differences in educational outcomes that can therefore be attributedon average to differences in class characteristics.

2.3.3 DescriptionoftheSF sample

Descriptive statistics on the SF sample compared to the initial population are presented incolumn II of Table 2.1. All in all, students from the SF sample appear to be slightly higherachievers than the population of high school freshmen as a whole. Yet the differences are notalways large in magnitude, although they are statistically significant. For example, the averageDNB test score is 25.1 (sd = 5.6) in the SF sample compared to 23.9 (sd = 5.1) for the populationas a whole. 15.0 percent of the SF sample repeat 10th grade as opposed to 15.3 percent of thetotal population, a difference that is again very small. 26 Column III reports the same descriptivestatistics for the subsample of SF students at risk. By construction, these students are very lowdown on the ability distribution. They have an average normalized DNB score of −0.76, repeatgrade 10 almost 2.5 times as often as the average student in the population, and graduate fromhigh school almost half as much.

2.4 Results

2.4.1 Freshman-year class characteristics and achieve-

ment

Given assumption (2.2), differences in class characteristics between SF mates are orthogonalto differences in individual unobservable characteristics. Therefore, conditional on g, regressingoutcomes on any class characteristic – e.g. classmates’ average ability – identifies a contextual

26. In terms of schools attended, SF students are found in 1,851 out of 2,679 high schools, i.e. 69 percent ofall high schools. The high schools that do not get SF students are mostly very small schools, in which the chancesof getting two students with the same registration files are small. They have 66 students on average in grade 10,versus 259 on average for high schools with SF students. Overall, the high schools containing SF students accountfor 91 percent of all 10th grade students.

79

Page 106: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

effect that is not attributable to unobserved individual characteristics. Yet since classes differ inseveral ways simultaneously, the result of such a regression could be driven by some correlated,omitted class characteristics – e.g. the number of females. Hence as a first step, we attempt tofigure out which aspect of the class environment is correlated with achievement, by regressingoutcomes on several observed characteristics at once. We estimate model (2.1) where Cigc isa vector of peer characteristics commonly studied in the literature (average ability, 27 numberof female students, number of high-SES students and class size), completed by the student’snumber of persistent classmates.

We consider different outcomes measured throughout the high school curriculum. The fourfirst outcomes pertain to students’ possible outcomes at the end of freshman year: repeatinggrade 10, dropping out, 28 enrolling in an academic or technological major. 29

Results are reported in columns I to IV of Table 2.4. The number of persistent classmatesis positively associated with achievement at the end of grade 10. On average, each additionalpersistent classmate a student gets with regard to her similar-file mate reduces her risk of repeti-tion by −0.3 percentage point (pp.) and similarly raises enrollment in an academic major (se =0.1 pp.), with small and non-significant effects on drop-out and enrollment in a technologicalmajor. 30 One additional female classmate reduces the risk of repetition by 0.1 pp. on average.This positive relationship between female peers and school achievement is consistent with theresults found by other studies (Hoxby, 2000; Lavy and Schlosser, 2011). 31 Classmates’ average

27. As measured by the DNB score. Because this data is missing for all repeating students (around 10 percent ofclassmates) and for another 20 percent of classmates (not matched, see section 2.2.3.1), we also include quadraticcontrols for the shares of repeating students and missing data.

28. As described in section 2.2, this ”drop-out” measure picks up attrition due both to matching issues and actualdrop-out. Since class environment is unlikely to substantially affect the matching procedure though, we believe thismeasure adequately captures the effect of class characteristics on the risk of drop-out.

29. We also estimated model (2.1) without controlling for the SF fixed effect to get the raw sample correlations.Basically, the number of persistent classmates displays positive, significant correlations with all outcomes, withlarger estimates than those obtained with model (2.1). However, contrary to Table 2.4’s estimates, the classmates’average ability and female share are respectively positively and negatively associated with achievement. Detailedresults on raw correlations are reported in the online appendix (Table 2.A.3).

30. We examine whether one academic major drives the effect, but find the same positive, non-significant effecton enrollment in sciences, humanities and social sciences. Results on specific major enrollment are not reported forthe sake of brevity, but are available on request.

31. When adding an interaction term between own gender and the number of female classmates, we find thatthis effect is driven entirely by female students (no effect on males). Note that controlling for this interaction termdoes not change the estimate of the PC effect. This rules out the interpretation of the PC effect as capturing the

80

Page 107: Inégalités scolaires, ségrégation et effets de pairs

2.4. Results

Table 2.4 – Effect of class characteristics on high school outcomes

Repeats10thgrade

Dropsout

Academicmajor

Tech.major

TakesBac on

schedule

HSgraduate

Independent variable (I) (II) (III) (IV) (V) (VI)

Number of PCs −0.003** −0.001 0.003** 0.001 0.005** 0.004*(0.001) (0.001) (0.001) (0.001) (0.002) (0.002)

Average DNB score 0.040*** −0.012* −0.022** −0.006 −0.011 0.007(0.010) (0.006) (0.010) (0.010) (0.014) (0.014)

Number of girls −0.001** 0.001 0.001 0.000 0.001 0.001(0.001) (0.000) (0.001) (0.001) (0.001) (0.001)

Number of high-SES students −0.000 0.001** −0.000 −0.001 −0.000 0.001(0.001) (0.001) (0.001) (0.001) (0.001) (0.001)

Class size −0.000 0.000 0.000 −0.000 0.002 0.000(0.001) (0.001) (0.001) (0.001) (0.002) (0.002)

R2 0.68 0.56 0.79 0.63 0.68 0.71N 28,053 28,053 28,053 28,053 22,9461 22,9461

SF fixed effect Yes Yes Yes Yes Yes Yes

Each column is from a separate regression of students’ outcomes on their class characteristics.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class and middle schoolof origin, high school of destination and individual characteristics, as defined in section 2.3.1. Bycontrolling for the SF fixed effect, we compare each student only with her similar-file mate assignedrandomly to another class.All regressions include quadratic controls for the share of retained students and of missing DNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

81

Page 108: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

ability is negatively associated with performance. A one standard deviation in the classmates’average DNB score 32 significantly raises the risk of repetition by 3.8 pp. on average, but reducesboth the drop-out rate and the probability of enrollment in an academic major. Peer ability dis-plays effects that are therefore unclear. 33. The number of high-SES students also has a negativeeffect as it significantly increases the risk of dropping out, but its magnitude is rather small. Fi-nally, we find no class size effect, most likely because of the small variance between classes in agiven high school (the standard deviation of class size is only 1.9 students within SF groups).

Table 2.4 also reports results for two outcomes measured later than the end of 10th grade.Column V shows the effect of freshman-year class characteristics on the probability of studentstaking the baccaulauréat exam ”on schedule”, i.e. three years after entering high school, meaningthat they do not repeat grade 10 or grade 11 and that they make it through grade 12 withoutdropping out. Then, column VI investigates whether students with more persistent classmatesin grade 10 are also more likely to pass the exam at that time. Interestingly, only the number ofpersistent classmates has a clear and enduring effect over time. Three years after entering highschool, SF students who gain an additional persistent classmate in their freshman year are stillmore likely to take the baccaulauréat exam at the end of grade 12. This result implies that thereduction in 10th grade repetition is not cancelled out by a higher propensity to repeat grade 11or drop out of grade 12. Furthermore, they do not seem to perform any worse than others overthese years, since they are also more likely to graduate from high school. In comparison, all otherclass characteristics display estimates that are rather small in magnitude and never statisticallysignificant. Thus, the number of PCs seems highly relevant to capture the dimension(s) of classenvironment that matter, even more so than other, classic peer characteristics commonly studiedin the literature.

Yet it is unclear what the number of PCs actually measures or captures. SF students’ per-

impact of assignment to same-sex classmates.32. The standard deviation of classmates’ average ability within SF groups is only 27 percent of an average DNB

score standard deviation.33. The results obtained in the literature as regards the effect of peer ability are also mixed and inconclusive.

Here, the negative peer effect is consistent with the impact of a lower relative position within the class, becausestudents may look weaker to teachers when assigned with better classmates. This may have little effect on drop-outs,but it would raise their risk of repeating grade 10 and at the same time reduce their chances of admission on anacademic major track.

82

Page 109: Inégalités scolaires, ségrégation et effets de pairs

2.4. Results

sistent classmates could affect them by means of mechanisms implying all sorts of unobservedcharacteristics that generate peer effects, such as ability and motivation. In the following, weprovide strong evidence suggesting that the PC effect does not capture an ability peer effect,but rather works through a social network mechanism. As we will show, the most consistentinterpretation of the data is that students simply benefit from getting peers they know and withwhom they are used to interacting.

2.4.2 Theprotectiveroleoffamiliaritywithclassmates

We first check that controlling or not for other class characteristics does not affect the PCestimates. In Table 2.5, we report the previous estimates of the effect of PCs from regressionswhere Cigc is the full vector (column II). In column I, the effect of the number of PCs is esti-mated without controlling for the other class characteristics. The estimates are virtually identicalfor the two regressions, indicating that PCs are not correlated with these other class characteris-tics. 34 This first piece of evidence strongly suggests that the number of persistent classmates doesnot capture any other omitted dimension of class environment. Suppose, for instance, that SFstudents’ persistent classmates had specific characteristics associated with higher performance,which benefit SF students without any link with familiarity. Considering Table 2.5’s results,such characteristics should not be correlated with DNB score, gender or SES. In other words,to be consistent with Table 2.5’s pattern, any credible omitted class characteristic driving thePC effect would have to be uncorrelated with all other observed class dimensions in Cigc. It ishighly unlikely that such a characteristic exists. 35 In section 2.5.2, we run a robustness checkthat takes variations in PC within-classes to check that the PC estimate is unlikely to be drivenby characteristics that are fixed at class level.

In the remaining tables of the present section, we systematically include quadratic controlsfor other class characteristics when we estimate the effect of PCs. As seen in Table 2.5, thesecontrols do not affect our estimates.

34. This remains true even if we allow the model to account for non-linearities in the effect of peer ability, e.g.by controlling for the share of very high- (or low-) achieving peers.

35. Unfortunately, we do not have access to teachers’ characteristics at class level. Yet any correlation betweenPCs and teachers’ characteristics should drive a change in the PC estimate when controlling for students’ averageability, because assignment of teachers to classes is mostly related to students’ ability.

83

Page 110: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.5 – Effect of persistent classmates on high school outcomes with and without control-ling for other class characteristics

Dependent variable (I) (II)

Repeats 10th grade −0.003** −0.003***(0.001) (0.001)

Drops out −0.001 −0.001

(0.001) (0.001)

Academic major 0.003** 0.003**(0.001) (0.001)

Technological major 0.001 0.001(0.001) (0.001)

N 28,053 28,053

Takes Bac on schedule 0.005*** 0.005***(0.002) (0.002)

HS graduate 0.004** 0.004*(0.002) (0.002)

N 1 22,946 22,946

SF fixed effect Yes YesControl for other class characteristics No Yes

Each cell is from a separate regression of students’ outcomes on their number of PCs,controlling or not for the other class characteristics presented in Table 2.4. Column (II)is identical to the first row in Table 2.4.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class andmiddle school of origin, high school of destination and individual characteristics, as de-fined in section 2.3.1. By controlling for the SF fixed effect, we compare each studentonly with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students and of missingDNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

84

Page 111: Inégalités scolaires, ségrégation et effets de pairs

2.4. Results

2.4.2.1 DistributionofthePC effect

Another reason to believe in the ”familiarity” interpretation concerns the heterogeneity ofthe PC effect. If historical familiarity with classmates really matters, it is probably not equallyimportant for all students. In particular, we expect that the role of former classmates is all themore important for those students who are likely to experience a difficult transition. This isexactly what we find.

We provide an analysis of the distribution of the PC effect in Table 2.6. We first investi-gate how it varies with SF students’ level of achievement (panel B). To retain enough statisticalpower, we split the sample into just two parts, defining SF students as either low- or high-abilitybased on their relative position with respect to the median continuous assessment score for theirmiddle school of origin. 36 The PC effect is strikingly heterogeneous across these two categories.While the number of PCs has virtually no effect on high-ability students, low-ability studentsare strongly and positively impacted. For the sake of brevity, we do not report on the mag-nitude of the estimates, since the effects are actually highly heterogeneous again between low-and high-SES within this subgroup. As reported in panel C, the effects observed on low-abilitystudents are almost exclusively driven by low-SES students. On average, each additional PC re-duces their risk of repetition by 1.4 pp, though not their risk of dropping out. They are thereforesignificantly more likely to enroll for either an academic or a technological major, with a similarincrease in magnitude. No backlash to this strong short-term impact can be found in followinggrades. On average, each PC in freshman year raises their chances of taking the baccaulauréatexam and graduating by the same amount. In comparison, the estimates are very small in magni-tude and never statistically significant at conventional levels for low-ability high-SES students(column V) and high-ability low-SES students (not reported). This suggests that keeping someclassmates matters only for students who may be experiencing a hard transition both academi-cally – they were already performing poorly in middle school – and culturally – their parentscome from the working class and might not have studied at high school.

36. Therefore, the terms ”low-ability” and ”high-ability” do not denote distribution ends. Besides, we use thecontinuous assessment score since SF groups are defined with regard to it, such that two SF students are necessarilyboth below or above the median. Although the anonymous DNB exam score would be a better measure of ability,two SF students may be on different sides of the median DNB score. We would thus lose part of the SF sampleby analyzing the PC effect separately on each side of the median DNB score. However, doing so brings us to thesame conclusions as in Table 2.6, though the estimates are often less accurate.

85

Page 112: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.6 – Distribution of the PC effect

Dependent variableRepeats

10th gradeDrops out

Academicmajor

Tech.major

Takes Bacon schedule

HSgraduate

Independant variable (I) (II) (III) (IV) (V) (VI)

(A) Whole sample: average effet

Number of PCs −0.003*** −0.001 0.003** 0.001 0.005*** 0.004*(0.001) (0.001) (0.001) (0.001) (0.002) (0.002)

N 28,053 28,053 28,053 28,053 22,9461 22,9461

(B) Whole sample: by ability

Number of PCs −0.000 −0.001 0.002 −0.001 0.002 0.001(0.001) (0.001) (0.001) (0.001) (0.002) (0.002)

Low-ability × PC −0.009*** −0.001 0.003 0.006** 0.009** 0.007(0.003) (0.002) (0.003) (0.003) (0.004) (0.004)

N 28,053 28,053 28,053 28,053 22,9461 22,9461

(C) Low-ability students: by SES

Number of PCs 0.002 −0.002 −0.003 0.003 0.003 0.000(0.005) (0.003) (0.005) (0.003) (0.007) (0.007)

Low-SES × PC −0.015** 0.001 0.011* 0.003 0.011 0.012(0.006) (0.004) (0.007) (0.005) (0.009) (0.008)

N 11,383 11,383 11,383 11,383 9,5881 9,5881

(D) Low-ability, low-SES students (”at risk”): by disruption intensity

Number of PCs −0.010* 0.003 0.006 0.001 0.007 0.010*(0.006) (0.004) (0.005) (0.005) (0.006) (0.006)

Disruptive transition × PC −0.009 −0.009 0.006 0.012 0.015 0.005(0.008) (0.006) (0.008) (0.007) (0.010) (0.009)

N 8,981 8,981 8,981 8,981 7,6151 7,6151

(E) Low-ability, low-SES students (”at risk”): by gender

Number of PCs −0.018*** 0.000 0.014** 0.004 0.010 0.009(0.006) (0.005) (0.006) (0.005) (0.008) (0.008)

Girl × PC 0.007 −0.002 −0.009 0.004 0.007 0.005(0.009) (0.006) (0.008) (0.007) (0.010) (0.010)

N 8,981 8,981 8,981 8,981 7,6151 7,6151

Each column in each panel is from a separate regression.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class and middle school of origin,high school of destination and individual characteristics, as defined in section 2.3.1. By controlling for the SFfixed effect, we compare each student only with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students, the share of missing DNB scores, andthe class characteristics presented in Table 2.4.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

86

Page 113: Inégalités scolaires, ségrégation et effets de pairs

2.4. Results

In the rest of the paper, we derive results only for this specific subsample of low-ability, low-SESstudents, which we call students ”at risk”. We focus on this subsample because the effect of per-sistent classmates is entirely driven by these students. As in Table 2.5, the presence or not ofother class characteristics on the right hand side of the regression does not change the estimatesof the PC effect.

In panel D, we investigate this distribution pattern further by looking into how the PCeffect varies with the difference in school-level social environment (measured by the share ofhigh-SES students). This gap, denoted ∆p, is negative for one-third of low-ability low-SESstudents only. 37 These low-ability, low-SES students are twice as likely to experience a positive∆p, meaning that they enter an environment with more high-SES students than they used tohave.

Although the sample size is to small to draw definite conclusions (the differences between thetwo groups are not significant to the 10 percent level), we do observe a difference in magnitudebetween students at risk depending on the sign of ∆p. The difference goes in the direction wewould expect, i.e. that students who experience a more difficult transition (∆p > 0) are moresensitive to the presence of persistent classmates.

In panel E, we also estimate the difference of the PC effect between male and female studentsat risk. However, the results do not display any clear heterogeneity in the gender dimension.Persistent classmates seem to have more impact on the male repetition rate than the femalerepetition rate. Yet the discrepancy runs in the opposite direction for the baccaulauréat outcomes,with larger estimates for females. Both male and female students thus seem to benefit frompersistent classmates in freshman year, although the benefits differ slightly depending on thestage of the high school curriculum. 38

37. This is a mechanical consequence of the lower probability of finding low-SES students enrolled in generalhigh schools after grade 9.

38. Although the increase in academic major enrollment is similar across both genders, persistent classmatesswitch male outcomes from repetition to science majors only and female outcomes to humanities only. To be moreprecise, both male and female PCs increase male enrollment in science, while females enroll more in humanitiesonly when they get more female PCs. Results available on request.

87

Page 114: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

We further analyzed the distribution of the effect in middle and high school contexts. Theseresults are not reported since no other interesting pattern can be found. For example, the effectdoes not appear to vary significantly with middle or high school size, the share of middle schoolclassmates attending the high school, or the 10th grade class context. 39

All in all, the results of this investigation are consistent with our interpretation of the PCeffect. The estimates reported in Table 2.4 are a watered-down version of the very strong PCeffect on SF students who experience an upheaval in the transition to high school. 40 Alreadyknowing some peers in the class matters a lot to low-ability students with low socioeconomicstatus who come from an environment that is poor compared to the high school. This is mostconsistent with the interpretation of the PC effect as reflecting the impact of familiarity. Bycontrast, it is unlikely that the former classmates of these low-achieving underprivileged studentshave higher unobservables than average, which would drive the PC effect. The following sectionpresents additional evidence in support of this.

2.4.2.2 Doallformerpeersmatter?

If the effect of persistent classmates is explained by familiarity, then students at risk should bemore affected by peers with whom they have been more likely to interact at middle school. 41 Inparticular, they may have interacted much more with their former classmates than with middleschool peers in other classes. In Table 2.7, panel A, we add to the previous regressions thenumber of these former middle school mates from other classes. We find a small, negative effect ongrade repetition, but it is not significant. Surprisingly, this effect is related to a small increase inthe risk of dropping out, statistically significant at the 5 percent level. Other estimates are very

39. We check, in particular, whether the extent to which your new classmates are grouped with their formerclassmates increases your need to be with yours. Yet again, we find no result to suggest that this is the case. Thisis noteworthy as it suggests that grouping former classmates would not drive negative spillovers on their otherclassmates, who do not necessarily have many former classmates in high school. It would be helpful, however, toconfirm such a conclusion with a controlled field experiment to directly investigate externalities within the class.

40. We check whether the other peer characteristics studied in Table 2.4 also have a larger effect on this specificcategory of students ”at risk”. Results are provided in the online appendix (Table 2.A.4). Again, other peercharacteristics (average ability, number of females, etc.) display non-significant and non-persisting effects on highschool achievements, even for these students.

41. We focus solely on the subsample of SF students at risk since section 2.4.2.1 shows that they are the onlyones driving the PC effect. The balancing test shown in Table 2.2 is repeated for this subsample for the differenttypes of PCs in the online appendix (Table 2.A.1). The test is satisfied for all types of PCs.

88

Page 115: Inégalités scolaires, ségrégation et effets de pairs

2.5. Robustness checks

small in magnitude and never statistically significant. Therefore, students seem to benefit onlyfrom their middle school mates who were in the same class, with whom they probably interactedmuch more.

Students do not appear to benefit more from some specific types of persistent classmates.After controlling for the number of all persistent classmates, the number of same-gender PC(panel B) and high-ability PC (panel C) do not trigger different effects on academic achievement.Interestingly, high-ability PCs do not appear to be more benefitial to students. Therefore, thePC effect is highly unlikely to result from a higher unobserved ability of persistent classmates. 42

This is another evidence that students benefit from their persistent classmates only because theyknow each other.

2.5 Robustnesschecks

2.5.1 AlternativeSF groupspecifications

All the results presented in section 2.4 are based on a quite restrictive definition of SF groups.We required students to have the exact same values for all variables that were included in the reg-istration files, binning test scores into deciles or quintiles. This degree of accuracy was necessaryin order for our exogeneity tests to be valid. In this section however, we explore the sensitivityof the results for alternative definitions of the SF groups.

We test both definitions that are more restrictive and less restrictive than the main defini-tion. For instance, we can be less restrictive by allowing students to have different values forsome of the variables observed by principals or by broadening the bins of the continuous testscores. Conversely, we can be more restrictive by using narrower bins. In Table 2.8, we reportthe effect of persistent classmates on grade repetition for four alternative specifications for theprimarily affected sample of ”at risk” students (low-ability, low-SES). The reference definition

42. We again define ”high-ability” as students with continuous assessment scores above the school median, forconsistency with Table 2.6. However, anonymous exam scores are a better measure of ability and could be usedhere to define classmates’ ability without any loss of accuracy (by comparison to SF students, see again footnote 36.The same results are found by using one or another measure.

89

Page 116: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.7 – Which peers do matter? Decomposition of the PC effect on students at risk.

Dependant variableRepeats

10thgrade

Dropsout

Academicmajor

Tech.major

TakesBac on

schedule

HSgraduate

Independent variable (I) (II) (III) (IV) (V) (VI)

(A) Persistent classmates and persistent schoolmates

Number of PCs −0.014*** −0.001 0.008* 0.006* 0.013*** 0.011**(0.004) (0.003) (0.004) (0.004) (0.005) (0.005)

Persistent schoolmates from other classes 0.000 0.002 −0.001 −0.001 −0.004 −0.003

(0.003) (0.002) (0.002) (0.002) (0.003) (0.003)

(B) Persistent classmates by gender

Number of PCs −0.015** −0.001 0.007 0.008 0.014* 0.011(0.007) (0.004) (0.007) (0.006) (0.007) (0.007)

Same sex PCs 0.001 −0.001 0.002 −0.002 −0.001 0.003(0.010) (0.006) (0.009) (0.009) (0.011) (0.010)

(C) Persistent classmates by ability

Number of PCs −0.017** −0.001 0.014** 0.005 0.014* 0.011(0.007) (0.004) (0.006) (0.006) (0.008) (0.007)

High-ability PCs 0.007 0.000 −0.010 0.003 −0.000 0.001(0.010) (0.006) (0.009) (0.009) (0.011) (0.011)

N 8,981 8,981 8,981 8,981 7,6151 7,6151

The sample is limited to low-ability, low-SES students (”at risk”) sample on which the effects’ magnitudes are thehighest.Each cell is from a separate regression of students’ outcomes on their number of persistent classmates.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class and middle school of origin,high school of destination and individual characteristics, as defined in section 2.3.1. By controlling for the SFfixed effect, we compare each student only with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students, the share of missing DNB scores,and the class characteristics presented in Table 2.4.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

90

Page 117: Inégalités scolaires, ségrégation et effets de pairs

2.5. Robustness checks

is reproduced in column IV; columns I to III show the results for less restrictive definitions andcolumn V presents a more restrictive definition. The details of each definition are given in thetable.

All specifications yield a significant negative effect of the number of persistent classmates ongrade repetition, although the magnitude of the effect varies from one specification to another.Bear in mind that the balancing test presented in section 2.3 produces less conclusive results forthe alternative specifications. 43 The results in column IV therefore remain our reference results.However, the fact that the effect retains the same sign and size is reassuring for the validity androbustness of our results.

2.5.2 EstimationbasedontheimpactofSF studentalloca-

tionontheirclassmates

In section 2.4, the identification of peer effects within classes is based directly on the com-parison of SF students randomly assigned to different classes. Yet the random assignment of SFstudents may also be seen itself as a shock to class composition. Receiving one or another SFclassmate in the class can make a difference to the other students in these classes. A focus onthe effects of SF student allocation on their 10th grade classmates yields new estimates of theeffect of classmate persistence, hence testing the robustness of the results presented in section2.4.

2.5.2.1 Principle

Using the notations from Figure 2.2, we now compare students C to H with each otherinstead of comparing student A to student B. If A and B are defined as similar-file, the resultof the random allocation of A and B should have no impact on students C–H, since A and Bhave the same characteristics. However, if we allow A and B to come from two different classesof the same middle school, the result of the allocation will have an impact on students C to Hif some of them come from A or B’s 9th grade class. Given the similarity of A and B from mostpoints of view except their specific class of origin, the result of the allocation will only affect this

43. Results available on request.

91

Page 118: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.8 – Robustness check: effect of PC on low-ability students’ repetition rate using differ-ent specifications of the SF fixed effect

Specifications

Independent variable (I) (II) (III) (IV) (V)

PC −0.004*** −0.012*** −0.015*** −0.014*** −0.019***(0.001) (0.004) (0.004) (0.004) (0.007)

R2 0.58 0.68 0.60 0.61 0.62N 169,258 19,369 11,404 8,981 3,214

SF students share...Options Middle school 9th grade class Indifferent Same Similar Same SameIn-school score Decile Decile Decile Decile DecileScience score Quintile Quintile Quintile DecileHumanities score Quintile Quintile Quintile DecileHeld back Gender 2-category SES

The sample is limited to low-ability, low-SES students (”at risk”) sample on whichthe effects’ magnitudes are the highest.Each cell is from a separate regression of students’ outcomes on their number ofpersistent classmates.All regressions include quadratic controls for the share of retained students, theshare of missing DNB scores, and the class characteristics presented in Table 2.4.Standard errors (in parentheses) are clusterized at the 10th grade class level.All regressions include similar-file fixed effects, which are different in each col-umn. Column IV is the original definition of SF groups, columns I to III are lessrestrictive and column V is more restrictive.

92

Page 119: Inégalités scolaires, ségrégation et effets de pairs

2.5. Robustness checks

dimension of the class characteristics vector Cic. For example, if students A and C come fromthe same 9th grade class, C would have one more PC in case 1 than in case 2.

Therefore, in this section, we use another definition of SF students in which we require allvariables to be identical except for the classroom of origin (the middle school or origin must bethe same). However, we find in our exogeneity test (2.3) that principals do distinguish betweenstudents who come from different classes if those classes do not have similar characteristics.Therefore, in this section, students will be considered similar-file students if they come fromclasses that share three characteristics: quintile of the average DNB score, proposing or not eliteoptions, and quintile of the number of students going to the destination high school.

Formally for each SF group j produced by the new definition, we can define an instrumentZij equal to the number of persistent classmates that student i obtains from that particular SFgroup. The variable is defined only for students who were in the same 9th grade class as one ofthe SF students in group j, and who are in one of the 10th grade classes attended by these SFstudents. We denote this sample Pj . Note that in this context, i belongs to the sample of formerclassmates in the SF sample, P =

∪j Pj , and not to the SF sample itself.

Formally, we estimate the following reduced form model:

Yijkc = αjk + β · Zij + ϵijkc (2.4)

where c denotes the 10th grade class and k denotes the 9th grade class. The αjk fixed effect en-sures that comparisons are made between students who belong to the same Pj sample and comefrom the same 9th grade class. Alternatively, this fixed effect can be replaced with a αjc fixedeffect, where we compare solely students ending up in the same 10th grade class. β identifiesthe causal effect of getting one additional persistent classmate. 44

2.5.2.2 Validityofthetest

The exogeneity of this instrument is based on a stronger assumption than the main model.Although SF students are randomly split, the assignment of other freshmen is not exogenous.

44. Zij is a ”perfect” instrument for PC, as it has a correlation of one with PC and there is no compliance issuehere. This is why we estimate the reduced form model directly.

93

Page 120: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

In particular, if they were assigned with respect to the number of PCs, instrument Zij wouldnot be exogenous. Therefore, model (2.4) is identified under the hypothesis that P students arenot allocated to classes correlated with PCs.

In order to check this additional hypothesis, we estimate the correlation between the valueof instrument Zij (the number of persistent classmates received by random allocation) and theindividual characteristics of the students i ∈ Pj :

Zij = αjk + γ ·Xi + uijkc (2.5)

where Xi is the vector of observable characteristics tested.

We present the results of this test in Table 2.9. In column I, we find that individual char-acteristics are correlated with the instrument when the controls for αjk fixed effects are notincluded. However, these correlations vanish when we include them (column II) or when wereplace them with a 10th-grade-class fixed effect (column III). 45 These results suggest that thestudents who obtain a randomly assigned PC are comparable in their observed dimensions tothose who do not, within Pj samples. Although these students might be different on an unob-served level, we argue that this test is satisfactory enough to run a robustness check on our mainresults presented in section 2.4.

2.5.2.3 Results

The results of the estimation of model (2.4) are produced in Table 2.10. As in Table 2.9,the αjk fixed effect is omitted in column I, included in column II and replaced with a 10th-grade-class fixed effect in column III. Since Zkc takes the same value for all students in 10th grade classc from the same 9th grade class k, the standard errors are clustered within kc groups. Similar tosection 2.4, we find that a higher number of persistent classmates is associated with lower graderepetition and higher enrollment for the academic major. We also observe a long-term positiveeffect on high school graduation. The orders of magnitude are similar to the results using thefirst strategy and do not vary drastically depending on the fixed effect we include.

45. We use DNB quintile dummies instead of the DNB score to avoid losing students with missing values.Students for which the DNB score is missing have all five dummies equal to zero.

94

Page 121: Inégalités scolaires, ségrégation et effets de pairs

2.5. Robustness checks

Table 2.9 – IV exogeneity test

Independent variable (I) (II) (III) (IV)

Held back 0.002 −0.005 0.007 −0.007

(0.017) (0.016) (0.015) (0.015)Girl −0.006 0.004 0.011 −0.001

(0.011) (0.009) (0.008) (0.008)High-SES 0.064*** 0.009 0.006 0.013*

(0.011) (0.009) (0.008) (0.008)High quality optional course 0.044* 0.003 0.012 0.004

(0.023) (0.022) (0.018) (0.018)DNB Quintile 1 Ref. Ref. Ref. Ref.

— — — —DNB Quintile 2 0.011 −0.022 −0.006 −0.009

(0.017) (0.016) (0.015) (0.016)DNB Quintile 3 0.042** −0.017 −0.000 −0.013

(0.018) (0.016) (0.016) (0.017)DNB Quintile 4 0.082*** 0.005 0.016 0.009

(0.019) (0.017) (0.017) (0.017)DNB Quintile 5 0.088*** 0.009 0.009 0.014

(0.020) (0.018) (0.017) (0.017)

R2 0.01 0.23 0.44 0.43N 28,515 28,515 28,515 28,515

Fixed effect NoneHighschool

HS ×9th grade

class

10thgradeclass

Each column is from a separate regression of the instrument Z (number ofPCs received through one of the random allocations) on students’ character-istics.Standard errors (in parentheses) are clusterized at the class of origin × classof destination level.

95

Page 122: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.10 – Effect of PC on high school outcomes using the IV strategy

Dependent variable (I) (II) (III) (IV)

Repeats 10th grade −0.014*** −0.009*** −0.007** −0.008***(0.003) (0.003) (0.003) (0.003)

R2 0.00 0.18 0.32 0.32

Drops out 0.000 −0.001 0.001 −0.003

(0.002) (0.002) (0.002) (0.002)R2 0.00 0.12 0.25 0.25

Academic major 0.029*** 0.012*** 0.008** 0.012***(0.004) (0.004) (0.004) (0.004)

Technological major −0.016*** −0.002 −0.002 −0.001

(0.002) (0.002) (0.002) (0.002)

N 33,663 33,663 33,663 33,663

Takes Bac on schedule 0.013*** 0.012*** 0.007 0.014***(0.005) (0.004) (0.005) (0.005)

HS graduate 0.028*** 0.016*** 0.011** 0.016***(0.005) (0.005) (0.005) (0.005)

N 28,515 28,515 28,515 28,515

Fixed effect NoneHigh-school

HS × 9thgrade class

10thgrade class

Each column is from a separate regression of students’ outcomes on theinstrument Z (number of PCs received through one of the random alloca-tions).Standard errors (in parentheses) are clusterized at the class of origin× classof destination level.

96

Page 123: Inégalités scolaires, ségrégation et effets de pairs

2.6. Discussion and conclusion

All in all, these results confirm our main strategy results. Moreover, this approach has someadvantages even though it relies on a stronger assumption. First, the main strategy focuseson students who have been separated from a very similar former classmate, most likely a friend.Getting more persistent classmates may have more of an impact than usual in such settings. Thisapproach finds a similar impact on a different sample, thus removing doubts as to the externalvalidity of our results. Furthermore, by allowing comparisons of students within the same class(column III), the effect can be estimated of a pure variation in the number of PCs, holdingother class characteristics constant. 46 This allays our concerns about omitted class characteristicsdriving our results in section 2.4. Last but not least, it shows that the positive effect of persistentclassmates does not operate solely through improvement in the global class context, which wouldaffect everyone similarly. 47 Freshmen do therefore benefit from familiar peers via channels thatoperate at individual level, such as a greater sense of belonging or social and academic support.

2.6 Discussionandconclusion

This paper documents how classes influence students’ achievements in high school. Empiri-cal evidence suggests that freshmen students with very similar registration files, when separatedamong different classes, are randomly assigned to their class. With this quasi-experimentalsetting, differences in class environments can be credibly assumed orthogonal to potential out-comes. After examining the correlations between a number of measures of class compositionand student outcomes, we find a robust and significant effect of being assigned again with moreformer classmates. Yet this effect is all but homogenous. It is almost exclusively driven by low-achieving, low-SES freshmen who enroll in high schools with more high-SES mates than theyused to have. These students ”at risk” in high school do not benefit more from the presence ofhigh-achieving persistent classmates. It may be a surprising result, since these peers are morelikely to provide academic help compared to low-achieving persistent classmates. Most probably,low-achieving students are better-off by former classmates through social channels.

46. Suppose in Figure 2.2 that C comes from A’s class and D from B’s class. For C and D, getting A or B onlychanges their relative number of PCs. This is true by construction, because A and B have the same characteristics asregards all other dimensions.

47. It might have been expected, for example, that it is more comfortable to teach a class if more students alreadyknow each other in the class. This beneficial impact on teachers might then affect all students in the class, eventhose who are not directly affected by having more former classmates. Yet in this case, we would not find anydifference between students in the same 10th grade class.

97

Page 124: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Mechanisms implying direct interactions could be at work. For example, persistent class-mates could be friends or acquaintances to whom freshmen may talk during the early weeks,ask for help, or even work as a team. 48 However, even where there is no interaction, being sur-rounded by peers they know and who experience the same difficulties may also be a psychologicalrelief, fostering their sense of belonging in the high school. Precise data on students’ relation-ships and well-being such as those used by Lavy and Sand (2012) would help understand howfreshmen take advantage of familiarity with peers. Unfortunately, such data is not available inour context.

Most importantly, though, our results show that students do not bear the brunt of increasedenrollment in grade 11 with lower performance in subsequent years. So, whatever the mecha-nisms at work, we know that persistent classmates do raise achievement. 49 Basically, we arguethat this result suffices to draw relevant policy recommendations on class composition. Whereasa great deal of money is usually invested in improving outcomes of students at risk of under-achievement, we show that assigning them to some persistent classmates could increase theirperformance at no cost. The potential gains could be substantial. Our analysis finds that eachpersistent classmate reduces their risk of repetition by 1.5 pp. on average. This figure is es-timated using solely the variance of PCs observed within groups of SF students at risk, with98 percent of variations ranging from 0 to 3 PCs (no conclusion should be drawn about the PCeffect beyond this range). Students at risk in the freshmen population have 1.5 low-achievingPCs on average: raising this figure by 3 50 could thus reduce their risk of repetition by 4.5 pp.(meaning 13 percent of their current rate) while increasing their graduation rate by the sameamount. Non-linearities of the PC effect might result in the same (or even a greater) benefitwith fewer than 3 PCs, but the small variance in the number of PCs in our sample does not allowus to investigate this. Nonetheless, it would be helpful to back up these recommendations withexperimental evidence, as Carrell et al. (2011) stressed the need to test such policy predictions

48. In this way, grouping students who come from the same class may be an efficient tool to help teachers developcooperative learning within the class, as they might rely on existing friendships and social links between studentsright from the start of the year.

49. In particular, mechanisms implying solely a change in preferences are ruled out by this result. For example,persistent classmates could make students less likely to repeat 10th grade only by increasing their propensity toappeal to teachers’ decisions (to avoid losing friends). In that case though, negative drawbacks would be observedin the following grades since students would enroll in grades and for majors where requirements would be too high.

50. 11 former classmates are enrolled in their high school on average.

98

Page 125: Inégalités scolaires, ségrégation et effets de pairs

2.7. Bibliography

drawn from reduced-form estimates.

We believe this study makes an important contribution to the existing literature on the roleof the school environment in achievement. We show that low-achieving students benefit frompeer persistency when the rest of their environment gets largely disrupted by the transition tohigh school. This study emphasizes the need for a minimum of stability in the face of greatinstability, and highlights the huge complexity of peer effects and social interactions.

2.7 Bibliography

Angrist, J. D. and Lang, K. (2004). Does school integration generate peer effects? evidencefrom boston’s metco program. The American Economic Review, 94(5):1613–1634.

Calvò-Armengol, A., Patacchini, E., and Zenou, Y. (2009). Peer Effects and Social Networksin Education. Review of Economic Studies, 76(4):1239–1267.

Carrell, S. E., Sacerdote, B. I., and West, J. E. (2011). From natural variation to optimal pol-icy? the lucas critique meets peer effects. NBER Working Paper 16865, National Bureau ofEconomic Research.

Cullen, J. B., Jacob, B. A., and Levitt, S. (2006). The effect of school choice on participants:Evidence from randomized lotteries. Econometrica, 74(5):1191–1230.

De Giorgi, G. and Pellizzari, M. (2013). Understanding Social Interactions: Evidence fromthe Classroom. NBER Working Papers 19202, National Bureau of Economic Research, Inc.

Duflo, E., Dupas, P., and Kremer, M. (2011). Peer effects, teacher incentives, and the impact oftracking: Evidence from a randomized evaluation in kenya. The American Economic Review,101(5):1739–74.

Foster, G. (2006). It’s not your peers, and it’s not your friends: Some progress toward under-standing the educational peer effect mechanism. Journal of Public Economics, 90(8–9):1455 –1475.

99

Page 126: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Fruehwirth, J. C. (2013). Identifying peer achievement spillovers: Implications for desegrega-tion and the achievement gap. Quantitative Economics, 4(1):85–124.

Gibbons, S., Silva, O., and Weinhardt, F. (2013). I (don’t) like the way you move: The dis-ruptive effects of residential turnover on student attainment. Preliminary draft, SOLE 2014Conference.

Goux, D. and Maurin, É. (2007). Close neighbours matter: Neighbourhood effects on earlyperformance at school. Economic Journal, 117(523):1192–1215.

Halliday, T. J. and Kwak, S. (2012). What is a peer? the role of network definitions in estimationof endogenous peer effects. Applied Economics, 44(3):289–302.

Hoxby, C. M. (2000). Peer effects in the classroom: Learning from gender and race variation.NBER Working Paper 7867, National Bureau of Economic Research.

Imbens, G. W. (2000). The role of the propensity score in estimating dose-response functions.Biometrika, 87(3):706–710.

Kling, J. R., Liebman, J. B., and Katz, L. F. (2007). Experimental analysis of neighborhoodeffects. Econometrica, 75(1):83–119.

Lavy, V., Paserman, M. D., and Schlosser, A. (2012a). Inside the black box of ability peer effects:Evidence from variation in the proportion of low achievers in the classroom. Economic Journal,122(559):208–237.

Lavy, V. and Sand, E. (2012). The friends factor: How students’ social networks affect theiracademic achievement and well-being? NBER Working Paper 18430, National Bureau ofEconomic Research.

Lavy, V. and Schlosser, A. (2011). Mechanisms and impacts of gender peer effects at school.American Economic Journal: Applied Economics, 3(2):1–33.

Lavy, V., Silva, O., and Weinhardt, F. (2012b). The good, the bad, and the average: Evidenceon ability peer effects in schools. Journal of Labor Economics, 30(2):367–414.

Mora, T. and Oreopoulos, P. (2011). Peer effects on high school aspirations: Evidence from asample of close and not-so-close friends. Economics of Education Review, 30(4):575–581.

100

Page 127: Inégalités scolaires, ségrégation et effets de pairs

2.A. Additional tables

2.A Additionaltables

101

Page 128: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.A.1 – Student’s class characteristics regressed on own anonymous exam score: Evidenceof the random assignment of similar-file students

All All At risk At risk

Dependent variable (I) (II) (III) (IV)

Number of PCs 0.062*** 0.000 0.037*** −0.008

(0.003) (0.005) (0.005) (0.008)

Same sex PCs 0.037*** 0.004 0.019*** −0.002

(0.002) (0.004) (0.003) (0.006)

Opposite sex PCs 0.025*** −0.003 0.018*** −0.006

(0.002) (0.003) (0.003) (0.005)

High-ability PCs 0.050*** 0.005 0.029*** −0.005

(0.002) (0.004) (0.003) (0.006)

Low-ability PCs 0.012*** −0.004 0.007** −0.003

(0.001) (0.003) (0.003) (0.005)

N 28,053 28,053 8,981 8,981SF fixed effect No Yes No Yes

Each cell is from a separate regression of the number of PCs of each type on the student’sstandardized average anonymous score at the DNB exam.The ”at risk” sample consists of low-ability, low-SES students, on which the main effects’magnitudes are the highest.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class andmiddle school of origin, high school of destination and individual characteristics, as de-fined in section 2.3.1. By controlling for the SF fixed effect, we compare each studentonly with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students and of missingDNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

102

Page 129: Inégalités scolaires, ségrégation et effets de pairs

2.A. Additional tables

Table 2.A.2 – Anonymous exam score regressed on class characteristics: Evidence of the ran-dom assignment of similar-file students

All All At risk At risk

Independent variable (I) (II) (III) (IV)

Number of PCs 0.149*** 0.000 0.059*** −0.025

(0.013) (0.012) (0.022) (0.026)Average DNB score 4.572*** 0.088 3.065*** 0.094

(0.069) (0.084) (0.092) (0.141)Number of girls −0.022*** 0.000 −0.010 −0.018

(0.006) (0.007) (0.008) (0.012)Number of high-SES students −0.010* 0.008 0.024*** 0.015

(0.005) (0.008) (0.009) (0.016)Class size 0.046*** −0.001 −0.008 0.005

(0.011) (0.012) (0.013) (0.020)

R2 0.25 0.90 0.17 0.78F -test 0.00 0.47 0.00 0.35N 28,053 28,053 8,981 8,981SF fixed effect No Yes No Yes

Each column is from a separate regression of the the student’s standardized averageanonymous score at the DNB exam on class characteristics.The ”at risk” sample consists of low-ability, low-SES students, on which the main effects’magnitudes are the highest.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class andmiddle school of origin, high school of destination and individual characteristics, asdefined in section 2.3.1. By controlling for the SF fixed effect, we compare each studentonly with her similar-file mate assigned randomly to another class.All regressions include quadratic controls for the share of retained students and of miss-ing DNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

103

Page 130: Inégalités scolaires, ségrégation et effets de pairs

2. Persistent Classmates

Table 2.A.3 – Raw correlation between class characteristics and high school outcomes

Dependant variableRepeats

10thgrade

Dropsout

Academicmajor

Tech.major

TakesBac on

schedule

HSgraduate

Independent variable (I) (II) (III) (IV) (V) (VI)

Number of PCs −0.006*** −0.001 0.013*** −0.007*** 0.008*** 0.011***(0.001) (0.000) (0.001) (0.001) (0.001) (0.001)

Average DNB score −0.072*** −0.025*** 0.176*** −0.079*** 0.108*** 0.177***(0.005) (0.003) (0.006) (0.005) (0.007) (0.007)

Number of girls 0.001*** −0.001*** 0.000 −0.000 0.000 0.000(0.000) (0.000) (0.001) (0.000) (0.001) (0.001)

Number of high-SES students 0.001*** 0.000** 0.001** −0.003*** −0.002*** 0.001(0.000) (0.000) (0.000) (0.000) (0.001) (0.001)

Class size −0.003*** 0.000 0.003*** −0.000 0.005*** 0.004***(0.001) (0.000) (0.001) (0.001) (0.001) (0.001)

R2 0.03 0.01 0.09 0.04 0.04 0.08N 28,053 28,053 28,053 28,053 22,9461 22,9461

SF fixed effect No No No No No No

Each column is from a separate regression of students’ outcomes on their class characteristics.The SF fixed effect is not included in these regressions.All regressions include quadratic controls for the share of retained students and of missing DNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

104

Page 131: Inégalités scolaires, ségrégation et effets de pairs

2.A. Additional tables

Table 2.A.4 – Effect of class characteristics on high school outcomes for the sample ”at risk”

Repeats10thgrade

Dropsout

Academicmajor

Tech.major

TakesBac on

schedule

HSgraduate

Independent variable (I) (II) (III) (IV) (V) (VI)

Number of PCs −0.014*** −0.001 0.009** 0.007* 0.014*** 0.012**(0.004) (0.003) (0.004) (0.004) (0.005) (0.005)

Average DNB score 0.064** −0.004 −0.053** −0.007 −0.037 −0.018

(0.025) (0.014) (0.021) (0.023) (0.028) (0.026)Number of girls −0.004* 0.001 0.001 0.002 0.002 0.001

(0.002) (0.001) (0.002) (0.002) (0.002) (0.002)Number of high-SES students −0.000 0.001 −0.000 −0.001 −0.001 0.004

(0.003) (0.002) (0.002) (0.002) (0.003) (0.003)Class size 0.000 0.001 0.001 −0.003 0.001 −0.001

(0.003) (0.002) (0.003) (0.003) (0.004) (0.004)

R2 0.61 0.56 0.67 0.58 0.61 0.60N 8,981 8,981 8,981 8,981 7,6151 7,6151

SF fixed effect Yes Yes Yes Yes Yes Yes

The sample is limited to low-ability, low-SES students (”at risk”) sample on which the effects’ magni-tudes are the highest.Each column is from a separate regression of students’ outcomes on their class characteristics.The SF fixed effect is a single fixed effect accounting altogether for 9th grade class and middle schoolof origin, high school of destination and individual characteristics, as defined in section 2.3.1. Bycontrolling for the SF fixed effect, we compare each student only with her similar-file mate assignedrandomly to another class.All regressions include quadratic controls for the share of retained students and of missing DNB scores.Standard errors (in parentheses) are clusterized at the 10th grade class level.

1 Bac data was not available for the last two cohorts, hence the smaller sample size.

105

Page 132: Inégalités scolaires, ségrégation et effets de pairs
Page 133: Inégalités scolaires, ségrégation et effets de pairs

Chapitre 3Laségrégationsocialeetscolaireen

France : unétatdeslieuxquantitatif

Ce chapitre a été écrit avec Son Thierry Ly.Il sera intégré au rapport du Conseil national d’évaluation du système scolaire sur l’évolutiondes inégalités scolaires.

Nous remercions Cédric Afsa, Pauline Givord, Marine Guillerm, Arthur Heim, Catherine

Moisan, Nathalie Mons, Olivier Monso et Fabrice Murat pour leurs nombreuses sugges-

tions qui ont permis d’enrichir ce rapport.

3.1 Introduction

La mixité sociale et scolaire est un objectif affirmé par de nombreux acteurs du système édu-catif, que ce soit au niveau politique ou des acteurs de terrain. Cet objectif est inscrit dans la loi

107

Page 134: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

de refondation de l’école et il a été réitéré par la ministre de l’Éducation nationale début 2015.Une enquête du Cnesco montre par ailleurs que la très grande majorité des chefs d’établissementssouhaitent éviter de constituer des classes homogènes au sein des établissements. Pourtant, leschiffres montrent l’existence d’une véritable ségrégation sociale et scolaire dans le système édu-catif français. En effet, les collégiens et lycéens d’origine aisée comptent en moyenne dans leurclasse deux fois plus de camarades également d’origine aisée que les autres élèves. Alors qu’uneclasse de 25 élèves contient en moyenne 5 élèves « CSP+ » 1, un élève lui-même classé CSP+ encomptera en moyenne 10 dans sa classe. 20 % des élèves « favorisés » de troisième comptent mêmeplus de 15 élèves favorisés dans leur classe, alors que seuls 2 % des élèves des classes moyenneset défavorisées en comptent autant 2.

Ces chiffres sont le résultat d’un décalage entre des objectifs collectifs de mixité et une re-cherche individuelle d’entre-soi. À l’échelle individuelle en effet, on comprend que les parentsd’élèves aisés cherchent pour leur enfant un environnement scolaire rassurant. De même, un en-seignant peut estimer qu’il est plus agréable, sinon plus efficace, de faire cours à une classe oùles écarts de niveau sont limités. Un chef d’établissement convaincu que des classes homogènessont inefficaces doit donc faire face à des demandes qui viennent s’opposer à l’objectif de mixité.

L’effet de l’environnement de classe ou d’établissement sur les performances scolaires est trèsdifficile à évaluer, et il n’y a pas de consensus au niveau de la communauté scientifique sur cettequestion 3. Il en est de même pour les acteurs de terrain dont les convictions varient fortement enfonction des expériences vécues par chacun. La recherche de mixité scolaire répond cependantà d’autres impératifs : l’école doit proposer les mêmes opportunités à tous les élèves, elle doit lespréparer à devenir des citoyens et à vivre ensemble.

1. On appelle « CSP+ » les élèves de la catégorie « Favorisés-A » définie dans le Table 3.1.2. Ces chiffres portent sur la cohorte entrée en sixième en 2007 et sont calculés à partir des bases administratives

du Ministère de l’Éducation nationale, qui sont la principale source de cette étude.3. Très souvent, des élèves ayant des entourages différents ont un contexte scolaire qui diffère par beaucoup

d’aspects. Dès lors, les comparaisons de résultats d’élèves ne permettent pas d’isoler l’effet de la composition declasse ou d’établissement. Les études sur les effets de pair présentent souvent des défauts méthodologiques ou unevalidité limité à des cas très précis, et leurs résultats ne peuvent pas être généralisés. Dans ce rapport, nous necherchons pas à identifier l’impact de la mixité sociale et scolaire sur les résultats scolaires mais seulement à laquantifier et l’analyser.

108

Page 135: Inégalités scolaires, ségrégation et effets de pairs

3.1. Introduction

Si la mixité sociale est scolaire est devenue une préoccupation importante au cours des der-nières années, l’Éducation nationale ne s’est pas dotée d’un appareil statistique permettant de lamesurer précisément. La Depp 4 et l’Insee ont commencé à proposer une méthodologie (Monsoet al., 2015) mais sans intention, à ce stade, de produire des indicateurs de manière régulière.L’objectif de ce rapport est de dresser un panorama complet de la ségrégation sociale et scolairedans l’enseignement secondaire français, afin d’éclairer les débats actuels sur la mixité sociale àl’école 5. Il vient combler un manque dans la littérature en économie et sociologie de l’éducation,en étant le premier à proposer un diagnostic :

— portant sur l’ensemble du territoire national ;— sur le collège et le lycée ;— mesurant la ségrégation sociale et scolaire ;— intégrant les dimensions inter- et intra-établissement.

Plusieurs études ont cependant permis d’introduire des premières données chiffrées dansle débat. Les premiers éléments quantitatifs précis ont été apportés par Felouzis (2003), qui aanalysé la répartition des 144 000 élèves scolarisés dans les 333 collèges de l’académie de Bor-deaux pendant l’année scolaire 2000-2001. À partir de la base élèves académique, il a définiune variable ethnique en utilisant le prénom des élèves, en dinstinguant élèves « autochtones » et« allochtones » (prénoms d’origine étrangère, 7,1 % des élèves). Cette variable a permis de mesu-rer le degré de regroupement de ces élèves dans certains collèges : par exemple, 10 % des collègesscolarisent 26 % des élèves allochtones. Pour atteindre l’équilibre parfait, il faudrait en théoriedemander à 4,9 % de l’ensemble des élèves de l’académie de changer d’établissement, soit plus de7 000 élèves – l’équivalent de seize collèges. Malheureusement, l’analyse de Felouzis s’arrête auniveau établissement ; pour atteindre un équilibre entre toutes les classes de l’académie, il faudraitensuite déplacer les élèves entre les classes de chaque établissement.

Citons par ailleurs plusieurs travaux réalisés à la suite de l’assouplissement de la carte scolaireen 2007. Thaurel-Richard and Murat (2013) ont montré une hausse des demandes de déroga-

4. Direction de l’évaluation, de la prospective et de la performance, le service statistique du Ministère de l’Édu-cation nationale.

5. Une version préliminaire de ce rapport a été diffusée lors de la conférence de comparaison internationale duCnesco sur les mixités sociales à l’école, les 4 et 5 juin 2015. Les principaux ajouts de cette version concernent lerôle du privé dans la ségrégation inter-établissement, une analyse actualisée et plus précise du rôle des options dansla ségrégation intra-établissement, et des données sur l’évolution de la ségrégation au cours de la dernière décennie.

109

Page 136: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

tion autour de la date de l’assouplissement de la carte scolaire et des stratégies d’évitement descollèges de l’éducation prioritaire qui bénéficie notamment aux collèges privés. Ce phénomène,bien qu’ayant augmenté en amplitude, n’a pas eu un effet détectable sur les chiffres macrosco-piques de la ségrégation au niveau national (Fack and Grenet, 2012). Il a toutefois pu aggraverles disparités entre les collèges au niveau local, comme à Paris (Merle, 2010) ou à Lille et Saint-Étienne (Ben Ayed et al., 2013). À Paris, l’introduction en 2008 du logiciel d’affectation desélèves Affelnet a engendré dans les lycées parisiens une baisse de la ségrégation sociale, en raisond’un bonus pour les boursiers dans le barème Affelnet de cette académie, mais le poids des notesdans ce barème a au contraire augmenté la ségrégation scolaire (Fack et al., 2014).

Au niveau intra-établissement, les études quantitatives sont très rares, en raison notammentdu manque de données. Un des premiers résultats provient d’une analyse sur un échantillonde 212 collèges entre 1989 et 1992 (Duru-Bellat and Mingat, 1997), qui met en avant unediversité de pratiques au sein des établissements, donnant lieu à la constitution de classes deniveau dans un collège sur deux environ. Nous avons montré dans une précédente étude portantsur la région Île-de-France (Ly et al., 2014) qu’en moyenne, un élève de milieu favorisé comptedans sa classe deux fois plus d’élèves eux-mêmes de milieu favorisé qu’un élève de milieu moyenou défavorisé n’en compte – un résultat que nous confirmons ici au niveau national. Dans cetterégion, la ségrégation intra-établissement est du même ordre de grandeur que la ségrégationentre les établissements d’une même commune, mais celle-ci s’explique en grande partie parle « hasard » de la constitution des classes : en simulant une affectation aléatoire des élèves, onobtient des valeurs indicateurs de ségrégation intra-établissement proches des valeurs observées.

Nous commençons par présenter les données mobilisées et la méthodologie utilisée, en dis-cutant notamment le choix d’un indicateur de ségrégation (partie 3.2). Nous présentons ensuiteles mesures de ségrégation sociale et scolaire aux niveaux inter-établissements (partie 3.3) etintra-établissement (partie 3.4), puis l’évolution des niveaux de ségrégation (partie 3.5).

110

Page 137: Inégalités scolaires, ségrégation et effets de pairs

3.2. Méthodologie

3.2 Méthodologie

3.2.1 Commentmesurerlaségrégation ?

La ségrégation, qu’elle soit sociale ou scolaire, est un concept difficile à définir et à mesurer.Dans une acception historique, ce terme désigne une politique volontariste de séparation desindividus en fonction de leurs caractéristiques personnelles, par exemple leur couleur de peau.Pour les économistes et les sociologues, ce terme peut avoir un sens moins extrême et capter toutun continuum de situations « plus ou moins ségrégées ». Nous utiliserons la définition suivante :

Définition 1 (Ségrégation) Le terme de ségrégation désigne toute situation dans laquelle des indivi-dus ayant des caractéristiques différentes fréquentent des environnements différents.

Une telle situation se traduit d’une part par des disparités de répartition de groupes sociauxselon les lieux, d’autre part par une diminution des interactions entre individus issus de groupesdifférents (Massey and Denton, 1988).

Cette définition permet de définir des indicateurs de ségrégation dont le but est de mesurerl’intensité de ces disparités.

Définition 2 (Indicateur de ségrégation) Un indicateur de ségrégation est un nombre comprisentre zéro et un (ou entre 0 % et 100 %), dont la valeur minimale est atteinte lorsque les individusfréquentent un environnement semblable quelles que soient leurs caractéristiques personnelles et la va-leur maximale est atteinte lorsqu’ils sont entièrement isolés en fonction de ces caractéristiques.

Plusieurs indices de ségrégation respectant cette définition ont été construits pour étudier l’in-égale répartition des individus dans différents contextes. Ils ont des fondements théoriques etmathématiques différents et donc des significations et des interprétations différentes (Frankeland Volij, 2011), sur lesquelles nous reviendrons succintement. Ils ont cependant en communde demander à ceux qui les utilisent d’effectuer deux « découpages » de la population :

— Un découpage en fonction des caractéristiques personnelles : il s’agit de définir des groupessociaux correspondant au type d’isolement que l’on souhaite mesurer. Par exemple, pour

111

Page 138: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

mesurer la ségrégation ethnique, on peut définir des groupes en fonction de l’originemigratoire ; pour mesurer la ségrégation sociale, on peut définir des groupes en fonctiondes revenus ou de la catégorie socio-professionnelle ; pour mesurer la ségrégation scolaire,on peut définir des groupes en fonction des notes obtenues à un examen. Dans tous lescas, les groupes doivent être tels que chaque individu dans la population étudiée doitappartenir à un groupe et un seul. Souvent, on choisit un découpage simple en deuxcatégories uniquement, pour faciliter la lecture des indices 6.

— Un découpage en fonction des environnements fréquentés : il s’agit de définir l’environ-nement social de chaque individu, et l’échelle à laquelle on mesure la ségrégation. Dansle cas de l’école, on peut s’intéresser notamment à l’environnement établissement ou àl’environnement classe. Les indices de ségrégation obtenus en utilisant l’environnementclasse seront toujours supérieurs aux indices obtenus en utilisant l’environnement établis-sement 7. En effet, les disparités entre classes sont le résultat de deux phénomènes quis’ajoutent : la ségrégation inter-établissements, qui est celle que l’on mesure en utilisant lesenvironnements établissements, et la ségrégation intra-établissement, liée à la manière decomposer les classes.

Dans cette étude, nous utiliserons quatre découpages en fonction des caractéristiques person-nelles, qui serviront à définir deux indices de ségrégation sociale et deux indices de ségrégationscolaire :

Définition 3 (Ségrégation sociale) La ségrégation sociale est mesurée en découpant la populationen fonction de leur origine sociale. Nous effectuons deux tels découpages, qui permettent de mesurer l ’iso-lement des élèves dits « CSP+ » d’une part, celui des élèves « CSP- » d’autre part.

— Dans le premier découpage, le groupe A correspond aux élèves dits « CSP+ », c’est-à-dire dontle premier parent inscrit (souvent le père) a une catégorie socio-professionnelle classée dans legroupe « Favorisés-A » de la Depp et le groupe B correspond aux élèves dont le parent est classédans un des groupes « Favorisés-B », « Moyens » et « Défavorisés » (voir Table 3.1) 8. Ce dé-

6. L’étude de Monso et al. (2015) mesure un indice de ségrégation s’appuyant sur les quatre catégories socialesde la Depp.

7. Les deux indices peuvent en théorie être égaux dans le cas, jamais observé en pratique, d’une ségrégationabsolument nulle au niveau intra-établissement.

8. Cette classification a été remise en question par une étude récente de la Depp (Le Donné and Rocher, 2010)qui montre que cette classification pourrait être revue, notamment en ce qui concerne les PCS défavorisées.

112

Page 139: Inégalités scolaires, ségrégation et effets de pairs

3.2. Méthodologie

coupage permet de mesurer à quel point les élèves « CSP+ » sont isolés par rapport aux autresélèves.

— Dans le deuxième découpage, le groupe A correspond aux élèves dits « CSP- », c’est-à-dire dontle parent de référence appartient à la catégorie « Défavorisés » de la Depp et le groupe B corres-pond aux élèves dont le parent est classé dans un des groupes « Favorisés-A », « Favorisés-B »et « Moyens ». Ce découpage permet de mesurer à quel point les élèves « CSP- » sont isolés parrapport aux autres élèves.

Dans une situation hypothétique où les enfants de parents CSP+ sont fortement regroupés et queles autres élèves sont relativement mélangés (c’est-à-dire qu’il y a des établissements très favoriséset des établissements moyens), l’indice de ségrégation sociale « CSP+ » sera élevé alors que l’in-dice de ségrégation sociale « CSP- » sera modéré. À l’inverse, dans une situation où les enfantsde parents CSP- sont fortement regroupés et que les autres élèves sont relativement mélangés(c’est-à-dire qu’il y a des établissements très défavorisés et des établissements moyens), l’indicede ségrégation sociale « CSP- » sera élevé alors que l’indice de ségrégation sociale « CSP+ » seramodéré.

Définition 4 (Ségrégation scolaire) La ségrégation scolaire est mesurée en découpant la populationen fonction de leur niveau scolaire. Cette dimension de la ségrégation est plus difficile à mesurer, dansla mesure où nous ne disposons que de mesures imprécises du niveau scolaire, à savoir les résultats audiplôme national du brevet (DNB) et au baccalauréat. Les résultats au baccalauréat sont difficiles àcomparer entre les voies générale, technologique et professionnelle et entre les différentes séries au sein deces voies. Une autre mesure, là encore imprécise, du niveau scolaire, est l ’âge de l ’élève, dans la mesureoù les élèves les plus en difficulté sont susceptibles de redoubler au cours de leur scolarité. Comme pourla ségrégation sociale, nous effectuons deux tels découpages, qui permettent de mesurer l ’isolement des« meilleurs élèves » d’une part, celui des élèves plus en difficulté d’autre part.

— Dans le premier découpage, le groupe A correspond aux élèves qui n’ont pas redoublé en sixième,cinquième et quatrième, ont passé le DNB dans la filière générale, et dont la note moyenneaux quatre épreuves finales (mathématiques, français, histoire-géographie, histoire de l ’art) estdans le premier quart de la distribution ; le groupe B correspond à tous les autres élèves : ceuxqui ont redoublé au collège, ceux qui passent le DNB dans la filière professionnelle, et ceux dont

113

Page 140: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

Code Libellé Catégorie

23 Chefs d’entreprise de 10 salariés ou plus

Favorisés-A31 Professions libérales32 Cadres de la fonction publique, professions intellectuelles et artistiques36 Cadres d’entreprise42 Professeurs des écoles, instituteurs et assimilés

43 Professions intermédiaires de la santé et du travail social

Favorisés-B

44 Clergé, religieux45 Professions intermédiaires administratives de la fonction publique46 Professions intermédiaires administratives et commerciales des entreprises47 Techniciens48 Contremaîtres, agents de maîtrise73 Anciens cadres et professions intermédiaires

10 Agriculteurs

Moyens

21 Artisans22 Commerçants et assimilés51 Employés de la fonction publique54 Employés administratifs d’entreprise55 Employés de commerce56 Personnels des services directs aux particuliers71 Anciens agriculteurs exploitants72 Anciens artisans, commerçants, chefs d’entreprise

61 Ouvriers qualifiés

Défavorisés

66 Ouvriers non qualifiés69 Ouvriers agricoles76 Anciens employés et ouvriers81 Chômeurs n’ayant jamais travaillé82 Inactifs divers (autres que retraités)

Table 3.1 – Classification des PCS de la DEPP

114

Page 141: Inégalités scolaires, ségrégation et effets de pairs

3.2. Méthodologie

les résultats aux épreuves finales ne se situent pas dans le premier quart de la distribution Cedécoupage permet de mesurer à quel point ces élèves, que nous appellerons « meilleurs élèves »,sont isolés par rapport aux autres élèves. Attention, le niveau scolaire étant mesuré à la fin de latroisième, les chiffres présentés ici sont d’autant moins précis qu’ils concernent un niveau éloignéde la troisième : d’une part, les élèves peuvent avoir un niveau scolaire variable au cours deleur scolarité, et d’autre part nos données ne nous permettent pas toujours de suivre les élèvespendant l ’ensemble de leur scolarité.

— Il est plus compliqué de détecter les élèves les plus en difficulté en utilisant les résultats au DNB ;ainsi, dans le deuxième découpage, le groupe A correspond aux élèves ayant redoublé au moinsune fois au cours de leur scolarité au moment de la mesure, c’est-à-dire aux élèves « en retardscolaire » ; le groupe B correspond donc aux élèves n’ayant jamais redoublé au moment de lamesure (élèves « à l ’heure » ou en avance scolaire). Ce découpage permet de mesurer à quel pointles élèves en retard scolaire sont isolés par rapport aux autres élèves.

Notons que le brevet des collèges intervenant à la fin du collège, il faut rester prudent quant àl’interprétation des chiffres de la ségrégation scolaire au collège. Les inégalités de niveau scolairemesurées entre établissements et entres classes peuvent être à la fois le résultat d’une allocationinégale des élèves à la rentrée et du fait que différentes classes ont progressé inégalement aucours de l’année, pour des raisons multiples (allocation des moyens, des professeurs, etc.). Lesdonnées dont nous disposons ne nous permettent malheureusement pas de dissocier ces deuxcomposantes. Cela ne retire pas d’intérêt au fait de mesurer les inégalités scolaires au collège,qu’elles soient issues d’une véritable ségrégation au moment de l’allocation des élèves ou de dy-namiques de classe différentes en cours d’année. Comme nous le verrons notamment dans lecas de la ségrégation intra-établissement, nous disposons par ailleurs d’indices nous indiquantque l’allocation initiale des élèves aux classes contribue de manière importante à la ségrégationscolaire. De plus, la mesure de la ségrégation scolaire basée sur la répartition des élèves en retardscolaire – qui fournit des résultats très similaires – reflète uniquement des inégalités de niveauscolaire au moment de la rentrée.

Dans cette étude, nous présenterons plus en détail les mesures de ségrégation des élèves« favorisés », c’est-à-dire des CSP+ et des meilleurs élèves. Sauf mention contraire, nous parle-

115

Page 142: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

rons donc de ségrégation sociale pour désigner la ségrégation des élèves CSP+ et de ségrégationscolaire pour désigner la ségrégation des meilleurs élèves. Les résultats portant sur les élèves CSP-et les élèves en retard scolaire seront presentés en annexe.

3.2.2 L’indiced’exposition

La littérature en économie et sociologie utilise plusieurs indices de ségrégation : nous rappe-lons la définition des quatre plus populaires d’entre eux dans l’annexe 3.A. Nous avons choisi detravailler avec l’indice d’exposition (voir définition 5), pour deux raisons principales.

Tout d’abord, il peut s’écrire comme la somme d’une composante inter-établissements etd’une composante intra-établissements. Il permet donc de déterminer dans quelle mesure laségrégation s’explique par les disparités entre établissements et par la composition des classes.Seul cet indice et l’indice de Theil (définition 7) possèdent cette propriété de décomposabilité.

Le deuxième intérêt de cet indice est qu’il possède une inteprétation simple en termes d’en-vironnements vécus par les élèves. Par exemple, si l’indice d’exposition mesure une ségrégationsociale entre les établissements de 20 %, cela signifie que le pourcentage d’élèves CSP+ dans lecollège d’un élève lui-même CSP+ est supérieur de 20 points, en moyenne, que celui d’un élèvenon-CSP+. Ainsi, s’il y a 30 % d’élèves CSP+ dans la population et que la ségrégation socialeest de 20 %, les élèves CSP+ auront en moyenne 44 % d’élèves CSP+ dans leur établissement,alors que les autres élèves n’en auront que 24 %. L’indice d’exposition est donc une mesure di-recte de l’« entre-soi » scolaire : il indique dans quelle mesure les élèves fréquentent des élèvesqui possèdent les même caractéristiques qu’eux.

La possibilité de décomposer l’inter- et l’intra-établissement, l’interprétation intuitive del’indice et d’autres propriétés mathématiques (pour plus de détails, voir Ly and Riegert, 2015)sont les raisons pour lesquelles nous privilégions l’utilisation de ce dernier indice dans cette étude ;à des fins de comparaison, les valeurs des autres indices sont donnés en annexe.

Par ailleurs, nous accompagnerons systématiquement la valeur de l’indice de ségrégation de laproportion du groupe de référence (CSP+ ou « meilleurs élèves ») dans l’échantillon étudié. Il est

116

Page 143: Inégalités scolaires, ségrégation et effets de pairs

3.2. Méthodologie

important de noter qu’il n’existe pas de manière absolue de comparer deux indices de ségrégationmesurés sur des échantillons ayant des compositions sociales ou scolaires différentes, et ce quelque soit l’indice choisi (voir à ce sujet la discussion de l’annexe 3.A.2).

3.2.3 Lesdonnéesmobilisées

Les résultats présentés dans cette étude sont issus de données de la Direction de l’évalua-tion, de la prospective et de la performance (Depp) du Ministère de l’Éducation nationale. Ilsproviennent en particulier de deux bases de données :

— La base Scolarité recense l’ensemble des élèves inscrits dans les collèges et lycées françaispublics ou privés sous contrat. Pour chaque élève, sont connus son établissement d’ins-cription, sa classe, sa division (par exemple, « troisième A »), les langues et options qu’ila choisies, sa date de naissance, son sexe ainsi que la catégorie socio-professionnelle deses parents (voir Table 3.1).

— La base Océan-Brevet contient les notes obtenues par l’ensemble des élèves de troisièmeau diplôme national du brevet (DNB).

Nous n’avons conservé dans l’échantillon que les classes du cursus scolaire classique, et avonsnotamment exclu les classes SEGPA 9 et les autres classes spécialisées. Le but de cette sélectionest de ne mesurer que la ségrégation qui a lieu de manière naturelle entre des classes a prioricomparables, en mettant de côté les dispositifs d’adaptation et de remédiation qui ont pour effetdirect de réduire la mixité sociale.

Les résultats présentés ici portent sur la pseudo-cohorte d’élèves qui entrent en sixième en2007. On mesure donc la ségrégation en sixième sur l’année scolaire 2007-2008, la ségrégationen cinquième sur l’année 2008-2009, jusqu’à la ségrégation en terminale sur l’année 2013-2014.

9. Section d’enseignement général et professionnel adapté.

117

Page 144: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

3.3 La ségrégation socialeet scolaireentre les

établissements

3.3.1 Auniveaunational

La Figure 3.1 donne le niveau de ségrégation sociale et scolaire, niveau par niveau, au collègeet au lycée, sur le plan national. Les points reliés indiquent, pour chaque niveau, la part d’élèvesdu « groupe de référence » (les élèves CSP+ pour la ségrégation sociale, les meilleurs élèves pourla ségrégation scolaire), et les barres indiquent le niveau de ségrégation entre les établissements.La partie plus claire de chaque barre indique la part de la ségrégation expliquée par les disparitésentre communes.

Un collège compte en moyenne 110 élèves par niveau ; un lycée (tous types confondus)compte environ 192 élèves de seconde (ou première année de CAP), 172 élèves de première(ou deuxième année de CAP) et 162 élèves de Terminale. Selon nos critères, la part de CSP+varie de 21 à 26 % et la part des meilleurs élèves est comprise entre 19 et 24 %, selon le niveau.On parlera dans la suite de cohortes pour désigner l’ensemble des élèves d’un établissement à unniveau donné (par exemple, l’ensemble des élèves de quatrième du collège Louise-Michel consti-tue une cohorte). L’exposition d’un élève au groupe de référence (les CSP+ pour la ségrégationsociale, les meilleurs élèves pour la ségrégation scolaire) est donc définie comme la part de cegroupe dans la cohorte de l’élève.

3.3.1.1 Ségrégationsociale

L’indice de ségrégation sociale au collège est compris entre 16 et 17 % selon le niveau. Alorsqu’en l’absence de ségrégation, tous les élèves compteraient 22 % d’élèves CSP+ parmi les élèvesdu même niveau de leur collège, les élèves eux-même CSP+ en comptent 34 %, et les élèves desCSP intermédiaires et défavorisées n’en comptent que 18 %.

Au lycée, les chiffres de la ségrégation sociale n’augmentent que légèrement. Cette relativestabilité est le résultat de deux phénomènes concurrents : le regroupement dans les mêmes éta-

118

Page 145: Inégalités scolaires, ségrégation et effets de pairs

3.3. La ségrégation sociale et scolaire entre les établissements

0 %

5 %

10 %

15 %

20 %

25 %

30 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation sociale

Niveau

P , p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre établissementsd’une même commune

Ségrégation socialeentre communes

0 %

5 %

10 %

15 %

20 %

25 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation scolaire

Niveau

P , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre établissementsd’une même commune

Ségrégation scolaireentre communes

Figure 3.1 – Ségrégation sociale et scolaire inter-établissements au niveau national pour chaqueclasse, mesurée pour la cohorte 2007 par l’indice d’exposition.Lecture : pour la cohorte d’élèves entrés en sixième en 2007, la ségrégation sociale en troisième(année 2010-2011), mesurée par l’indice d’exposition, était de 11,5 % entre communes et 17,2 %entre collèges. La part d’élèves CSP+ y était de 22,7 %.

119

Page 146: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

blissements d’élèves issus de plusieurs collèges a pour effet de diminuer la ségrégation, mais laséparation des élèves entre les lycées généraux, technologiques et professionnels l’augmente. Cesdeux phénomènes sont partiellement captés sur notre graphique : le premier se traduit par unebaisse de la part de ségrégation expliquée par les différences entre communes, et le deuxième parune hausse de la ségrégation entre les établissements d’une même commune.

La lecture des deux composantes (inter-communes et inter-établissements, intra-communes)doit cependant être faite avec précaution. Environ 3 820 communes accueillent au moins un col-lège, et deux-tiers d’entre elles n’en comptent qu’un seul. Inversement, 36 % des collèges sontsitués dans des communes à un seul collège, et 22 % dans des communes à deux collèges. Laségrégation sociale intra-commune, inter-établissements visible sur la Figure 3.1 n’est donc gé-nérée que par un petit nombre de communes (environ 1 300).

Il faut enfin noter que la ségrégation inter-communes ne capte qu’une partie de la ségrégationrésidentielle. La ségrégation intra-commune, inter-établissements, est la somme de deux com-posantes que nos données ne permettent pas de distinguer. D’une part, elle reflète la ségrégationentre les différents quartiers de chaque commune, chaque établissement accueillant en majoritéles élèves qui habitent à proximité de celui-ci. À cette composante s’ajoutent des mouvementsd’élèves qui choisissent, par dérogation ou en s’inscrivant dans le secteur privé, d’aller dans unétablissement autre que leur établissement de secteur.

Nous présentons en annexe (Figure 3.B.1, en haut) les chiffres de la ségrégation socialemesurée en prenant comme groupe de référence les élèves CSP-. Le constat est similaire : l’indiced’exposition varie entre 14 et 16 % selon le niveau.

3.3.1.2 Ségrégationscolaire

La ségrégation scolaire a une évolution beaucoup plus contrastée en fonction du niveau que laségrégation sociale. Dans les chiffres nationaux, elle reste relativement limitée au collège, où ellevarie de 7 à 9 %. Ainsi, alors qu’en l’absence de ségrégation tous les élèves compteraient 21 % desde « bons élèves » parmi les élèves de même niveau dans leur collège, les bons élèves en comptent27 % et les élèves moyens ou en difficulté n’en comptent que 19 %.

120

Page 147: Inégalités scolaires, ségrégation et effets de pairs

3.3. La ségrégation sociale et scolaire entre les établissements

Le niveau total de ségrégation double cependant entre le collège et le lycée, pour atteindre18 à 21 %. L’augmentation brutale de la ségrégation entre la troisième et la seconde s’explique enpremier lieu par la séparation de la majorité des élèves entre des lycées généraux et technologiqueset des lycées professionnels. 42 % des lycées sont des lycées généraux et/ou technologiques, 35 %sont des lycées professionnels et 20 % sont des lycées polyvalents 10.

Cette rupture est beaucoup mieux repérée par le critère scolaire que par le critère social, ce quiest assez rassurant dans une certaine mesure : si très peu d’élèves parmi les meilleurs choisissentde suivre la voie professionnelle, on y trouve néanmoins une quantité non-négligeable d’élèvesissus des classes aisées.

3.3.1.3 Lerôleduprivé

La segmentation entre les secteurs public et privé est très souvent présentée, dans le débatpublic, comme la première source de ségrégation. De fait, les établissements privés accueillent,en moyenne, un public nettement plus favorisé que les établissements publics. À tous les niveauxde la scolarité secondaire, le secteur privé représente environ 21 % des élèves. Parmi eux, 32 à37 % sont des élèves CSP+, contre seulement 18 à 24 % dans le secteur public (les chiffres varientselon le niveau, mais l’écart public-privé demeure proche de 14 points de pourcentage). Bien queplus faibles, les inégalités scolaires entre les deux secteurs restent importantes : la part de meilleursélèves varie entre 26 et 29 % dans le secteur privé, alors qu’elle est comprise entre 18 et 23 % dansles établissements publics. Ainsi, on observe une différence notable entre les caractéristiquesmoyennes des élèves des secteurs public et privé.

Ces moyennes cachent cependant d’importantes disparités entre les établissements de chaquesecteur. En effet, la séparation public-privé n’explique, au niveau national, que 8 à 13 % de laségrégation sociale entre les établissements. Cela signifie que même si les établissements privésaccueillent en moyenne un public nettement plus favorisé, les différences entre un établissementfavorisé et un établissement défavorisé du même secteur (public ou privé) sont beaucoup plusimportantes que les différences entre un établissement moyen public et un établissement moyen

10. Les 3 % restants correspondent essentiellement aux Établissements régionaux d’enseignement adapté(EREA, 2 %) ainsi qu’à certains collèges et autres établissements spécialisés qui contiennent des classes de secondeprofessionnelle.

121

Page 148: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

privé. En termes de ségrégation scolaire, le rôle du privé est plus limité encore : il explique 10 à11 % de la ségrégation entre les collèges, et seulement 1 à 2 % de la ségrégation entre les lycées.

Si ces chiffres peuvent paraître surprenants, c’est parce qu’ils comparent l’écart de compositionsociale et scolaire entre les deux secteurs à toute la diversité des publics accueillis dans l’ensembledes établissements du territoire. Si les acteurs de terrain ont le sentiment que la séparation public-privé est la première source de ségrégation sociale entre établissements, c’est parce qu’elle joue unrôle beaucoup plus important à l’échelle locale. En effet, la segmentation public-privé explique40 à 45 % de la ségrégation sociale et 33 à 40 % de la ségrégation scolaire entre les collèges d’unemême commune. Cela signifie que les différences de composition sociale entre un collège publicfavorisé et un collège public défavorisé d’une même commune sont du même ordre de grandeurque les différences entre un collège public moyen et un collège privé moyen. Le rôle du privédiminue sensiblement au lycée, où la séparation entre les secteurs n’explique que 22 à 25 % dela ségrégation sociale et 13 à 14 % de la ségrégation scolaire entre établissements d’une mêmecommune.

Il faut cependant garder à l’esprit que l’existence des deux secteurs n’est qu’un mécanismede ségrégation parmi d’autres : la réintégration des collèges privés dans le secteur public, parexemple, n’aurait pas pour effet mécanique de réduire la ségrégation inter-établissements au seindes communes de 40 %. Une politique de réduction de la ségrégation entre établissements nepourrait en aucun cas se limiter à une fusion des deux secteurs sans remise en question de lasectorisation et des politiques d’affectation.

3.3.2 Disparitésgéographiques

Les chiffres nationaux de la ségrégation sociale et scolaire peuvent paraître relativement mo-destes en première lecture. Ils ne sont cependant que des indicateurs synthétiques d’une situationbeaucoup plus complexe.

On observe par exemple que plusieurs établissements accueillent soit un très petit nombre,soit un très grand nombre d’élèves CSP+ ou de bons élèves. Ainsi, en troisième, 10 % des élèvesfréquentent des établissements contenant 5 % ou moins d’élèves CSP+ dans leur niveau ; à l’in-

122

Page 149: Inégalités scolaires, ségrégation et effets de pairs

3.3. La ségrégation sociale et scolaire entre les établissements

verse, 5 % des élèves ont plus de 60 % d’élèves CSP+ dans leur cohorte, et même plus de 80 % deCSP+ pour les 1 % d’élèves (soit plus de 7000 élèves) dont les environnements sont les plus favo-risés. Si on s’intéresse aux élèves issus des milieux les plus populaires (catégorie « Défavorisés »de la Depp, voir Table 3.1), qui représentent 37 % des élèves de troisième, 10 % des élèves encomptent 63 % ou plus dans leur établissement ; 5 % en comptent 71 % ou plus. De tels écartssont également observés en termes de ségrégation scolaire : 10 % d’élèves comptent 6 % ou moinsde « bons élèves » dans leur cohorte, et à l’inverse 5 % d’élèves en comptent plus de 43 %, et 1 %en comptent plus de 58 %.

Ces disparités sont fortement marquées géographiquement. La Figure 3.2 montre les varia-tions entre départements de l’indice de ségrégation sociale, et la Figure 3.3 montre les variationsde l’indice de ségrégation scolaire. La Figure 3.4 donne la valeur des indices de ségrégation aca-démie par académie. Ces trois figures portent uniquement sur le niveau troisième.

D’un département à un autre, la ségrégation sociale varie de 2 % à 27 %. Les départementsoù la ségrégation est plus faible sont des départements fortement ruraux (Lozère, Ariège, Lot,Aude). Dans ces départements à faible densité de population, les collèges recrutent sur un rayonpouvant dépasser les dix kilomètres : ils regroupent donc dans un même lieu des élèves d’originesdifférentes, ce qui favorise la mixité sociale. À l’inverse, les départements ayant la plus forteségrégation sociale sont essentiellement des départements urbains qui comportent des grandesvilles (les Hauts-de-Seine et Paris se dégagent nettement, suivis des Yvelines, du Val-de-Marne,du Nord, du Rhône et des Bouches-du-Rhône). La multiplication du nombre de collèges dansces zones augmente au contraire la ségrégation par deux biais : d’abord, parce que les collègesreflètent plus précisément la ségrégation résidentielle, et ensuite parce qu’il s’installe une situationde concurrence qui fait émerger des collèges « souhaités » et des collèges « évités ».

Il faut rester très prudent quant à l’interprétation de ces disparités : il ne suffit en effet pasde comparer deux indices de ségrégation pour conclure qu’un territoire est plus ségrégé quel’autre, en particulier si ces territoires ont une composition sociale ou scolaire différente. Parexemple, l’académie de Paris, qui possède les indices de ségrégation les plus élevés, est aussicelle qui compte le plus d’élèves CSP+ et d’élèves parmi les meilleurs. Des comparaisons plus

123

Page 150: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

raisonnables peuvent être faites entre des académies qui ont une composition sociale ou scolaireproche. Par exemple, l’académie de Lille, qui a une composition sociale proche des académies deReims, Nancy-Metz, Amiens ou Caen, a un indice de ségrégation sociale nettement plus élevéque ces académies. Il en va de même pour l’académie de Créteil, dont l’indice d’exposition estnettement plus élevé que les académies de Strasbourg et Rennes dont les compositions socialessont proches. En termes de ségrégation scolaire, les académies de Créteil, Lille, Nice, Versailles,Strasbourg et Paris ont des indices de ségrégation nettement supérieurs à ceux d’académies ayantdes compositions scolaires comparables.

1,6 % 26,9 %

Figure 3.2 – Ségrégation sociale inter-établissements en classe de troisième par département,mesurée par l’indice d’exposition à la rentrée 2010.

La Figure 3.5 montre par ailleurs la forte corrélation entre les niveaux de ségrégation socialeet de ségrégation scolaire de chaque département (aucun point clairement éloigné de la diagonalecentrale) : les départements dans lesquels il existe une forte ségrégation sociale sont égalementceux dans lesquels il existe une forte ségrégation scolaire. Cette corrélation peut notamments’expliquer par la corrélation qui existe entre les résultats scolaires et l’origine sociale.

124

Page 151: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

3,1 % 20,0 %

Figure 3.3 – Ségrégation scolaire inter-établissements en classe de troisième par département,mesurée par l’indice d’exposition à la rentrée 2010.

3.4 La ségrégation socialeet scolaireentre les

classesdechaqueétablissement

La dimension intra-établissement est absente de toutes les études quantitatives sur la ségré-gation sociale et scolaire en France. La première explication à cette carence est liée à l’accès auxdonnées : les bases de données généralement communiquées aux chercheurs ne contiennent ha-bituellement pas d’informations quant à la constitution des classes. Cette contrainte a pu êtrelevée grâce à un partenariat avec la Depp, que nous remercions chaleureusement pour sa coopé-ration et son accueil. La deuxième explication est plus technique : les outils classiques de mesureprésentés dans le chapitre 3.2 présentent des faiblesses lorsque les unités qui définissent l’environ-nement des individus sont de petite taille : il devient alors nécessaire d’introduire de nouvellesmanières de mesurer la ségrégation. Enfin, la très grande diversité des mécanismes susceptiblesde créer de la ségrégation entre les classes rend difficile l’analyse des données.

125

Page 152: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %5 %

10 %15 %20 %25 %30 %35 %40 %45 %50 %

Aix-Mars

eille

Amiens

Besanco

n

Bordeau

x

Caen

Clermont

-Ferra

nd

Corse

Créteil

Dijon

Grenobl

e

Guadelo

upe

Guyane

Lille

Limoge

s

Lyon

Martini

que

Montpel

lier

Nancy-M

etz

Nantes

Nice

Orléans

-Tours

Paris

Poitie

rs

Reims

Rennes

Réunion

Rouen

Strasb

ourg

Toulo

use

Versa

illes

Ségrégation socialeP , p

•Part d’élèves CSP+dans le niveau

Ségrégation socialeentre communes

Ségrégation socialeentre établissementsd’une même commune

0 %5 %

10 %15 %20 %25 %30 %

Aix-Mars

eille

Amiens

Besanco

n

Bordeau

x

Caen

Clermont

-Ferra

nd

Corse

Créteil

Dijon

Grenobl

e

Guadelo

upe

Guyane

Lille

Limoge

s

Lyon

Martini

que

Montpel

lier

Nancy-M

etz

Nantes

Nice

Orléans

-Tours

Paris

Poitie

rs

Reims

Rennes

Réunion

Rouen

Strasb

ourg

Toulo

use

Versa

illes

Ségrégation scolaireP , p

•Part des meilleursélèves dans le niveau

Ségrégation scolaireentre communes

Ségrégation scolaireentre établissementsd’une même commune

Figure 3.4 – Ségrégation scolaire entre établissements au niveau troisième par académie, mesu-rée par l’indice d’exposition à la rentrée 2010, et part expliquée par les disparités entre communesou arrondissements municipaux.Lecture : Dans l’académie d’Orléans-Tours, au niveau troisième, la ségrégation sociale entreétablissements est de 12 %, dont 6 points s’expliquent par les disparités entre communes. Dansl’académie de Versailles, la ségrégation scolaire entre établissements vaut 13 %, dont 8 pointss’expliquent par les disparités entre communes.

126

Page 153: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

5 % 10 % 15 % 20 % 25 % 30 %

5 %

10 %

15 %

20 %

0 %

•••

••

•• •

• •• •••

• ••••• •

••••

••

•• •••

••

• ••

•• •

• •

••

••

•••

••

•• •

•• •

• •

• ••

••

•• •••

••

••

• •

Ségrégation scolaire

Ségrégation sociale

Figure 3.5 – Corrélation entre la ségrégation sociale et la ségrégation scolaire dans chaque dé-partement au niveau troisième, pour l’année 2010-2011.Chaque point représente un département : son abscisse (axe horizontal) représente sa ségrégationsociale et son ordonnée (axe vertical) représente sa ségrégation scolaire, les deux étant mesuréespar l’indice d’exposition. On observe que les points sont globalement très proches de la diagonale,ce qui indique que les deux formes de ségrégation sont très corrélées.

La prise en compte de la ségrégation intra-établissement est pourtant primordiale. Pour fixerles idées, considérons deux collèges A et B, contenant chacun deux classes de mêmes tailles.Supposons que la situation initiale est très ségrégée, et que le collège A contient 80 % de CSP+alors que le collège B n’en contient que 20 %. Dans chacun des collèges, on peut imaginer quel’homogénéité des élèves n’incite pas à mettre en place une forte ségrégation entre les classes, etdonc que chaque classe contient la même part de CSP+ qu’il y en a dans le collège. Il y a donc,dans ce scénario, deux classes à 80 % de CSP+ dans le collège A, et deux classes à 20 % de CSP+dans le collège B. Imaginons alors qu’une politique très volontariste de mixité force le mélangede ces deux établissements, de sorte qu’ils contiennent chacun 50 % de CSP+. Chaque collègeaccueille un public beaucoup plus hétérogène, ce qui peut créer des tensions et une demande dedifférenciation des classes. Dans un scénario pessimiste, on pourrait ainsi aboutir à deux collègescontenant chacun une classe à 80 % de CSP+ et une classe à 20 % de CSP+.

127

Page 154: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

Si on se limite à une analyse au niveau inter-établissements, la politique de mixité donnéedans cet exemple fictif a été un franc succès, car elle a réduit la ségrégation sociale entre établis-sements à zéro. Pourtant, la ségrégation totale (inter- et intra-établissement), n’a pas varié : onretrouve bien deux classes à 80 % et deux classes à 20 % de CSP+. De plus, chaque élève devienttrès conscient qu’il appartient à la « bonne » classe ou à la « mauvaise » classe de son collège, cequi est susceptible de créer plus de tensions encore que la situation initiale. Une politique demixité sociale ne doit donc pas être pilotée sans indicateurs de mixité sociale au niveau intra-établissement.

Dans cette étude, nous commençons par mesurer le niveau de ségrégation qui estobservé lorsque l’on s’intéresse aux environnements « classe » au lieu des environnements« établissement », afin de les comparer aux valeurs obtenues dans le chapitre 3.3. Les résul-tats ainsi obtenus représentent la ségrégation totale, qui est la somme de la ségrégation inter-établissements étudiée dans le chapitre 3.3 et de la ségrégation intra-établissement. Nous montronsensuite les limites des indicateurs classiques pour étudier le phénomène de la ségrégation intra-établissement en raison de la petite taille des unités de séparation (les classes) et nous proposonsdes méthodes d’analyse supplémentaires. Nous nous intéressons enfin plus précisément au rôledes langues vivantes et des options dans la composition des classes.

3.4.1 Analysemacroscopique

La Figure 3.6 donne le niveau de ségrégation totale (ségrégations inter- et intra-établissement cumulées) à chaque niveau, dans les dimensions sociale et scolaire. Les niveauxde ségrégation inter-établissements y sont rappelés afin de distinguer les composantes inter- etintra-établissement.

La ségrégation sociale augmente de 4 à 6 points en fonction du niveau lorsque la ségrégationintra-établissement est prise en compte, pour atteindre 20 à 22 points au collège et en seconde,25 points en première et 23 points en terminale. Ainsi, un collégien CSP+ compte en moyenne 5élèves eux-mêmes CSP+ dans sa classe de plus qu’un collégien non-CSP+ (une classe de collègecomporte 25 élèves en moyenne). La proportion d’élèves CSP+ au collège étant d’environ 5 parclasses, cela signifie qu’en moyenne, les collégiens CSP+ comptent deux fois plus de camarades de

128

Page 155: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

0 %

5 %

10 %

15 %

20 %

25 %

30 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation sociale

Niveau

P , p• Part d’élèves CSP+

dans le niveau

Ségrégation socialeentre classes d’unemême filièreSégrégation socialeentre filièresd’un même établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

30 %

35 %

40 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation scolaire

Niveau

P , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classes d’unemême filièreSégrégation scolaireentre filièresd’un même établissement

Ségrégation scolaireentre établissements

Figure 3.6 – Ségrégation sociale et scolaire inter- et intra-établissement au niveau national pourchaque classe, mesurée pour la cohorte 2007 par l’indice d’exposition.Lecture : pour la cohorte d’élèves entrés en sixième en 2007, la ségrégation scolaire en première(année 2012-2013), mesurée par l’indice d’exposition, était de 20,6 % entre établissements, et30,0 % entre filières et 38,0 % entre classes. La part des meilleurs élèves y était de 22,4 %.

129

Page 156: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

classe CSP+ que les autres collégiens (non-CSP+). Il est important de noter que ce résultat n’est pasle seul fait de la composition des classes : au contraire, il s’explique à 80 % par la seule ségrégationinter-établissement. L’effet additionnel de la composition des classes sur la ségrégation socialeest donc relativement modeste si on considère ces chiffres moyens.

La ségrégation scolaire, elle, est beaucoup plus fortement portée par la dimension intra-établissement : au collège, les dimensions inter-établissements et intra-établissement ont unecontribution quasi-identique à la ségrégation totale, c’est-à-dire que les classes de niveau contri-buent autant à la ségrégation scolaire que les disparités résidentielles. Cette ségrégation augmenteprogressivement au cours de la scolarité au collège, pour atteindre 18 % en troisième 11. La conclu-sion sur la ségrégation scolaire totale au collège est ainsi identique que pour la ségrégation sociale :un très bon élève sera entouré, dans sa classe, de deux fois plus d’élèves d’un niveau équivalent au sien queles autres élèves. La structure de cette ségrégation est cependant différente, puisqu’elle résulte pour50 % de la ségrégation inter-établissements et pour 50 % de la ségrégation intra-établissement.

Au lycée, le niveau de ségrégation scolaire devient très élevé et atteint 38 % en première. Il està noter que cette très forte augmentation s’explique en grande partie par les différences de niveaudes élèves en fonction de leurs voies et séries du baccalauréat ou du CAP. En effet, la dimensionintra-établissement inclut ainsi la séparation des élèves entre les voies générale et technologiqueà partir de la première dans les lycées « GT » (généraux et technologiques), ainsi que la séparationavec les élèves de la voie professionnelle dans les lycées polyvalents. Dans tous les cas, elle inclutégalement le sectionnement des élèves en fonction de leur série du baccalauréat.

L’analyse des disparités géographiques montre que la ségrégation intra-établissement est unphénomène beaucoup moins variable d’un territoire à un autre. Cela se traduit par un plus faiblecontraste dans les cartes de la Figure 3.7 (ségrégation sociale totale) et de la Figure 3.8 (ségré-gation scolaire totale).

Précisons ce constat numériquement en analysant la variabilité de la ségrégation intra-établissement entre les académies. On obtient la ségrégation intra-établissement de chaque

11. Rappelons que la valeur de l’indice de ségrégation scolaire est également mesurée plus précisément en troi-sième que dans les autres classes.

130

Page 157: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

académie en soustrayant aux chiffres de la ségrégation totale ceux de la ségrégation inter-établissements : cela correspond à la zone la plus foncée de chaque graphe sur la Figure 3.9.On constate tout d’abord que les académies d’outre-mer se caractérisent par une ségrégationscolaire intra-établissement beaucoup plus forte que les académies métropolitaines.

En se restreignant aux académies métropolitaines, la ségrégation sociale inter-établissementsvaut en moyenne 14,1 % avec un écart-type entre les académies de 4,8 points, et la ségréga-tion scolaire inter-établissements vaut 8,7 % avec un écart-type de 3,2 points : il existe doncdes disparités importantes entre les académies sur le plan de la ségrégation inter-établissement.Dans la dimension intra-établissement, la valeur moyenne de la ségrégation sociale d’une aca-démie est plus faible (4,5 %), et son écart-type qui n’est que de 0,6 points. La ségrégation sco-laire intra-établissement reste élevée (8,9 % en moyenne interacadémique), mais son écart-typen’est que d’1,1 point. Ainsi, l ’ensemble des académies métropolitaines se caractérisent par une ségré-gation intra-établissement modeste dans la dimension sociale et aussi importante que la ségrégationinter-établissements dans la dimension scolaire. Dans les académies ultramarines, la ségrégationscolaire intra-établissement dépasse même la ségrégation scolaire inter-établissements.

3.4.2 Mieuxmesurerlaségrégationintra-établissement

Les valeurs de ségrégation intra-établissement présentées dans la section précédente doiventêtre interprétées avec précaution. Lorsque les unités qui définissent l’environnement des élèvessont de petite taille (ici, les classes comportent en général moins de 30 élèves), des écarts d’unou deux élèves ont un effet sur les indicateurs de plusieurs points de pourcentage. Dès lors,une ségrégation intra-établissement de 5 % – l’ordre de grandeur de la ségrégation sociale intra-établissement – ne doit pas être interprétée comme le résultat d’une politique d’établissementqui recherche activement à ségréger.

Un chef d’établissement qui ne chercherait pas spécialement à faire des classes ségrégées, parexemple en les constituant totalement aléatoirement, pourrait aboutir à une ségrégation intra-établissement du même ordre de grandeur. Même en essayant de faire moins ségrégé que l’aléa-toire, il serait difficile (ou impossible) d’obtenir des classes parfaitement équilibrées, surtout sion cherche à équilibrer selon plusieurs dimensions (sociale, scolaire, mixité de genre, d’origine

131

Page 158: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

5,6 % 27,3 %

Figure 3.7 – Ségrégation sociale totale (inter- et intra-établissements) en classe de troisièmepar département, mesurée par l’indice d’exposition à la rentrée 2010.

ethnique, etc.) : une ségrégation résiduelle non négligeable apparaîtra tout simplement à causedes arrondis qu’il aura fallu effectuer, un élève ne pouvant bien entendu pas être divisé entreplusieurs classes !

Pour confirmer cette intuition, nous avons simulé des constitutions de classe aléatoires, entirant au sort, à cent reprises, la classe de chaque élève dans son collège. Nous nous limitons aucollège à ce stade car il s’agit des niveaux où la marge de manœuvre est plus grande : au lycée, lesvoies et les séries limitent les possibilités de « mélanger » les classes des élèves.

Pour chaque collège et chaque niveau, nous obtenons ainsi autant d’indices de ségréga-tion sociale et scolaire intra-établissement que de simulations. La ségrégation sociale intra-établissement, d’une valeur réelle en troisième de 5,0 % en moyenne, atteint 3,1 % en moyennesur cent simulations. La ségrégation scolaire, qui vaut 9,6 % en réalité, n’atteint que 3,2 % dans

132

Page 159: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

8,3 % 27,1 %

Figure 3.8 – Ségrégation scolaire totale (inter- et intra-établissements) en classe de troisièmepar département, mesurée par l’indice d’exposition à la rentrée 2010.

les simulations. Ainsi, si la ségrégation effectivement mesurée dépasse celle qui découlerait d’unerépartition aléatoire des élèves, il reste difficile d’interpréter le niveau réel comme faible ou élevé.

Pour ce faire, nous reproduisons ici à l’échelle nationale le travail que nous avons effectuésur la région Île-de-France (Ly et al., 2014), qui consiste à comparer le degré de ségrégation dechaque collège à la distribution des indices de ségrégations obtenus dans les simulations 12. Pourun établissement donné, si moins de 10 % des simulations aboutissent à un niveau de ségrégationau moins égal au niveau réel, on conclut que cet établissement exerce une ségrégation « active »,qui va au-delà du hasard.

Selon ce critère, en classe de troisième par exemple, on observe une ségrégation sociale allant

12. Carrington and Troske (1997) utilisent une approche similaire pour définir des indices de ségrégation« corrigés », que nous n’utilisons pas dans cette étude. Selon Rathelot (2012), les indices ainsi définis sont sous-estimés.

133

Page 160: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %5 %

10 %15 %20 %25 %30 %35 %40 %45 %50 %

Aix-Mars

eille

Amiens

Besanco

n

Bordeau

x

Caen

Clermont

-Ferra

nd

Corse

Créteil

Dijon

Grenobl

e

Guadelo

upe

Guyane

Lille

Limoge

s

Lyon

Martini

que

Montpel

lier

Nancy-M

etz

Nantes

Nice

Orléans

-Tours

Paris

Poitie

rs

Reims

Rennes

Réunion

Rouen

Strasb

ourg

Toulo

use

Versa

illes

Ségrégation socialeP , p

•Part d’élèves CSP+dans le niveau

Ségrégation socialeentre établissements

Ségrégation socialeentre classes d’unmême établissement

0 %5 %

10 %15 %20 %25 %30 %

Aix-Mars

eille

Amiens

Besanco

n

Bordeau

x

Caen

Clermont

-Ferra

nd

Corse

Créteil

Dijon

Grenobl

e

Guadelo

upe

Guyane

Lille

Limoge

s

Lyon

Martini

que

Montpel

lier

Nancy-M

etz

Nantes

Nice

Orléans

-Tours

Paris

Poitie

rs

Reims

Rennes

Réunion

Rouen

Strasb

ourg

Toulo

use

Versa

illes

Ségrégation scolaireP , p

•Part des meilleursélèves dans le niveau

Ségrégation scolaireentre établissements

Ségrégation scolaireentre classes d’unmême établissement

Figure 3.9 – Ségrégation scolaire entre classes au niveau troisième par académie, mesurée parl’indice d’exposition à la rentrée 2010, et part expliquée par les disparités entre établissements.Lecture : Dans l’académie d’Orléans-Tours, au niveau troisième, la ségrégation sociale entreclasses est de 16 %, dont 12 points s’expliquent par les disparités entre établissements. Dansl’académie de Versailles, la ségrégation scolaire entre communes vaut 23 %, dont 13 points s’ex-pliquent par les disparités entre établissements.

134

Page 161: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

au-delà du hasard dans 25 % des collèges, et une ségrégation scolaire plus élevée que le hasarddans 45 % des collèges. Il faut bien noter qu’une ségrégation « active » selon notre critère n’est pasnécessairement « élevée » : ce critère signifie simplement qu’on ne peut pas expliquer les disparitésentre classes uniquement par le hasard de la composition des classes. Il est alors important d’ana-lyser également le chiffre brut de la ségrégation intra-établissement et de discuter son ampleur.Ainsi, en troisième, les 25 % de collèges qui exercent une ségrégation sociale qui dépasse l’aléa-toire ont une ségrégation intra-établissement moyenne de 9 %, un chiffre équivalent à la moitiéde la ségrégation inter-établissements à ce niveau. Toujours en troisième, les 45 % de collègesqui exercent une ségrégation scolaire « active » ont une ségrégation intra-établissement moyennede 14 %, soit une fois et demie la ségrégation inter-établissements à ce niveau.

Une technique supplémentaire consiste à regarder, au lieu de l’indice d’exposition, la com-position de la « meilleure classe » qui résulte de chaque allocation aléatoire des élèves. On peutalors comparer cette composition à celle de la « vraie » meilleure classe de chaque collège. Cetteméthode permettrait de détecter certains établissements qui veilleraient à bien équilibrer la ma-jorité des classes, à l’exception d’une classe très favorisée. Pour cela, nous calculons pour chaquesimulation la part d’élèves « privilégiés » (CSP+ ou meilleurs élèves) dans la classe qui en contientle plus. Nous mesurons ensuite la part d’élèves privilégiés dans la classe réelle qui en contient leplus, et nous comparons cette valeur réelle aux valeurs aléatoires. Là encore, si la valeur réellen’est dépassée que par 10 % ou moins des valeurs obtenues par les simulations, on considère quel’établissement a activement ségrégé les élèves en créant une classe nettement plus favorisée queles autres.

Ce deuxième critère fournit des résultats semblables au premier, que nous ne détaillons pas ici.Plus de 80 % des établissements « activement ségrégés » selon l’un des critères le sont égalementselon l’autre critère.

Les deux méthodes proposées ici sont des premières pistes pour analyser la ségrégation intra-établissement ; nous souhaitons en proposer d’autres et nous invitons les chercheurs, décideurset acteurs de terrain à participer à cette réflexion.

135

Page 162: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

3.4.3 Lerôledeslanguesetdesoptions

Les langues vivantes et les options sont souvent vues, dans le débat public, comme des ou-tils permettant de ségréger les classes. Elles seraient utilisées par les familles pour accéder aux« meilleures classes », et par les chefs d’établissement pour éviter la fuite des classes moyennes etsupérieures vers les établissements concurrents, en particulier les établissements privés dans lesquartiers populaires (Baluteau, 2013).

Nous nous intéressons dans cette étude à trois options réputées élitistes que sont le parcoursbilangues en sixième et cinquième, l’option latin à partir de la cinquième et la section européenneà partir de la quatrième. Nous nous limitons, pour chaque option, au niveau à partir duquel elleapparait. Dans cette partie, qui ne porte que sur le collège, nous étudierons la cohorte d’élèvesentrés en sixième en 2010 et non en 2007 comme dans le reste de l’étude 13. Il est en effet im-portant d’utiliser des données aussi récentes que possible, car la place des options a fortementévolué au cours des dernières années, en raison de l’assouplissement de la carte scolaire en 2007,mais aussi d’évolutions tendancielles de disponibilité et de popularité des différentes options.Par exemple, depuis le début des années 2000, les données à notre disposition montrent queles parcours bilangues et les sections européennes ont progressé fortement mais régulièrement– sans accélération après l’assouplissement de la carte scolaire. Alors que ces deux options neconcernaient que 2 % des élèves de sixième et quatrième à la rentrée 2001, les parcours bilanguesétaient choisis par 16 % des élèves de sixième et les sections européennes par 11 % des élèvesde quatrième à la rentrée 2014. Dans le même temps, l’option latin en cinquième a légèrementdécliné, de 22 % à 20 %.

3.4.3.1 Leparcoursbilangues

À la rentrée 2010, 13 % des élèves de sixième étudiaient l’anglais et une deuxième languevivante, l’allemand dans 72 % des cas 14. Parmi l’ensemble des germanistes, 82 % appartenaient

13. Dans le reste de l’étude, nous avons choisi la cohorte 2007 car il s’agit de la dernière cohorte étant sortie dulycée pour laquelle nous disposons des données nécessaires à ce jour.

14. Nous excluons du cadre de cette étude les langues régionales, qui ne sont choisies que par 1 % des élèves.L’apprentissage du corse est quasi-généralisé en Corse, ce qui n’en fait pas un outil de ségrégation. Les deux autreslangues régionales les plus enseignées sont le breton et l’occitan ; de manière général, nous n’observons pas un fortmarquage social ou scolaire lié à l’apprentissage d’une langue régionale.

136

Page 163: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

à une classe bilangues.

Cette option est marquée socialement (33 % des élèves concernés sont CSP+, alors que ceux-ci représentent 22 % des élèves de sixième) et surtout scolairement : 38 % des élèves des classesbilangues font partie de la catégorie des meilleurs élèves, qui ne représente que 20 % des élèvesde sixième.

Le parcours bilangues est disponible dans 53 % des collèges, soit 3 707 établissements. Cetteproportion augmente régulièrement depuis le début des années 2000. Elle est fortement variabled’une académie à l’autre, allant de 23 % dans l’académie de Lille 15 jusqu’à 99 % dans l’académiede Strasbourg (où l’apprentissage de l’allemand est prépondérant).

Cette valeur intermédiaire fait du parcours bilangues un outil de différentiation qualitatifentre établissements. Cette différentiation ne se traduit cependant pas par des écarts importants entermes de composition sociale et scolaire entre les établissement proposant des parcours bilangueet les autres : en moyenne, la part d’élèves CSP+ ou la part d’élèves parmi les meilleurs ne diffèrepas de plus de 2 % entre ces deux catégories d’établissements. Ce faible écart n’exclue pas que lesoptions jouent un rôle important dans la ségrégation entre établissements (voir la conclusion decette section).

Nous nous concentrons dans cette étude au parcours bilangues comme outil de ségrégationentre les classes de chaque établissement. Au sein des établissements proposant un parcours bi-langues, seules 42 % des classes contiennent des élèves ayant suivi un parcours bilangues. Lesparcours bilangues génèrent donc une dichotomie à la fois entre les établissements et entre lesclasses des établissements, dans la mesure où ils existent dans environ la moitié des établisse-ments, puis dans environ la moitié des classes de ces établissements. Parmi les établissementproposant un parcours bilangue, seuls 13 % ont réparti les élèves suivant ces parcours entre l’en-semble des classes de sixième. À l’inverse, 45 % les ont regroupés dans le minimum de classespossible 16.

15. Nous excluons la Corse où la très grande majorité des élèves apprend le corse, et Mayotte où aucun élèven’est inscrit en parcours bilangues d’après les données dont nous disposons.

16. Dans deux-tiers des cas, il s’agit d’une seule classe.

137

Page 164: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

Une nuance peut être apportée à ce constat : le terme couramment utilisé de « classe bi-langues » peut prêter à confusion. S’il existe souvent, au sein des établissement, des classes pro-posant le parcours bilangues et d’autres ne la proposant pas, il est rare que tous les élèves de cesclasses suivent un tel parcours. Seules 16 % de ces classes comptent plus de 80 % d’élèves suivantun parcours bilangues : les classes dites « bilangues » sont plus souvent des classes « à sectionbilangues », qui contiennent en moyenne 52 % d’élèves suivant un tel parcours.

Du fait du marquage social et scolaire des parcours bilangues, les classes à section bilanguessont sensiblement plus favorisées socialement (25 % de CSP+) et scolairement (26 % de la ca-tégorie des meilleurs élèves) que les classes sans section bilangues des mêmes établissements(19 % et 16 %, respectivement). Ces écarts représentent environ un écart-type de la distributionintra-établissement des environnements de classe.

3.4.3.2 L’optionlatin

L’option latin est proposée dans la très grande majorité des collèges en classe de cinquième(6 509 établissements à la rentrée 2011, soit 93 %) ; elle n’est cependant choisie que par 21 % desélèves. Cette option est très fortement marquée socialement et scolairement : 37 % des latinistessont des CSP+ (qui représentent 23 % des élèves de cinquième) et 44 % font partie des meilleursélèves (21 % des élèves de cinquième).

Cette disponibilité quasi-générale de l’option latin n’en fait pas un fort outil de différenciationet de ségrégation entre établissements. Au sein des établissements qui proposent cette option, 58 %des classes contiennent des élèves latinistes. Il s’agit donc d’un facteur de différenciation desclasses.

Cependant, contrairement à l’option bilangues, les élèves latinistes sont, le plus souvent, par-tiellement répartis entre les classes : on ne compte que 18 % des établissements qui les regroupentdans le moins de classes possible. Dans 23 % des cas, ils sont même répartis entre toutes lesclasses de cinquième. Il est par ailleurs très rare de trouver des classes de cinquième comportantune majorité d’élèves latinistes : seules 3 % des classes latinistes le sont à plus de 80 %.

138

Page 165: Inégalités scolaires, ségrégation et effets de pairs

3.4. La ségrégation sociale et scolaire entre les classes de chaque établissement

Ces différences suffisent pourtant à générer des différences sociales et scolaires nettes entreles classes proposant l’option latin et celles ne la proposant pas. Au sein des établissements quiproposent l’option latin, les classes latinistes comptent 26 % d’élèves CSP+ et 26 % d’élèves parmiles meilleurs, alors que les autres en comptent respectivement 17 % et 15 %, soit une segmenta-tion comparable à celle observé entre les classes à section bilangue et les autres en sixième.

3.4.3.3 Lessectionseuropéennes

À la rentrée 2012, 11 % des élèves de quatrième étaient inscrits dans une section européenne.Cette option consiste à suivre un certains cours du tronc commun dans une langue étrangère, leplus souvent l’anglais 17. Il s’agit là aussi d’une option très marquée socialement et scolairement :40 % des élèves de section européenne sont CSP+ (contre 23 % parmi l’ensemble des élèves dequatrième) et 49 % font partie des meilleurs élèves (25 % de l’ensemble des quatrièmes).

Cette option n’est proposée que dans 44 % des collèges (3 100 établissements), ce qui enfait un facteur de différenciation qualitative entre établissements. À quelques exceptions près,cette proportion varie assez peu entre les académies. Il y a donc une offre scolaire relativementhomogène sur le territoire pour cette option, et donc un potentiel quasi-généralisé de concur-rence locale entre établissements. Comme pour les classes bilangues, cette différenciation n’estcependant pas associée à des différences très importantes de composition scolaire entre les éta-blissements à section européenne et les autres.

Au sein des établissements proposant cette option, seule une classe sur deux contient unesection europénne, ce qui en fait également un outil de ségrégation intra-établissement. 26 %des collèges regroupent les élèves de section européenne dans le minimum de classes et 15 % descollèges les répartissent entre toutes les classes de quatrième. Pour autant, seules 3 % des classesà section européennes contiennent plus de 80 % d’élèves suivant cette option.

Ces regroupements conduisent à une hiérarchie sociale et scolaire dans les établissementsproposant l’option européenne, entre les classes à section européenne d’une part (26 % de CSP+,

17. Parmi les élèves inscrit en section européenne, 65 % la suivent en anglais, 15 % en espagnol, 14 % en allemand,4 % en italien, les 5 % restants sont répartis entre des langues plus rares.

139

Page 166: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

26 % d’élèves parmi les meilleurs) et les autres classes (respectivement 17 % et 15 %). On retrouvedes différences d’un ordre de grandeur comparable – et même légèrement supérieur – à cellesobservées en sixième et cinquième avec les parcours bilangues et l’option latin.

3.4.3.4 Conclusion

L’analyse statistique présentée ici montre que les langues et les cours optionnels sont un ou-til très important de différenciation entre établissements (à l’exception du latin qui est presquesystématiquement proposé) et surtout entre classes, et confirment les études qualitatives sur lesujet (Baluteau, 2013). Les faibles écarts de composition sociale et scolaire entre les établisse-ments proposant les parcours bilangues ou les sections européennes ne contredisent pas le carac-tère différenciant de ces options. Comme le remarquait Baluteau (2013), on trouve souvent uneabondance de cours optionnels dans les établissements les plus privilégiés, mais également dansdes établissements moins favorisés et en situation de forte concurrence, qui cherchent à retenirun public plus aisé.

Au sein des établissements proposant une de ces options, on distingue trois cas de figures.Une minorité d’établissements regroupe les élèves choisissant ces options réputées élitistes dansune seule ou deux classes, qui sont bien souvent les classes les plus favorisées socialement et sco-lairement. À l’inverse, certains établissements, également minoritaires, font l’effort de répartirles élèves entre toutes les classes, ce qui contribue à l’équilibre entre celles-ci. Entre ces deuxscénarios, la majorité des établissements effectue un regroupement partiel, créant des sectionsau sein de chaque classe correspondant aux différentes options, mais dans quelques classes seule-ment. Quelles que soient les motivations derrière ces pratiques (contraintes d’emploi du tempsou désir réel de construire des classes spécialisées), elles conduisent à une hiérarchie sociale etscolaire où les élèves sont en mesure de reconnaître les classes privilégiées des autres classes.

Ce constat pose la question de l’opportunité du maintien d’un large catalogue d’options aucollège, du moins dans leur forme actuelle. Si l’on peut souhaiter l’existence d’une certaine libertéde choix dans les cours suivis par les élèves, le caractère optionnel de cette offre, sa disponibilitévariable entre et au sein des territoires, et le fait qu’elle structure la composition des établisse-ments et des classes favorisent les pratiques ségrégatives. À l’inverse, il n’est pas certain que la

140

Page 167: Inégalités scolaires, ségrégation et effets de pairs

3.5. Évolution de la ségrégation

suppression pure et simple d’un certain nombre d’options soit une mesure suffisante pour limiterla ségrégation sociale et scolaire dans les établissements, celle-ci pouvant réapparaître à termesous d’autres formes. Surtout, cette suppression pourrait accentuer la ségrégation territoriale, sielle augmente la propension des familles les plus aisées (ou les moins défavorisés) d’un territoireà migrer vers des zones toujours plus favorisées (selon le mécanisme de séparatisme social décritpar Maurin, 2004).

3.5 Évolutiondelaségrégation

Les chiffres présentés jusqu’ici concernent uniquement la cohorte d’élèves entrés en sixièmeen 2007. Nous nous intéressons dans cette partie à l’évolution de ces chiffres sur une périodede neuf ans 18. Nous avons choisi de nous concentrer sur les classes de sixème (Figure 3.10),troisième (Figure 3.11) et seconde (Figure 3.12). Pour chacune de ces classes, nous indiquonsla valeur de la ségrégation sociale et scolaire entre établissements et entre classes d’un mêmeétablissement, pour les cohortes d’élèves ayant passé le DNB entre 2006 et 2014.

La comparaison d’indices de ségrégation entre des territoires ou des périodes différentesest délicate. Une valeur de l’indice de ségrégation n’a pas la même signification en termes d’in-teractions potentielles des élèves en fonction du contexte et notamment de la part du groupe deréférence dans la population (voir annexe 3.A.2). Pour cette raison, nous indiquons systématique-ment la proportion du groupe de référence dans l’échantillon dont nous mesurons la ségrégationsociale ou scolaire.

Dans cette section, nous avons cherché à déterminer le sens de l’évolution de la ségrégationsociale et scolaire sur une période de 9 années. Il s’agit de déterminer si les variations de l’indicede ségrégation observées d’une année sur l’autre reflètent une réelle tendance à la hausse ouà la baisse, ou simplement des écarts statistiques autour d’une tendance stable. Pour cela, nousavons calculé l’évolution moyenne de chaque indice de ségrégation, et nous l’avons comparée avecl’« erreur-type » de ces indices, c’est-à-dire la précision avec laquelle ces indices sont mesurés 19.

18. Nous disposons des résultats au DNB entre 2006 et 2014, nous mesurons donc l’évolution de la ségrégationsur les cohortes d’élèves ayant passé le DNB l’une de ces années.

19. Pour mesurer l’erreur-type des indices de ségrégation, nous avons effectué 25 ré-échantillonnages avec remise

141

Page 168: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %

5 %

10 %

15 %

20 %

25 %

2002 2003 2004 2005 2006 2007 2008 2009 2010

• • • • • • • • •

Ségrégation sociale

Année

P , p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre classesd’un même établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

2002 2003 2004 2005 2006 2007 2008 2009 2010

• • • • • • • • •

Ségrégation scolaire

Année

P , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classesd’un même établissement

Ségrégation scolaireentre établissements

Figure 3.10 – Évolution de la ségrégation sociale et scolaire au niveau national en sixième entre2002 et 2010, mesurée par l’indice d’exposition.Lecture : en 2006, la ségrégation scolaire en sixième, mesurée par l’indice d’exposition, était de7,8 % entre établissements, et 13,5 % entre classes. La part des meilleurs élèves y était de 19,3 %.

142

Page 169: Inégalités scolaires, ségrégation et effets de pairs

3.5. Évolution de la ségrégation

0 %

5 %

10 %

15 %

20 %

25 %

2005 2006 2007 2008 2009 2010 2011 2012 2013

• • • • • • • • •

Ségrégation sociale

Année

P , p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre classesd’un même établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

2005 2006 2007 2008 2009 2010 2011 2012 2013

• • • • • • • • •

Ségrégation scolaire

Année

P , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classesd’un même établissement

Ségrégation scolaireentre établissements

Figure 3.11 – Évolution de la ségrégation sociale et scolaire au niveau national en troisièmeentre 2005 et 2013, mesurée par l’indice d’exposition.Lecture : en 2009, la ségrégation sociale en troisième, mesurée par l’indice d’exposition, étaitde 17,1 % entre établissements, et 21,4 % entre classes. La part des meilleurs élèves y était de22,4 %.

143

Page 170: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %

5 %

10 %

15 %

20 %

25 %

2006 2007 2008 2009 2010 2011 2012 2013 2014

• • • • • • • • •

Ségrégation sociale

Année

P , p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre classesd’un même établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

30 %

35 %

2006 2007 2008 2009 2010 2011 2012 2013 2014

• • • • • • • • •

Ségrégation scolaire

Année

P , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classesd’un même établissement

Ségrégation scolaireentre établissements

Figure 3.12 – Évolution de la ségrégation sociale et scolaire au niveau national en seconde entre2006 et 2014, mesurée par l’indice d’exposition.Lecture : en 2010, la ségrégation scolaire en seconde, mesurée par l’indice d’exposition, était de18,7 % entre établissements, et 28,2 % entre classes. La part des meilleurs élèves y était de 20,8 %.

144

Page 171: Inégalités scolaires, ségrégation et effets de pairs

3.5. Évolution de la ségrégation

Nos résultats indiquent tout d’abord une stabilité de la ségrégation sociale au niveau national.Les indices de ségrégation sociale entre établissements et au sein de ceux-ci varient très peu d’uneannée sur l’autre ; les variations annuelles sont comparables à l’erreur-type des indices et il ne sedégage pas de tendance à la hausse ou à la baisse. Il faut noter que cette stabilité ne concerneque les chiffres agrégés au niveau national. Suite à l’assouplissement de la carte scolaire en 2007,plusieurs études ont observé une hausse de la ségrégation entre établissements dans certainesagglomérations (Merle, 2010 ; Ben Ayed et al., 2013). Ces hausses locales sont compensées pardes diminutions de la ségrégation sur d’autres territoires, ce qui a pour effet de maintenir à unniveau stable la valeur de la ségrégation au niveau national, un résultat conforme à ceux de Fackand Grenet (2012).

En ce qui concerne la ségrégation scolaire, nous observons une diminution sensible et régu-lière de l’indice d’exposition au cours de la période étudiée. À l’exception de la terminale, cettebaisse a lieu à tous les niveaux de l’enseignement secondaire, et elle est particulièrement pro-noncée au collège, où l’indice de ségrégation diminue de 2 à 3 % par an. Cette baisse s’expliqueà la fois par une diminution de la ségrégation entre établissements et de la ségrégation entreclasses d’un même établissement, avec cependant une contribution plus forte de la dimensioninter-établissements. Là encore, cette diminution de la ségrégation au niveau national masquedes disparités locales : à Paris par exemple, Fack et al. (2014) ont observé une hausse de la sé-grégation scolaire après 2008, notamment en raison du poids important donné aux notes dansle barème d’Affelnet, le logiciel d’affectation des élèves à l’entrée au lycée.

Les explications possibles à cette baisse sont multiples : assouplissement de la carte scolaire,procédures d’affectation des élèves, modification de l’offre scolaire et de l’allocation des moyensaux établissements, etc. Ces explications peuvent se combiner différemment en fonction des terri-toires, et il sera nécessaire de procéder à des analyses plus fines, au niveau local, pour comprendreleurs rôles respectifs, ce qui est hors du cadre de cette étude.

Ainsi, nous constatons au niveau national une diminution tendancielle de la ségrégationscolaire à tous les niveaux de la scolarité, qui ne s’accompagne pas d’une baisse de la ségrégation(bootstrap), mesuré l’indice de ségrégation pour chaque ré-échantillonnage et calculé l’écart-type de cette distribu-tion.

145

Page 172: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

sociale. Cette diminution au niveau national masque de fortes disparités locales qui doivent êtreanalysées plus finement.

Conclusion

Cette étude dresse un panorama complet de la ségrégation sociale et scolaire entre les établis-sements scolaires français et entre les classes de ces établissements, de la sixième à la terminale.Elle est la première à apporter des éléments quantitatifs sur toutes ces dimensions. Elle fait leconstat d’une ségrégation sociale importante qui est en grande partie le reflet de la ségrégationrésidentielle, au collège comme au lycée. La ségrégation scolaire, deux fois plus forte au lycéequ’au collège, s’explique autant par la ségrégation résidentielle que par les inégalités générées parles compositions de classes.

Alors qu’en l’absence de ségrégation, chaque collégien compterait 22 % d’élèves CSP+ dansson collège, les élèves eux-même CSP+ en comptent 34 % et les autres seulement 18 %. Demême, si on considère les meilleurs élèves (tels que repérés par le diplôme national du brevet),ils représenteraient 22 % de chaque classe en l’absence de ségrégation au collège : en réalité, lesmeilleurs élèves en comptent en moyenne 36 % dans leur classe, et les autres seulement 18 %. Cetécart de 18 points double en classe de première, une augmentation qui s’explique essentiellementpar l’orientation.

Ces moyennes nationales cachent d’importantes disparités. On compte tout d’abord uneminorité d’établissements dont les classes aisées sont presque absentes (5 % des collèges comptent3 % ou moins d’élèves CSP+) et à l’inverse 5 % d’établissements privilégiés où leur proportiondépasse le triple de la moyenne nationale. Un constat équivalent est fait en termes de ségrégationscolaire.

La ségrégation entre établissements est un phénomène prédominant en zones urbaines. Eneffet, les établissements des zones rurales recrutent sur un rayon plus important, ce qui contribueà créer de la mixité sociale et scolaire. La ségrégation entre classes au sein des établissementsest, elle, un phénomène plus universel : on observe très peu de variations de son intensité entre

146

Page 173: Inégalités scolaires, ségrégation et effets de pairs

3.6. Bibliographie

académies, à l’exception notable des académies ultramarines où elle prend des valeurs très élevées.

Les explications de la ségrégation entre classes d’un même établissement sont variées. Ilfaut tout d’abord noter qu’au collège, 75 % de la ségrégation sociale et 55 % de la ségrégationscolaire s’explique simplement par le hasard : constituer les classes aléatoirement mène en effetà des niveaux de ségrégation comparables à ceux observés. À l’inverse, on identifie donc 25 % à45 % d’établissements dont la politique de composition des classes ségrège activement les élèves.Cette ségrégation « active » est en partie le resultat de l’affectation des élèves à leurs classes enfonction de leurs options, comme le parcours bilangues en sixième-cinquième, le latin à partir dela cinquième ou la section européenne à partir de la quatrième. Ces options ne sont pas proposéesde manière homogène dans tous les territoires, et donnent lieu à un regroupement partiel desélèves par classes au sein des établissements, ce qui génère une hiérarchie sociale et scolaire entreces classes.

Les facteurs de ségrégation sociale et scolaire sont multiples et complexes. Nous avons pointéici certains des paramètres qui la structurent. Il ne suffirait cependant pas de s’attaquer à ces pa-ramètres structurels pour effacer durablement la ségrégation, qui est une conséquence inévitabled’un système scolaire compétitif.

3.6 Bibliographie

Baluteau, F. (2013). Enseignements au collège et ségrégation sociale. Académia, Louvain-la-Neuve(Belgique).

Bell, W. (1954). A probability model for the measurement of ecological segregation. SocialForces, 32 :357–364.

Ben Ayed, C., Broccolichi, S., and Monfroy, B. (2013). Quels impacts de l’assouplissement de lacarte scolaire sur la ségrégation sociale au collège ? tendances nationales et déclinaisons localescontrastées. Éducation & formations, (83) :39–57.

147

Page 174: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

Carrington, W. J. and Troske, K. R. (1997). On measuring segregation in samples with smallunits. The Journal of Business and Economic Statistics, 15(4) :402–409.

Coleman, J., Hoffer, T., and Kilgore, S. (1982). Achievement and segregation in secondaryschools : A further look at public and private school differences. Sociology of Education,55(2) :162–182.

Duncan, O. D. and Duncan, B. (1955). A methodological analysis of segregation indexes. Ame-rican Sociological Review, 20(2) :210–217.

Duru-Bellat, M. and Mingat, A. (1997). La constitution de classes de niveau dans les collèges ;les effets pervers d’une pratique à visée égalisatrice. Revue française de sociologie, 38(4) :759–789.

Fack, G. and Grenet, J. (2012). Rapport d’évaluation de l’assouplissement de la carte scolaire.Technical report, École d’économie de Paris et Cepremap.

Fack, G., Grenet, J., and Benhenda, A. (2014). L’impact des procédures de sectorisation etd’affectation sur la mixité sociale et scolaire dans les lycées d’île-de-france. Technical Report 3,Institut des politiques publiques.

Felouzis, G. (2003). La ségrégation ethnique au collège et ses conséquences. Revue française desociologie, 44(3) :413–447.

Frankel, D. M. and Volij, O. (2011). Measuring school segregation. Journal of Economic Theory,146(1) :1–38.

Le Donné, N. and Rocher, T. (2010). Une meilleure mesure du contexte socio-éducatif desélèves et des écoles. Éducation & formations, 79 :103–115.

Ly, S. T., Maurin, É., and Riegert, A. (2014). La mixité sociale et scolaire en île-de-france : lerôle des établissements. Technical Report 4, Institut des politiques publiques.

Ly, S. T. and Riegert, A. (2015). Measuring social environment mobility. Document de travailG2015/04, Institut national de la statistique et des études économiques.

Massey, D. S. and Denton, N. A. (1988). The dimensions of residential segregation. SocialForces, 67(2) :281–315.

148

Page 175: Inégalités scolaires, ségrégation et effets de pairs

3.A. Les indices de ségrégation

Maurin, É. (2004). Le ghetto français : enquête sur le séparatisme social. La république des idées.Seuil.

Merle, P. (2010). Structure et dynamique de la ségrégation sociale dans les collèges parisiens.Revue française de pédagogie, 1(170) :73–85.

Monso, O., Givord, P., Guillerm, M., Murat, F., and Afsa, C. (2015). Quels outils pour mesurerla ségrégation dans le système éducatif ? une application à la composition sociale des collègesfrançais. Présentation aux Journées de Méthodologie Statistique.

Rathelot, R. (2012). Measuring segregation when units are small : A parametric approach.Journal of Business & Economic Statistics, 30(4) :546–553.

Reardon, S. F. and O’Sullivan, D. (2004). Measures of spatial segregation. Sociological methodo-logy, 34(1) :121–162.

Thaurel-Richard, M. and Murat, F. (2013). Évolution des caractéristiques des collèges durantla mise en œuvre de l’assouplissement de la carte scolaire de 2007. Éducation & formations,(83) :11–23.

Theil, H. (1972). Statistical Decomposition Analysis. North Holland.

3.A Lesindicesdeségrégation

3.A.1 Définitions

La littérature en économie et sociologie utilise plusieurs indices de ségrégation. Nous rappe-lons ici la définition des trois indices les plus fréquement utilisés. Nous en donnons les définitionsmathématiques ainsi que les interprétations simples, lorsqu’elles existent.

Nous introduisons tout d’abord les notations suivantes :— On note N la taille de la population et on note les élèves i ∈ 1, . . . , N.— On considère un découpage de la population en deux groupes notés A et B. Le groupe

A est le groupe dit « de référence » et le groupe B contient le reste de la population. Onappelle p la proportion du groupe A dans la population.

149

Page 176: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

— On considère par ailleurs un découpage en « environnements fréquentés » à K unités (parexemple, K écoles ou K classes), chaque unité étant repéré par la lettre k ∈ 1, . . . , K.

— On note Nk la taille de l’unité k et pk la proportion d’élèves du groupe A dans cette unité.— On note µi l’exposition de l ’élève i au groupe A, c’est-à-dire la proportion d’élèves du groupe

A dans l’unité fréquentée par l’élève i. Ainsi, si l’élève i appartient à l’unité k, µi = pk.Selon ces notations, la moyenne des pk pondérée par les tailles Nk et la moyenne de µi sur lapopulation sont toutes deux égales à p : l’exposition moyenne au groupe de référence est égale àla part de ce groupe dans la population.

Définition 5 (Indice d’exposition) L’indice d’exposition, défini par Bell (1954), a la formule sui-vante :

P =1

p(1− p)

K∑k=1

Nk

N(pk − p)2 =

1

p(1− p)· 1

N

N∑i=1

(µi − p)2 (3.1)

La définition est proche de celle de l’indice de dissimilarité, en utilisant des écarts quadratiquesau lieu des écarts absolus. Il peut être interprété de deux manières.

— Tout d’abord, on peut le voir comme une part de variance expliquée (un «R2 ») par lesdécoupages des environnements fréquentés : il indique dans quelle mesure la variancede la variable d’appartenance au groupe de référence est expliquée par les classes ou lesécoles. En ce sens, il a l’avantage d’être décomposable : lorsqu’on calcule la ségrégationentre classes, le résultat peut être écrit comme la somme d’un terme inter-établissementset d’un terme intra-établissement, ce qui sera très utile dans notre analyse. Le seul autreindice vérifiant cette propriété est l’indice d’entropie H , qui a cependant le défaut de nepas avoir d’interprétation simple.

— On peut également voir l’indice d’exposition P comme l ’écart d’exposition au groupe Aentre le groupe A et le groupe B. En effet, si on note µA l’exposition moyenne des élèves dugroupe A aux élèves de ce même groupe, et µB l’exposition des autres élèves (groupe B)au groupe A, on peut alors écrire :

P = µA − µB (3.2)

Définition 6 (Indice de dissimilarité) L’indice de dissimilarité, introduit par Duncan and Dun-

150

Page 177: Inégalités scolaires, ségrégation et effets de pairs

3.A. Les indices de ségrégation

can (1955), est défini par la formule :

D =1

2p(1− p)

K∑k=1

Nk

N|pk − p| = 1

2p(1− p)· 1

N

N∑i=1

|µi − p| (3.3)

Il s’agit de l’écart absolu moyen entre l’exposition d’un élève au groupe de référence et la part dece groupe dans la population, divisée par la valeur maximale que peut prendre cet écart moyen,atteinte en situation de ségrégation complète. Cette normalisation permet de faire en sorte queD évolue entre zéro et un. L’indice D représente également la part minimale de la populationqu’il faudrait déplacer pour atteindre l’équilibre parfait, là encore divisée par la part maximalequ’il faudrait déplacer en cas de ségrégation complète.

Définition 7 (Indice d’entropie, ou indice de Theil) L’indice d’entropie a été défini par Theil(1972). Il porte parfois le nom de son auteur. Sa définition est la suivante :

H = 1− 1

h(p)

K∑k=1

Nk

Nh(pk) = 1− 1

h(p)· 1

N

N∑i=1

h(µi) (3.4)

où h(·) est la fonction d’entropie, définie par :

h(u) = u · log2(1

u

)+ (1− u) · log2

(1

1− u

)(3.5)

Cet indice de ségrégation a des propriétés mathématiques intéressantes et peut être, plus naturel-lement que les autres, adapté à une analyse à plusieurs groupes. Pour ces raisons, il est de plus enplus populaire chez les économistes ; c’est notamment l’indicateur de choix d’une étude conjointede l’Insee et de la Depp (Monso et al., 2015). Il n’a cependant pas d’interprétation simple.

3.A.2 Discussion

Chacun de ces indices possède des propriétés mathématiques différentes, et le choix de l’in-dice dépend du contexte d’utilisation. Nous avons choisi l’indice d’exposition car il est décompo-sable en une somme de contributions à la ségrégation et qu’il possède une interprétation simple.

151

Page 178: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

L’indice d’entropie est celui qui peut le plus naturellement être utilisé pour mesurer la ségrégationentre plus de deux groupes 20.

L’indice de dissimilarité est parfois utilisé au motif qu’il est « insensible à la compositionsociale » et qu’il permet donc les comparaisons d’indices entre contextes différents (entre régions,villes, etc.). Selon nous, cet argument ne tient pas. Comme le notent Coleman et al. (1982), lapropriété dite d’insensibilité à la composition sociale vérifiée par l’indice de dissimilarité a unesignification bien précise qui ne permet pas de justifier des comparaisons entre des territoiresayant des compositions sociales différentes.

En effet, l’indice de dissimilarité est invariant lorsque la proportion du groupe de référenceest multiplié par un même facteur dans toutes les unités du territoire étudié. Or, si la proportionde CSP+, par exemple, est multiplié par 1,1 (hausse de 10 %) partout, la proportion de non-CSP+ne diminue pas systématiquement de la même proportion. En effet, dans un établissement quipasse de 20 à 22 % de CSP+, la proportion de CSP- passera de 80 à 78 %, soit une baisse de2,5 % ; dans un établissement qui passe de 60 à 66 % de CSP+, la proportion de CSP- passera de40 à 34 %, soit une baisse de 15 %. Cela représente des variations très différentes en terme de vécudes élèves et d’interactions potentielles. Si cette propriété peut avoir un intérêt mathématique,elle ne suffit pas pour comparer les indices de ségrégation de territoires ayant des compositionssociales différentes.

De manière générale, il faut être vigilant dans les comparaisons d’indice et ne pas interpréterde manière absolue des différences de ségrégation entre des territoires ayant des compositionssociales très différentes 21, et ce quel que soit l’indice de ségrégation choisi. Il convient par ailleursde toujours accompagner les indices de ségrégation d’une indication de la composition socialede l’échantillon étudié (par exemple, la proportion du groupe dont on mesure l’isolement dans

20. La séparation des CSP par la Depp en quatre groupes aurait pu justifier l’utilisation de l’incide d’entropie.Nous n’avons pas fait ce choix, car l’indice de ségrégation ainsi obtenu regroupe en un seul chiffre des phénomènesdifférents. Par exemple, Monso et al. (2015) montrent qu’au cours des dix dernières années à Paris, la ségrégationsociale mesuré par l’indice d’entropie est resté stable, mais que la ségrégation des CSP- a augmenté alors que laségrégation des autres groupes a légèrement diminué. Nous avons préféré ici montrer séparément les valeurs de laségrégation des CSP+ et des CSP-.

21. Selon Reardon and O’Sullivan (2004), des faibles variations de la composition sociale permettent d’effectuerdes comparaisons sans introduire de biais important.

152

Page 179: Inégalités scolaires, ségrégation et effets de pairs

3.B. Mesures alternatives de la ségrégation

l’échantillon).

3.B Mesuresalternativesdelaségrégation

Nous avons choisi dans cette étude de mesurer la ségrégation en utilisant l’indice d’expositionet en prenant comme groupes de références les élèves les « favorisés », c’est-à-dire les CSP+ pourmesurer la ségrégation sociale et les meilleurs élèves au DNB pour mesurer la ségrégation scolaire.Dans cette annexe, nous donnons les valeurs de la ségrégation mesurée selon d’autres indicateurs,pour la cohorte d’élèves entrant en sixième en 2007.

— La Figure 3.B.1 donne la valeur de l’indice d’exposition en prenant comme groupes deréférences les élèves CSP- pour la ségrégation sociale et les élèves en retard scolaire pourla ségrégation scolaire.

— La Figure 3.B.2 donne la valeur de l’indice de dissimilarité D (en utilisant à nouveaules groupes de référence utilisés dans le reste de l’étude). Cet indice, souvent utilisé no-tamment dans la littérature sociologique, est égal à la part de la population qui devraitchanger d’établissement ou de classe pour atteindre un équilibre parfait, divisée par ceque serait cette part en cas de ségrégation complète. Contrairement à l’indice d’exposi-tion, celui-ci ne peut pas être décomposé en une composante inter-établissements et unecomposante intra-établissement : nous calculons séparément la ségrégation entre établis-sements puis la ségrégation entre classes, mais la différence entre les deux ne peut pasêtre interprétée comme une valeur de la ségrégation intra-établissement. C’est la raisonpour laquelle nous n’utilisons pas de barres empilées dans cet histogramme.

— La Figure 3.B.3 représente la valeur de l’indice de TheilH . Cet indice a une constructionmathématique très proche de l’indice d’exposition que nous utilisons principalement dansl’étude ; il n’a cependant pas d’interprétation simple. Les valeurs obtenues sont égalementproches des valeurs de l’indice d’esposition.

Ces mesures alternatives de la ségrégation sont donnés à titre de comparaison avec d’autresétudes. Nous n’entrons pas plus en détail dans leur analyse, nous notons simplement que ceschiffres ne mènent pas à un diagnostic différent de celui effectué dans cette étude.

153

Page 180: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %

5 %

10 %

15 %

20 %

25 %

30 %

35 %

40 %

6e 5e 4e 3e 2e 1e Te

• • • • • ••

Ségrégation sociale

Niveau

P , p

• Part d’élèves CSP–dans le niveau

Ségrégation socialeentre classes d’unmême établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

30 %

35 %

40 %

6e 5e 4e 3e 2e 1e Te

• ••

•• •

Ségrégation scolaire

Niveau

P , p

• Part d’élèves en retardscolaire dans le niveau

Ségrégation scolaireentre classes d’unmême établissement

Ségrégation scolaireentre établissements

Figure 3.B.1 – Ségrégation sociale et scolaire au niveau national, mesurée par l’indice d’exposi-tion à chaque niveau pour la cohorte 2007, en utilisant les élèves « défavorisés » comme groupede référence.

154

Page 181: Inégalités scolaires, ségrégation et effets de pairs

3.B. Mesures alternatives de la ségrégation

0 %5 %

10 %15 %20 %25 %30 %35 %40 %45 %50 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation sociale

Niveau

D, p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre classes

Ségrégation socialeentre établissements

0 %5 %

10 %15 %20 %25 %30 %35 %40 %45 %50 %55 %60 %65 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation scolaire

Niveau

D, p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classes

Ségrégation scolaireentre établissements

Figure 3.B.2 – Ségrégation sociale et scolaire au niveau national, mesurée par l’indice de dissi-milarité à chaque niveau pour la cohorte 2007.

155

Page 182: Inégalités scolaires, ségrégation et effets de pairs

3. Ségrégation sociale et scolaire en France

0 %

5 %

10 %

15 %

20 %

25 %

30 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation sociale

Niveau

H , p

• Part d’élèves CSP+dans le niveau

Ségrégation socialeentre classes d’unmême établissement

Ségrégation socialeentre établissements

0 %

5 %

10 %

15 %

20 %

25 %

30 %

35 %

40 %

6e 5e 4e 3e 2e 1e Te

• • • • • • •

Ségrégation scolaire

Niveau

H , p

• Part des meilleurs élèvesdans le niveau

Ségrégation scolaireentre classes d’unmême établissement

Ségrégation scolaireentre établissements

Figure 3.B.3 – Ségrégation sociale et scolaire au niveau national, mesurée par l’indice de Theilà chaque niveau pour la cohorte 2007.

156

Page 183: Inégalités scolaires, ségrégation et effets de pairs
Page 184: Inégalités scolaires, ségrégation et effets de pairs
Page 185: Inégalités scolaires, ségrégation et effets de pairs

Chapitre 4MeasuringSocialEnvironmentMobility

Ce chapitre a été écrit avec Son Thierry Ly.Il a été publié en tant que document de travail du Département des études économiques del’Insee (numéro G2015/04).

Les auteurs souhaitent remercier Luc Behaghel, Sandra Black, Laurent Gobillon, Malik

Koubi, Éric Maurin, Magne Mogstad, Fabrice Murat ainsi que les participants au lunch

séminaire d’économie appliquée de l’École d’économie de Paris et au séminaire du départe-

ment des études économiques de l’Insee pour leurs commentaires, questions et remarques

qui ont permis de faire progresser ce document de travail.

4.1 Introduction

School or residential segregation between social or ethnic groups has been a great concern forsocial scientists and policymakers for many decades. By depriving minorities from key resources

159

Page 186: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

in their environment, the spatial separation of individuals by social background or ethnicity mayhamper their opportunities and thus reinforce inequalities (Crain and Strauss, 1985; Wells andCrain, 1994; Cutler and Glaeser, 1997). Segregation may also be viewed as a threat to democ-racy by developing uneasiness about interracial contacts, if not racial hostility (Braddock II andMcPartland, 1989). This is suggested in particular in recent works on social networks, whichshow that geographical proximity could strongly reduce the homophilic feature of interactionsbetween individuals (Currarini et al., 2009; Marmaros and Sacerdote, 2006). For example, Ca-margo et al. (2010) report that different-race students are as likely to become friends as same-race students once they have been (randomly) assigned as roommates (also see Marmaros andSacerdote, 2006). By depriving individuals from diversified interactions at an early stage of devel-opment, school segregation may therefore have long run implications on relationships betweensocial or racial groups 1.

However, the high interest of scholars on segregation issues has stalled at the conceptual andtechnical challenges raised by its measurement. A rich literature has spawned from this issue,with recent papers (Echenique and Fryer, 2007; Frankel and Volij, 2011) that added new mea-sures and concepts to the existing battery of segregation indices (Duncan and Duncan, 1955;Massey and Denton, 1988). Interestingly enough, all these papers share a common limitedfeature: they only consider segregation in a cross-sectional perspective. In other words, all seg-regation indices that have been developed only measure how much individuals from differentgroups are spatially separated from each other at a given point of time. Yet the scope of the conclu-sions that can be drawn from such indices is somewhat restricted: if individuals move a lot froman environment to another across years, segregation in a longitudinal perspective may be sub-stantially lower than it appears from a cross-sectional point of view. For instance, cross-sectionalindices may inform us about the extent to which students in a school are segregated betweenclasses with mostly white students on the one hand, and classes with mostly black students onthe other hand. They do not tell us whether each student stays every year in the same kind ofclassroom, or if instead, they tend to move between ”rich” and ”poor” classes every year. Theimplications for students’ concrete experiences of social isolation is very different depending on

1. In this direction, Camargo et al. (2010) also report interesting long run effects of diversity on white students.According to the authors, they are more likely to have black friends in the future when they are assigned to a blackroommate in college.

160

Page 187: Inégalités scolaires, ségrégation et effets de pairs

4.1. Introduction

the scenario.

This paper proposes to fill this gap in the literature by providing the first theoretical andempirical analysis of social environment mobility and its consequences on segregation. In do-ing so, our work closely relates to the strand of literature that embeds earnings mobility in themeasurement of income inequality, following Shorrocks (1978b,a) in particular. By examininginequalities of permanent or lifetime income instead of ”snapshot” income, this literature hasclearly established the equalizing force of mobility (see e.g. Bonhomme and Robin, 2009, in thecase of France). For example, Bowlus and Robin (2004) report that lifetime income inequalityin the U.S. is 40% less than in instantaneous earnings. Obviously, considering income mobil-ity also yields a different vision of the evolution of income inequality over time (Moffitt andGottschalk, 2002) or of cross-country comparisons (Gottschalk and Spolaore, 2002). In thesame spirit, social environment mobility (SEM throughout the paper) may have an equalizingeffect on the distribution of environments across individuals.

The paper is organized as follows. In section 4.2, we review the literature on the measurementof income mobility and of segregation. We explain why considering income mobility leads tolower indices of income inequality and we present the main tools to measure income mobility.We also present the segregation indices that prevail in the literature on segregation. In section4.3, we introduce the concept of social environment mobility. We first show how segregationindices are related to income inequality indices, in order to adapt the income mobility indices tothe case of social environment mobility. We present our main result which is that unlike incomemobility, social environment mobility can not reach 100 percent as long as there is some degreeof segregation at one point in time. In other words, while lifetime income inequality may bereduced to zero even if instantaneous inequality is not null, there is a lower bound in the case ofsegregation: it is not possible that all individuals in the population experience the same averageexposure to a reference group if that reference group is not evenly distributed geographically atall times. We provide tools that help using our social environment mobility index with real dataand we conclude with a case study on French middle schools (section 4.4).

161

Page 188: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

4.2 Literaturereview

There is an important and still active literature on the measurement of income mobility andthe measurement of segregation. Although social environment mobility (SEM) is conceptuallydifferent from income mobility, its measurement uses similar mathematical tools. In this section,we present some of the tools we use as a basis to build our SEM indices.

4.2.1 Measuringincomeinequality

This section gives a quick overview of the most common tools to measure income inequality.We consider a population of N individuals i ∈ 1, . . . , N. Individual i has income yi. Theincome distribution has a cumulative distribution function F(y) and average y.

Inequality indices are functions of the income distribution I(F) that belong to the unitinterval [0, 1]. They equal zero when all individuals have the same income and one when all theincome is owned by one individual only. Different indices may have different variations betweenthese two extreme cases depending on their axiomatic properties.

The Lorenz curve, introduced by Lorenz (1905), is one of the most popular tools to studyincome inequality. The curve is defined by the following function:

L(u) =

∫ u

0

F−1(t) dt∫ 1

0

F−1(t) dt=

1

y

∫ u

0

F−1(t) dt ∀u ∈ [0, 1] (4.1)

Note that the joint knowledge ofL and y is equivalent to knowing the full distribution of income(for instance, yL′(u) = F−1(u)).

The interpretation of the Lorenz curve is the following. L(20%) is the share of all the incomethat is earned by the 20 % individuals with the lowest income. 2 It follows that L(u) ≤ u for allu and the Lorenz curve is below the 45-degree line. In addition, L(0) = 0 and L(1) = 1, so

2. Indeed,∫ u

0F−1(t) dt =

∫ F−1(u)

0tf(t) dt is the total income of the fraction u of the poorest individuals in

the population, therefore L(u) is equal to that income divided by the total income of the whole population.

162

Page 189: Inégalités scolaires, ségrégation et effets de pairs

4.2. Literature review

the curve and the line cross at (0, 0) and (1, 1). If there is no inequality (everybody has the sameincome), L(u) = u for all u. At the other end, when all income is owned by one individual,L(u) = 0 if u < 1 and L(1) = 1. 3 Between these two extremes, the Lorenz curve lies betweenthe x-axis and the 45-degree line. The closer it is to the 45-degree line, the lower inequality is.

1

1

0u

L(u)

A

B

no inequality

complete inequality

Lorenz curve

G =A

A+ B= 2A

Figure 4.1 – The Lorenz curve for income inequality

The most popular inequality index – the Gini index – has a simple geometric relationshipwith the Lorenz curve. It is equal to the area between the Lorenz curve and the 45-degree line,divided by its highest possible value (1/2) so that it belongs to the unit interval. It can be written:

G =

∫ 1

0

[u− L(u)] du

1/2= 1− 2

∫ 1

0

L(u) du (4.2)

Note that the Gini index is also equal to half the average absolute difference between anytwo individuals’ incomes, i.e.

G =1

2N2

1

y

N∑i=1

N∑j=1

|yi − yj| (4.3)

3. In reality, L(u) = 0 if u ≤ 1− 1/N , but we assume that N ≫ 1.

163

Page 190: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

See appendix 4.A.1 for a proof of the equivalence of definitions (4.2) and (4.3).

Remark: The Gini index belongs to a broader class of inequality measures which have thefollowing form (Yaari, 1988; Aaberge, 2001):

Jp(L) = 1−∫ 1

0

p(u) dL(u) (4.4)

where the weighting function p is a non-increasing function with unit integral and p(1) = 0.The choice of p belongs to the social planner and depends on the desired axiomatic properties ofthe inequality index. The Gini index is associated with the weighting function pG(u) = 2(1−u).Indeed, if we integrate by parts:

JpG(L) = 1−∫ 1

0

2(1− u) dL(u)

= 1− [2(1− u)L(u)]10 +∫ 1

0

(−2)L(u) du

= 1− 2

∫ 1

0

L(u) du

= G

4.2.2 Theequalizingforceofincomemobility

The purpose of income mobility indices is to show that instantaneous income inequalityindices do not tell the full story of the income distribution. Income inequality is the combinationof two very different phenomena at work. First, people earn different incomes throughout theirlives (for instance their incomes increase with seniority or decrease when they retire), whichgenerates inequality when looking at the whole population at one point in time. Second, withinage groups, a number of personal characteristics affect income (skills, education, etc.). These twocontributions should be analyzed separately: different societies may have different standards asto what level of inequality of each type is acceptable.

Income mobility indices measure to what extent people are likely to move in the incomedistribution. There are essentially two approaches to measuring this phenomenon. The firstapproach consists in measuring correlations between current and past rankings in the income

164

Page 191: Inégalités scolaires, ségrégation et effets de pairs

4.2. Literature review

distribution. The second approach consists in comparing the distribution of instantaneous in-comes to the distribution of lifetime incomes.

Consider the following example with two individuals in two periods of time, and two sce-narios. In scenario A, the income distribution is (y1 = 1, 000; y2 = 2, 000) in both periods. Inscenario B, the income distribution is (y1 = 1, 000; y2 = 2, 000) in period 1 and incomes areswapped in period 2: (y1 = 2, 000; y2 = 1, 000). In both scenarios and in both periods, anyinstantaneous inequality index would have the exact same value. For instance, the Gini indexwould equal G = 1/6. These two scenarios could thus not be distinguished by analyzing instan-taneous inequality indices solely. Yet scenario B exhibits more income mobility than scenarioA, as both individuals exchange places in the income distribution: therefore, the correlation be-tween current and past rankings is lower, and the inequality in lifetime incomes is also lower(zero if we consider that the interest rate is zero).

High income mobility is a signal of equal opportunities: if people are likely to shift in thedistribution, this means that people at the bottom of the distribution may make their way up tothe top, and conversely people who are initially in the top of the distribution do not automaticallykeep their privileges.

If there is no income mobility at all, i.e. if all individuals keep the same (relative) incomethroughout their life, individuals also keep their positions in the income distribution, and thelifetime income is proportional to any instantaneous income. Therefore, the perfect income rigid-ity scenario leads to perfect correlation between present and past positions in the distribution,and identical measures of inequality based on instantaneous of lifetime income.

At the opposite end, defining perfect income mobility is more complicated. One possibledefinition would be to consider the case where past incomes have no influence on the currentincome (Prais, 1955). In this case, the correlation between past and current positions in thedistribution would be equal to zero, and an index of inequality based on lifetime income wouldtend towards zero as the number of time periods would grow to infinity.

165

Page 192: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

However, this definition does not describe the highest possible mobility. For instance, wecould imagine a case where poor people have better odds being rich in the next period, whilerich people will more likely get poor. In this case, the correlation between past and current ranksin the distribution would be negative, and the inequality index based on lifetime income may goto zero very rapidly.

In the rest of this section, we present income mobility indices that are based on the two classesof methods introduced above, i.e. measuring the correlation between past and current rankings,and comparing instantaneous and permanent income distributions. In order to compare presentand past positions in the income distribution, a simple possibility is to use autocorrelation co-efficients of the series of incomes. However, the literature on social mobility uses transitionmatrices, from which mobility indices can be derived. We also show two indices that are basedon the comparison of instantaneous and lifetime income.

All the indices introduced here take values between zero and one. Mobility is equal to zeroin the perfect rigidity scenario. The remainder of the axiomatic properties may vary from oneindex to another and can be found in the referenced papers.

4.2.2.1 Transitionmatrices

Transition matrices are a popular tool to measure social mobility, i.e. to observe how indi-viduals are likely to move between categories of the population at different points in time. Thesematrices are especially useful when the population is partitioned into categories such as the so-cioeconomic status, but they may also be used to study mobility within the distribution of acontinuous variable such as the income, by using income quantiles as categories.

Consider a population partitioned into n categories and two points in time (t ∈ 1; 2).Denote cti ∈ 1; . . . ;n the category of individual i at time t. The transition matrix is T =

(tjk)1≤j,k≤n where tjk = P(c2i = k|c1i = j) is the share of the population that was in category jin the first period ending up in category k in the second period. A transition matrix should be

166

Page 193: Inégalités scolaires, ségrégation et effets de pairs

4.2. Literature review

stochastic, i.e. that the coefficients in each row must add up to one:

n∑k=1

tjk =n∑

k=1

P(c2i = k|c1i = j) = 1 (4.5)

The perfect rigidity scenario’s transition matrix is the identity matrix. In the perfect mobil-ity scenario, the initial category has no influence on the final category: all rows are identical.Shorrocks (1978b) argued that the perfect mobility scenario should be associated with a mobil-ity index value of one. However, this axiom associated with a monotonicity axiom would leadto values higher than one when mobility is more than perfect. Shorrocks (1978b)’s recommen-dation is to limit the value of the index to one in those cases, that he considers very unlikely inthe context of income mobility.

An example of such an index is the following:

MT = min(n− Trace(T )

n− 1; 1

)(4.6)

Indeed, in the case of perfect rigidity, T is the identity matrix and has trace n, therefore MT = 0.If there is perfect mobility, property (4.5) and the fact that the rows are identical leads to thetrace being equal to one, therefore MT = 1.

Another difficulty with indices based on transition matrices is that they greatly depend uponthe definition of the categories. For instance, using income percentiles rather than deciles wouldautomatically increase the value of the income mobility index, as the diagonal elements would belower in proportion. The following sections introduce indices that adress these two limitations.

4.2.2.2 Comparinginstantaneousandlifetimeinequality

A second class of income mobility indices has been developed by Shorrocks (1978a), pub-lished just three months after Shorrocks (1978b). The intuition is that when income mobility ishigh, inequality indices based on lifetime incomes should be lower than those based on instan-taneous incomes. Calling Ft the income cumulative distribution function (cdf ) in period t, F∗

the cdf of lifetime income, and I(F) an income inequality index (such as the Gini index), an

167

Page 194: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

income mobility index is defined by:

M = 1− I (F∗)

1

T

T∑t=1

I(Ft)

(4.7)

where I is a strictly convex function of the relative income distribution. This restriction on I

ensures that M belongs to the unit interval (Shorrocks, 1978a). Consider the two extreme casesleading to M = 0 and M = 1.

In the perfect rigidity scenario, the instantaneous and lifetime income distributions are iden-tical (up to a multiplicative constant in income), therefore the inequality indices – that are func-tions of relative incomes only – are equal, and M is equal to zero.

M equals one if and only if inequality in lifetime income I(F∗) is equal to zero. This mayhappen in only three scenarios: (i) if there is no inequality at any point in time, (ii) if incomemobility is perfect and the number of periods is infinite or (iii) if income mobility is more thanperfect so that inequality in a given period are compensated for in a different period. The firstscenario is trivial and the second scenario has no empirical application. The third scenario iswhat Shorrocks (1978a) calls complete income mobility, as opposed to perfect income mobility.

4.2.2.3 Incomemobilitycurves

A third method to measure income mobility has recently been introduced by Aaberge andMogstad (2014), that also relies on the comparison of instantaneous and lifetime income. Theauthors extend the concept of Lorenz curve and introduce an income mobility curve which isdefined as the difference between the Lorenz curve of the actual lifetime income distribution F∗

and the curve based on a hypothetical, reference lifetime income distribution in perfect rigidityscenario, F∗

R. In the reference distribution F∗R, ”the rank of each individual is the same in every

period; this distribution can be formed by assigning the lowest income in every period to thepoorest individual in the first period, the second lowest to the second poorest, and so on.”. Notethat this definition does not give a particular role to the distribution in the first period: keepingthe rankings constant and equal to the rankings in any period would lead to the exact samedistribution.

168

Page 195: Inégalités scolaires, ségrégation et effets de pairs

4.2. Literature review

Call L∗ the Lorenz curve of the lifetime income distribution F∗ and L∗R the Lorenz curve of

the reference distribution F∗R. The income mobility curve is defined as the difference between

the two Lorenz curves:M(u) = L∗(u)− L∗

R(u) (4.8)

Aaberge and Mogstad (2014) show that M(u) ≥ 0 for all u ∈ [0; 1], i.e. that the Lorenz curveof the reference distribution is below the Lorenz curve of actual lifetime income (which meansthat it is more unequal).

Mobility curves can be synthesized into income mobility indices in the same way Lorenzcurves can be synthesized into income inequality indices. For instance, an income mobilityindex can be obtained by integrating a weighting function along the income mobility curve:

Λp(M) =

∫ 1

0

p(u) dM(u) =

∫ 1

0

p(u) d(L∗ − L∗R)(u) = Jp(L∗

R)− Jp (L∗) (4.9)

If we consider the same weighting function as for the Gini index (p(u) = 2(1−u)), Λp(M)

is simply the difference between the Gini indices of both distribution. Aaberge and Mogstad(2014) argue that taking the difference rather than the ratio is preferrable in that a ratio whosedenominator is very small will be very sensitive to small changes in the numerator. It will be equalto zero if the actual distribution of lifetime income is the same as the reference distribution thatcorresponds to the perfect rigidity scenario. It will be equal to one if the actual lifetime incomedistribution is perfectly equal and if the reference distribution is completely unequal, i.e. if allincome belongs to one individual only.

4.2.3 Measuringsegregation

Segregation is the fact that people with different characteristics (e.g. race, gender, socioeco-nomic status) are isolated from each other. Its measurement raises a number of conceptual andtechnical issues (Massey and Denton, 1988). In our case, we choose to focus on segregationindices that measure the extent to which the population is evenly distributed across units (e.g.cities or schools) depending on their characteristics. This definition is associated with a numberof popular segregation indices such as the dissimilarity index, the Gini index, the normalized

169

Page 196: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

exposure and the entropy index. Frankel and Volij (2011) provide an excellent review of themain segregation indices, including their definitions and axiomatic properties.

We can see segregation indices as measures on an undirected graph where nodes are individ-uals and edges are social relations. We assume that each individual belongs to one of two groupsdenoted A and B. 4 Group A will be called the reference group (e.g. the rich, the black, the women,etc.) and group B will contain everyone else in the population. For instance, if group A denotesblack individuals, group B will contain all non-black individuals (not only whites). The referencegroup may be the majority group or a minority, indifferently: we call p ∈ [0; 1] its share in thepopulation. Each individual i ∈ 1, . . . , N belongs either to group A (Ui = 1) or group B(Ui = 0). The social environment of individual i is the set of individuals that are connected to i

through an edge, including individual i herself. 5 We denote µi the share of i’s social environmentthat belongs to the reference group: it is called the exposure to the reference group of individual i.

In the two-group case, segregation indices are essentially measures of the inequality of thedistribution of µi, i.e. they are indices of social environment inequality. However, there is oneimportant difference between income inequality and social environment inequality, which is thatindividuals are each other’s social environment. Therefore, the distribution of µi is subject toconstraints. In particular, a widespead assumption is that the graph consists of a set of isolated,complete subgraphs, i.e. that individuals interact in clusters, as shown in Figure 4.2. Withthis hypothesis, the clusters are denoted k ∈ 1, . . . , K, each cluster contains Nk individualsand has a share pk of individuals from the reference group. Therefore, if individual i belongs tocluster k, µi = pk. The average of µi over the whole population is then equal to p:

E(µi) =1

N

N∑i=1

µi =1

N

K∑k=1

Nkpk = p

This hypothesis is very common in the literature on segregation, and most segregation indices4. Segregation indices can be defined with more than two groups, as detailed in Frankel and Volij (2011). We

focus on the two-group case for simplicity’s sake; adding more groups has no fundamental impact on the analysis.5. The choice of including individual i in her own social environment or not is quite arbitrary: both options have

advantages and drawbacks and they have their own justifications. The numerical difference is small when individualshave a large number of social relations. We choose to include individual i in her own social environment in orderto simplify calculations.

170

Page 197: Inégalités scolaires, ségrégation et effets de pairs

4.2. Literature review

1

2

34

5

6

7

8

9

10

11

Figure 4.2 – A social network graph with interactions in clusters. Filled circles denote individ-uals from group A and plain circles denotes individuals from group B. The average exposure tothe reference group is 60 percent in the left cluster, 67 percent in the right cluster.

are defined based on these clusters. Below are the definitions of four popular segregation indices:the dissimilarity index (D), the Gini index (G), the normalized exposure (P ), and the entropyindex (H).

D =1

2p(1− p)

K∑k=1

Nk

N|pk − p| (4.10)

G =1

2p(1− p)

K∑k=1

K∑k′=1

Nk

N

Nk′

N|pk − pk′| (4.11)

P =1

p(1− p)

K∑k=1

Nk

N(pk − p)2 (4.12)

H = 1− 1

h2(p)

K∑k=1

Nk

Nh2(pk) (4.13)

where h2 is the 2-category entropy function, defined by:

h2(u) = u log2(1

u

)+ (1− u) log2

(1

1− u

)(4.14)

Note that the definition of the Gini index is similar to the Gini index on income distributiondefined in equation 4.3.

All these indices equal zero when pk ≡ p in all clusters, i.e. if every cluster has the same shareof individuals from the reference group: in that case, there is no segregation at all. Conversely,

171

Page 198: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

they all equal one when pk ∈ 0, 1 in all clusters, i.e. if every cluster contains either onlyindividuals from the reference group, or no individual from that group: there is no mixity in anyof the clusters, segregation is complete.

The indices take different values for intermediate situations, they have different interpreta-tions and different axiomatic properties, as detailed in Frankel and Volij (2011). For instance,the dissimilarity index D is equal to the minimal share of the population that would have tomove to a different cluster in order to achieve full desegregation, normalized by its maximumvalue; the normalized exposure index P has three possible interpretations:

— First, it can be seen as the variance of pk across all clusters, normalized by its highestpossible value p(1 − p) which is reached if each cluster contains either only individualsfrom group A or only individuals from group B.

— Second, P is the share of between-clusters variance of the binary variable Ui (belongto the reference group), since pk = E(Ui|i ∈ k). It is the R2 of the regression of thatvariable on a cluster-level fixed effect.

— Third, calling µA the average exposure to group A of the individuals in that group and µB

the average exposure to group A of the individuals from group B, the value of the index isequal to:

P = 1− µB

p= µA − µB (4.15)

i.e. P is the exposure gap to the reference group between the two groups (proof in appendix4.A.3).Note that since P ≥ 0, these equalities yield the following double inequality:

µB ≤ p ≤ µA (4.16)

The reference group always has a greater exposure to itself than average, while the rest of thepopulation has a lower exposure to the reference group.

In Figure 4.3, we consider the case of 8 students (N = 8) attending one of two classes(K = 2). Half of them are in the reference group A (full circles) and the other half are in thegroup B (plain circles): p = 0.5. The students in class X have an exposure to the reference grouppX = 0.75 while the students in class Y have an exposure pY = 0.25. The segregation indicesequal D = 0.5, G = 0.5, P = 0.25 and H = (3/4) log2(3)− 1 ≃ 0.19.

172

Page 199: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

Class X Class Y

Figure 4.3 – Segregation between upper class (full circles) and middle or lower class (plaincircles) students.

4.3 Socialenvironmentmobility

The tools presented in the previous section lay out the grounds for building social environ-ment mobility (SEM) indices. As seen in section 4.2.3, segregation indices are not straightfor-ward adaptations of income inequality indices. Similarly, income mobility indices cannot betransposed directly to the case of SEM. In this section, we detail the fundamental differencesand the adaptations they imply on the definition of SEM indices. For the sake of simplicity, wetake the example of social segregation between upper class individuals (group A) and middle orlower class individuals (group B). We sometimes refer to the group B as lower class individuals,omitting the fact that group B contains both middle class and lower class individuals.

4.3.1 Breakingoutoftheclusters

While the definitions of the segregation indices defined in section 4.2.3 are convenient, theyare not appropriate when studying SEM. Their main drawback is that they rely on the fact thatindividuals interact in clusters, which makes sense when looking at segregation at one point intime, but not when looking at SEM. For instance, in the case of school segregation, clusters mayrepresent classes in a school, and those are not constant across school years. Individuals interactin clusters in each school year, but not overall: if student A interacted with B and B interactedwith C, A may not have interacted with C.

In Figure 4.4, students 1 to 8 are assigned to classes X and Y in the first year, and classes X’and Y’ in the second year. In case 1, classes X’ and Y’ are identical to classes X and Y, but theyare not in case 2. If we want to provide some information on the variety of social environments

173

Page 200: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

students have experienced, the clusters only define the students’ social environments at one pointin time. But belonging to different clusters over time is an indication of social environmentmobility. Just like income mobility indices, SEM indices provide more additional informationon the degree of segregation over time. Although segregation indices have the same values incase 1 and in case 2, case 2 leads to less segregation over time: for instance, student 4 was theonly lower class student in her class two years in a row in case 1 but not in case 2.

CaseI

Case II

t = 1 t = 2

Class X

1 2

3 4

Class Y

5 6

7 8

Class X’

1 2

3 4

Class Y’

5 6

7 8

Class X’

1 2

5 6

Class Y’

3 4

7 8

Figure 4.4 – Social environment mobility in the case of school segregation: students 1, 2, 3and 5 are the group A (upper class students) and students 4, 6, 7 and 8 are the group B (lowerclass students). In the first case, the two classes are identical in both time periods while they arereshuffled in the second case, leading to a higher SEM.

Therefore, we need to define measures of segregation that do not rely on clusters. Fortunately,the indices introduced in the previous section can be written as a function of the individualexposures to the reference group µi. As we introduce a time variable t ∈ 1, . . . , T, we willnow denote µit the social environment of individual i at time t (which is still computed usingthe cluster individual i belongs to at time t). For now, we assume that the population is stableover time and that the individual characteristics that define the reference group are stable as well:

174

Page 201: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

therefore, N and p are constants.

Dt =1

2p(1− p)

1

N

N∑i=1

|µit − p|

Gt =1

p(1− p)

1

N2

N∑i=1

N∑i′=1

|µit − µi′t|

Pt =1

p(1− p)

1

N

N∑i=1

(µit − p)2

Ht =1

h(p)

1

N

N∑i=1

h(µit)

With these expressions, segregation indices are a measure of inequality on the distribution ofthe social environments µit. In section 4.2.1, we introduced income inequality indices that werefunctions of the Lorenz curve. Yet the literature on segregation has not been using the Lorenzcurve as such, but rather an adaptation of it introduced by Duncan and Duncan (1955) and calledthe segregation curve. However, the definition of this curve requires that individuals interact inclusters. The segregation curves is a continuous, piecewise linear function (i.e. a spline functionof degree one) which goes through the points (Xk, Yk)k∈0,...,K where (X0, Y0) = (0, 0); Xk isthe share of the group A that belongs to the k first clusters with the smallest share of individualsfrom that group; Yk is the share of the group B that belongs to those same k clusters. It followsthat (XK , YK) = (1, 1). The segregation curve has interesting properties, in particular it hasgeometric relations to some segregation indices, notably the dissimilarity index and the Giniindex. The dissimilarity index is the maximal vertical distance between the curve and the 45-degree line (whose highest possible value is one). The Gini index is the area between the curveand the 45-degree line, divided by its highest possible value 1/2: this is the same relation as theGini index and the Lorenz curve in the case of income inequality.

Since we cannot consider clusters when studying SEM, we choose to go back to the initialLorenz curve. To that end, we introduce the cumulative distribution function of µit, denoted

175

Page 202: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

Ft. Our four segregation indices can be written in integral form using Ft:

Dt =1

2p(1− p)

∫ 1

0

∣∣F−1t (u)− p

∣∣ du (4.17)

Gt =1

2p(1− p)

∫ 1

0

∫ 1

0

∣∣F−1t (u)−F−1

t (u′)∣∣ du′ du (4.18)

Pt =1

p(1− p)

∫ 1

0

(F−1

t (u)− p)2 du (4.19)

Ht =1

h(p)

∫ 1

0

h(F−1

t (u))

du (4.20)

The Lorenz curve for social environments at time t, denoted Lt has the same definition asthe Lorenz curve for the income distribution. When there is no segregation, the Lorenz curvecoincides with the 45-degree line. However, when segregation is maximal, Lt(u) = 0 only ifu ≤ 1−p. Recall that when all the income is earned by only one individual, Lt(u) = 0 if u < 1.In the case of maximal segregation, the group A (which represents a share p of the population) isexposed to itself and to itself only, therefore they have µit = 1, while the group B (whose shareis 1 − p) has µit = 0. As a consequence, the Lorenz curve for social environments has a lowerenvelope which is equal to zero on [0, 1−p] and is linear on [1−p, 1], with Lt(1) = 1, as shownon Figure 4.5 (blue curve).

With this limitation, the highest possible vertical distance between the Lorenz curve and the45-degree line is 1− p and the highest possible area is (1− p)/2. Interestingly, the dissimilarityindex defined above is equal to the maximum vertical distance between the Lorenz curve and the45-degree line divided by the highest possible value 1− p. Similarly, the Gini index is equal tothe area between the Lorenz curve and the 45-degree line divided by the highest possible value(1− p)/2. Therefore, the Lorenz curve remains useful when studying segregation as long as wekeep in mind that it has a lower envelope that affects the normalization of the indices.

In order to adapt income mobility measures that were introduced in section 4.2.2, we alsoneed to introduce the distributions of lifetime exposure, i.e. of the variable µi = (1/T )

∑Tt=1 µit.

We call F∗ the corresponding cumulative distribution function and L∗ the Lorenz curve. Wecan then define the lifetime segregation indices S∗ (where S is any of the four segregation indicesintroduced in section 4.2.3) by replacing the instantaneous distribution Ft with the lifetime

176

Page 203: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

1

1

0u

L(u)

AB

no segregation

1− p

complete segregation

Lorenz curve

d

dM

G =A

A+ B=

A(1− p)/2

D =d

dM=

d

1− p

Figure 4.5 – The Lorenz curve for social environments

distribution F∗ in the formulae (4.17), (4.18), (4.19) or (4.20). Note that unlike instantaneoussegregation indices, lifetime segregation indices generally do not have simple interpretations, ex-cept for the lifetime normalized exposure P which is the gap in average exposure to the referencegroup between the two groups A and B: P = µA − µB.

We then have all the tools to adapt the income mobility measures to the case of SEM:— Following Shorrocks (1978a), we can define SEM indices that compare the lifetime seg-

regation index with the average instantaneous segregation index:

MS = 1− S∗

S(4.21)

where S is the average instantaneous segregation, i.e. the average value of St over theT periods. Note that for any segregation index, S∗ ≤ S, so that MS belongs to theunit interval. This is true for the same reasons why the income mobility index defined insection 4.2.2.2 belongs to the unit interval, since the mathematical definition is identical(see Shorrocks, 1978a, p. 386).

— Aaberge and Mogstad (2014)’s income mobility curves can also be imported to social

177

Page 204: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

environment mobility using the exact same definition:

M(u) = L∗(u)− L∗R(u) (4.22)

where the Lorenz curveL∗R of the ”reference distribution” that describes the perfect rigid-

ity scenario has the same definition as in the income mobility case. Both the lifetime seg-regation Lorenz curve and the reference curve have the same lower envelope, thereforethe difference has no lower envelope other than the zero function.

Although the definitions are identical, the SEM indices have one important difference withincome mobility indices, which is that even when SEM is very high, lifetime segregation cannever vanish to zero as long as there is some degree of instantaneous segregation. We examinethis point in more details in the next section.

4.3.2 Thelimitedequalizingforceofsocialenvironment

mobility

As seen in section 4.2.2, income mobility gives a different perspective on income inequal-ity, as a significant fraction of income inequality may vanish when comparing lifetime incomesinstead of instantaneous incomes. In fact, theoretically, there could exist a society in whichinstantaneous inequality is always high but income mobility may be so high that inequality inlifetime incomes equals zero. This would be the case, for instance, if the income was a directfunction of the individual’s age and all individuals have the same lifespan.

Yet in the case of SEM, it is not possible to have no lifetime segregation if we have instan-taneous one. As stated in equation (4.16), the group A will always have a greater exposure toitself than the group B (µA

t ≥ µBt ), unless there is no segregation in which case the exposures are

equal. Suppose that in a given period, there is some segregation: then, for that period, groupA will have a greater exposure to itself than group B. If we want lifetime segregation to be zero,i.e. if we want all individuals to have the same lifetime exposure to the group A, then in aver-age the group B must have a greater exposure to the group A than the group A itself in otherperiods: this cannot happen. Therefore, any level of instantaneous segregation has irreversibleconsequences on the minimum level of lifetime segregation that may be observed after several

178

Page 205: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

time periods. An implication is that the Lorenz curve of lifetime exposures L(u) cannot coin-cide with the 45-degree line: instead, it has an upper envelope L∗

(u). Our goal in this sectionis to determine this upper bound, considering instantaneous segregation as given. In other words,we are interested in finding the upper envelope L∗

(u) for a given series of the instantaneousdistributions (Ft).

The intuition is the following. As explained in section 4.2.3, as long as there is some level ofsegregation at any time, white people and non-white people cannot have the same exposure towhite people. The values of µA

t and µBt are determined by the level of instantaneous segregation,

which we consider as given. More precisely, using the normalized exposure index Pt, we havethe relationships:

Pt = 1− µBt

p= µA

t − µBt (4.23)

Since these relationships are linear, we can average over time:

P = 1− µB

p= µA − µB (4.24)

Now, in the best case scenario, there is no difference in µi between individuals from the referencegroup and between individuals from the group B, i.e. µi = µg if i ∈ g where g denotes group Aor B: if SEM is optimal, it will eliminate differences within each group, but it cannot eliminatedifferences between the two groups.

In that case – this is our main result – the Lorenz curve of lifetime social environments is aspline function of degree one with a knot at u = 1 − p with L∗(1 − p) = (1 − p)

(1− P

), as

plotted in Figure 4.6 (see proof in appendix 4.A.4).

This upper envelope translates into lower bounds for the four lifetime segregation indices:

D∗m = P (4.25)

G∗m = P (4.26)

P ∗m = P

2 (4.27)

H∗m =

(1− p) · h(p(1− P

))+ p · h

(p(1− P

)+ P

)h(p)

(4.28)

179

Page 206: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

1

1

0u

L(u)

no segregation

1− p

complete segregation

L∗M(u): minimum

lifetime segregation

(1− p)(1− P )

Figure 4.6 – The upper envelope of lifetime social environment Lorenz curves

and into upper bounds for the SEM indices adapted from Shorrocks (1978a):

MDM = 1− P

D(4.29)

MGM = 1− P

G(4.30)

MPM = 1− P (4.31)

MHM = 1− H∗

m

H(4.32)

Note that this upper bound to SEM indices is a theoretical one. Reaching this upper boundexactly is not always possible if the number of time periods is not big enough. The SEM indexis equal to its upper bound if and only if all individuals within each group have the exact samelifetime exposure to the reference group.

Consider the case described in Figure 4.3 and suppose that each year, there are two classeswith identical group compositions but possibly different individual compositions (i.e. class Xalways contains three students from group A but they can be any of the four group A students).

180

Page 207: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

The value of the segregation index Pt will be 25 percent in each year, therefore P is also equalto 25 percent and the upper bound of the SEM index is 75 percent as per equation (4.31). Theaverage exposure of the upper class students is equal to 62.5 percent in each period: if SEMis complete, the lifetime exposure of each upper class student should be equal to 62.5 percent.This is possible if and only if each student spends three time periods in class X for each timeperiod spent in class Y: therefore, the number of periods must be a multiple of four (there is anidentical constraint on lower class students).

Therefore, the number of time periods induces a bias on the upper bound to mobility. Thisbias decreases with the number of time periods: in our example, complete mobility could notbe reached for T = 10 or T = 14 but the variance of lifetime exposure within e.g. the referencegroup would be smaller in the second case. The bias also gets smaller when the distribution ofexposures at each time is peaked around its mean value: in that case, a large share of individualswill be close to the mean value at each time and the lifetime exposure can converge more rapidlytowards this mean value.

Unfortunately, there is no simple formula for this bias: finding the optimal series of alloca-tions of individuals across clusters at each time is a complicated algorithm. In practice however,if the allocation of individuals across clusters is not too peculiar, the distribution of exposuresallows for a relatively rapid convergence towards a zero bias.

4.3.3 Dealingwithattrition

Attrition is a classic issue when working with panel data. In the case of SEM, attrition entailsan additional methodological difficulty. While we need individuals to be observed several timesin order to compute a mobility index, individuals who are observed only once still affect theother individuals’ social environments. Therefore, it is not possible to simply remove individualswho are not always observed out of the sample: at least, they must be taken into account whencomputing the exposures.

181

Page 208: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

t = 1

Class X

1 2

3 4

9

Class Y

5 6

7 8

10

11

t = 2

Class X’

3 5

6 4

12

Class Y’

1 2

7 8

Figure 4.7 – Attrition: students 9, 10, 11 and 12 are not present in both time periods but theycannot be ignored since they affect the social environment of students 1 to 8.

Call Ωt the set of individuals observed in t and define:

Ω =T∪t=1

Ωt and ω =T∩t=1

Ωt

Ω is the set of individuals that we observe at least once and ω ⊂ Ω is the balanced panel, i.e.the subset of individuals that we observe in each time period. The larger sample Ω is used tocompute the exposures to the reference group: the social environment of individual i at timet is a subset of Ω (but maybe not of ω), and µit is the share of individuals from the referencegroup in that subset. For instance, Figure 4.7 represents a group of 12 students who interact intwo classes at two points in time. The restricted sample is ω = 1, 2, 3, 4, 5, 6, 7, 8 and the fullsample is Ω = ω + 9, 10, 11, 12. In the first period, the social environment of student A isthe entire class X, which contains 5 students: 4 upper class students and one lower class student.Therefore, the student 1 has exposure µ1,1 = 4/5 = 0.8.

We could then compute instantaneous segregation indices based on the distribution of µit

on the restricted sample, using the formulae (4.17), (4.18), (4.19) and (4.20). However, thesedefinitions may lead to segregation indices out of the unit interval. This also means that theSEM indices based on segregation indices cannot be used directly.

In this section, we focus on the SEM index MP , which is based on the normalized exposuresegregation index and which can be easily adapted to a case with attrition – unlike the otherSEM indices that cannot be adapted in a simple way.

182

Page 209: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

As stated earlier, the normalized exposure index Pt is equal to the variance of the seriesof exposures (µit)it∈1,...,N×1,...,T, normalized by its highest possible value p(1 − p), whichwould be reached if each class contained either only individuals from group A or only individualsfrom group B. Similarly, P ∗ is the variance of the series (µi)i∈1,...,N, normalized by its highestpossible value which is also p(1 − p). Since the normalization is the same for Pt and P ∗, theratio P ∗/P is also equal to the ratio of the variances V ∗ = p(1− p)P ∗ and V = p(1− p)P . V ∗

is the variance of the lifetime exposures µi while V is the total variance of µit (as long as p isconstant, which is one of our hypotheses). Then,

MP = 1− V ∗

V=

V − V ∗

V(4.33)

This new definition of the mobility index MP has an interesting interpretation. Indeed, avariance decomposition shows that V −V ∗ is equal to the average individual variance of exposureacross time periods: if vi is the variance of the series (µit)t, V − V ∗ is the average value of vi.Therefore, V − V ∗ captures the diversity of the social environments experienced by individuals.The SEM index MP compares the average diversity of social environments experienced by asingle individual to the diversity of all existing social environments in the setting. An equivalentapproach is to look at the panel series (µit) and to regress it against an individual fixed effect:

µit = αi + ϵit (4.34)

MP is then equal to 1−R2 where R2 is the coefficient of determination of the above regression.

The definition can then be adapted to a scenario with attrition. Denoting V ∗ω the variance

of the series (µi)i∈ω and Vω the variance of the series (µit)it∈ω×1,...,T, we can use this simpleadaptation of the SEM index:

MPω = 1− V ∗

ω

=Vω − V ∗

ω

(4.35)

i.e. we compare the average individual variance to the overall variance of the exposures in thereference group. The interpretation given above is still valid and MP still belongs to the unitinterval.

The formula of the upper bound defined in section 4.3.2 should also be adapted to this newdefinition. In order to compute this upper bound, we consider once again the scenario of optimal

183

Page 210: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

SEM. In this best case scenario, all individuals from the reference group in the balanced panelhave the same lifetime exposure, and all individuals from the group B in the balanced panel hasthe same lifetime exposure too. These two values µA

ω and µBω can be computed directly from the

actual distribution of µit:

µgω = E(µit|i ∈ ω ∩ g) (4.36)

Denoting pω the share of the reference group in the balanced panel and µω the average exposureto the reference group in this sample, 6 the smallest possible variance of lifetime exposures isgiven by

V ∗ω,m = pω(µA

ω − µω)2 + (1− pω)(µB

ω − µω)2 (4.37)

Therefore, the upper bound of the SEM index is:

MPω,M = 1− pω(µA

ω − µω)2 + (1− pω)(µB

ω − µω)2

(4.38)

4.3.4 Nestedlevelsofclustering

When studying segregation, it is not uncommon to find cases where there are nested levelsof clustering. The typical example is school segregation, where individuals (students) interactmainly within classes but also within schools that contain several classes. The value of the segre-gation index varies depending on the choice of the level of clustering, i.e. on the definition of astudent’s social environment. In particular, if we take the classroom as the reference cluster, thesegregation index will be larger than if the reference cluster is the whole school. In the case ofthe normalized exposure index P , there is a simple relationship between the indices P class andP school.

Call µclassi (resp. µschool

i ) the share of the reference group in student i’s class (resp. school).Recall that Ui is a binary variable that equals 1 if the individual i belongs to the reference group.As stated earlier, the segregation index P class is the share of the variance of Ui that is explainedby classes, which is equal to the variance V class of the series (µclass

i )i divided by the variance of Ui,i.e. by p(1 − p). Similarly, the segregation index P school is equal to the variance V school divided

6. µω is different from pω because the individuals from the balanced panel interact with individuals from Ωwho are not in ω. If there was no attrition (ω = Ω), then we would have µω = pω.

184

Page 211: Inégalités scolaires, ségrégation et effets de pairs

4.3. Social environment mobility

by p(1 − p). Note that the series (µclassi )i (resp. (µschool

i )i) is identical to the series of the sharesof the reference group in each class (resp. school), weighting each class (resp. school) by its size.

Therefore, the total variance p(1− p) is the sum of three terms:

1. the variance of µschooli , which represents the between-school variance;

2. the average within-school variance of µclassi ;

3. the average within-class of the variable Ui, which is the remaining variation that is notexplained by schools or classes.

The share of the first term in the total variance is the between-school segregation P school. Theshare of the first two terms is the between-class segregation P class. This reasoning can be ex-tended to more clustering levels: city, region, etc.

Multi-level clustering is also interesting in the case of SEM. In section 4.3.1, we explainedhow the segregation indices had to be reworked in order to be independent of the notion ofclusters, since SEM implies that individuals do not remain in the same cluster throughout theirlife. However, when there are several levels of clustering, we can imagine that the smallest-level clusters are indeed unstable over time, but that larger clusters do remain throughout alltime periods. In the case of school segregation, we could imagine that classes are reshuffledevery year but that students cannot change schools. In this scenario, the SEM index has to beadapted.

As detailed in section 4.3.3, the SEM index MP can be seen as the ratio of the average indi-vidual variance of exposure to the variance of all exposures in the population and throughout alltime periods. Yet if students cannot leave their school, it makes sense to compare the diversity ofexposures experienced by an individual student to the distribution of exposures that are availablein their school rather than in any existing school. There are two ways in which this can be takeninto account in the SEM indices:

1. If students cannot change schools, the upper bound to mobility is actually lower than thestandard value. The best case scenario under this constraint is that within each school, everyindividual from the reference group has the same lifetime exposure and every individual from

185

Page 212: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

the other group has the same lifetime exposure. The value of the upper bound of the SEMindex can easily be computed under this condition.

2. It may also make sense to change the denominator of the SEM index given in equation(4.33) in order to compare the individual variances to the within-school variance ratherthan the total variance V . Note that in this case, the upper bound should also be computedusing the method described in the previous point (optimal within-school mobility).

In practice however, clusters are rarely perfectly persistent over time: although most studentsremain in the same school, a small fraction of them is likely to change schools. The existence ofsuch students has important consequences on the within-school SEM index’s axiomatic proper-ties: in theory, if some students may change schools, within-school mobility may exceed one. Ifthese students are a small minority, we choose to treat them as if they left the balanced panel andwe consider them as attrition: in the notations of section 4.3.3, they belong to Ω \ ω, i.e. theydo affect the other students’ environments, but they are not taken into account when computingthe SEM index.

Overall, if we consider two levels of clustering, there are three SEM indices to consider:

1. the standard SEM index where we compare the average individual variance to the overallvariance in exposures;

2. the same standard SEM index but restricted to a balanced panel consisting of individualswho remain in the same school;

3. the SEM index obtained by dividing the average individual variance of the restricted bal-anced panel by the overall within-school variance.

The difference between the values of the first and the second index should be small and is onlydue to a selection effect. However, they have different upper bounds, since in the second casethe relevant upper bound is based on the assumption that students cannot change schools. Thethird index will be mechanically higher than the second, since the only difference is to replacethe total variance by the within-school variance in the denominator, in both the SEM index andthe upper bound.

186

Page 213: Inégalités scolaires, ségrégation et effets de pairs

4.4. Case study: SEM in French middle schools

4.4 Casestudy: SEM inFrenchmiddleschools

In this section, we apply the SEM analysis methodology that we laid out in section 4.3 to aconcrete example. All segregation and SEM indices rely on the normalized exposure index P ,which has several advantages:

— the lifetime segregation index P ∗ has an intuitive interpretation, unlike other lifetimesegregation indices;

— the upper bound to the SEM index can be expressed as a function of the average instan-taneous segregation P when there is no attrition;

— when there is attrition, we can use adapted versions of the SEM indices based on MP ;— we can use the additive decomposability property of the segregation index and compare

SEM indices on different levels.

We take the example of social segregation and SEM in French middle schools. In 2009, acohort of 797,894 students entered 6th grade. These students spend four years in middle school,from grade 6 to grade 9. The objective of this section is to provide figures on social segregationin French middle schools and on the diversity of social environments experienced by the middleschool students during these four years.

Thanks to a unique database from the French Ministry of Education, we are able to follow79 percent of the cohort throughout the four years of middle school (possibly in different schoolsat different points in time): these students are the balanced panel. We know about their socioe-conomic status and the class they attended in each year. The 21 percent of students who are notobserved all four years either repeated a grade (7 percent) or could not be matched from onedataset to another (14 percent).

Our reference group is the upper class students, which make up 38 percent of the sample(p = 0.38); while the rest of the sample contains both lower class and middle class students, werefer to them as the lower class students for the sake of simplicity.

Figure 4.8 gives the value of the instantaneous segregation index at each grade t ∈6, 7, 8, 9. In average, the segregation index equals 19 percent. Given that the share of up-

187

Page 214: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

0%

5%

10%

15%

6 7 8 9Grade (t)

Segregation (Pt)

Between classesBetween schoolsBetween cities

Figure 4.8 – Normalized exposure in French middle schools, cohort 2009

per class students is 38 percent, this means that in average, the class of an upper class studentcontains 50 percent of upper class students, while the class of a lower class student contains only 31 per-cent of upper class students, as per equation (4.15). The figures also show the decomposition of thesegregation across three levels of clustering: cities, schools and classes.

The between-cities segregation is equal to 10 percent, which means that if all schools and allclasses were identical within each city, the total segregation would equal 10 percent instead of19 percent: residential segregation accounts for 53 percent of the total segregation. The otherhalf is driven by within-city, between-school segregation (5 points, 26 percent of the total) andwithin-school, between-class segregation (4 points, 21 percent of the total).

Because of the attrition in our sample, we need to use the SEM index defined in equation(4.35) and the upper bound defined in equation (4.38). We find that the value of the SEM indexMP

ω is 15 percent and its upper bound is 81 percent. The numerical value of the upper bound isvery close to 1− P which is the value in the case where there is no attrition.

A simple, yet approximate, interpretation of the SEM index is the following. For each stu-dent in the balanced panel, compute the average share of upper class students in their class

188

Page 215: Inégalités scolaires, ségrégation et effets de pairs

4.4. Case study: SEM in French middle schools

throughout the four years of middle school. The gap between an upper class and a lower classstudent’s lifetime exposure to upper class students, P ∗, is about 15 percent less than the segrega-tion index, i.e. 16 percent instead of 19 percent. This interpretation is not strictly correct sincethe numerator in equation (4.35) does not relate exactly to the exposure gap µ1

ω − µ0ω (it does

only if there is no attrition). In this case however, this interpretation remains fairly accurate –which can be checked by computing the actual lifetime exposures.

A second interpretation is that the individual variance of exposures to upper class studentsis about 15 percent of the variance of exposure throughout all classes in middle school. In otherwords, each student only experiences about 15 percent of the diversity of social environmentsavailable in all French middle schools. Although the average student could not experience allthis diversity because of the existing segregation at each time, the actual value is quite far fromthe upper bound (81 percent).

Among the 630,466 from the balanced panel, 545,250 (86 percent) remained in the sameschool all four years. This indicates that mobility across schools is very limited. Therefore, itmakes sense to measure the within-school SEM index. To that end, we focus on the restrictedbalanced panel of the 545,250 students who remained in the same school all four years. The SEMindex is slightly lower for this sample at 12 percent instead of 15 percent. If SEM within eachschool was optimal, i.e. if all upper class students and all lower class students within each schoolhad the same lifetime exposure, this SEM index would reach 20 percent: as long as students donot change schools, the social segregation is such that middle school principals could not gettheir students to experience more than 20 percent of the variety of the social environments inthe country. If we compare the individual variances to the within-school variance instead of thetotal variance, we obtain the within-school SEM index, which equals 58 percent, with an upperbound of 93 percent. Overall, within-school mobility is quite substantial: this indicates that alarge share of students experiences a fair share of the social environments that exist in the schoolthroughout their four years.

Future work will provide a more in-depth analysis of segregation and social environmentmobility, which this case study is a preview of. We also plan to analyze social environment

189

Page 216: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

mobility in different contexts (e.g. residential mobility in France or in other countries).

4.5 Bibliography

Aaberge, R. (2001). Axiomatic characterization of the gini coefficient and lorenz curve orderings.Journal of Economic Theory, 101(1):115–132.

Aaberge, R. and Mogstad, M. (2014). Income mobility as an equalizer of permanent income.Discussion Paper 769, Statistics Norway Research department.

Bonhomme, S. and Robin, J.-M. (2009). Assessing the equalizing force of mobility using shortpanels: France, 1990–2000. The Review of Economic Studies, 76(1):63–92.

Bowlus, A. J. and Robin, J.-M. (2004). Twenty years of rising inequality in u.s. lifetime labourincome values. The Review of Economic Studies, 71(3):709–742.

Braddock II, J. H. and McPartland, J. M. (1989). Social-psychological processes that perpetu-ate racial segregation: The relationship between school and employment desegregation. TheJournal of Black Studies, 19(3):267–289.

Camargo, B., Stinebrickner, R., and Stinebrickner, T. (2010). Interracial friendships in college.Journal of Labor Economics, 28(4):861–892.

Crain, R. L. and Strauss, J. (1985). School desegregation and black occupational attainments:Results from a long-term experiment. Technical Report 359, Center for the Social Organi-zation of Schools, Baltimore.

Currarini, S., Jackson, M. O., and Pin, P. (2009). An economic model of friendship: Homophily,minorities, and segregation. Econometrica, 77(4):1003–1045.

Cutler, D. M. and Glaeser, E. L. (1997). Are ghettos good or bad? The Quarterly Journal ofEconomics, 112(3):827–872.

Duncan, O. D. and Duncan, B. (1955). A methodological analysis of segregation indexes.American Sociological Review, 20(2):210–217.

190

Page 217: Inégalités scolaires, ségrégation et effets de pairs

4.5. Bibliography

Echenique, F. and Fryer, R. G. (2007). A measure of segregation based on social interactions.The Quarterly Journal of Economics, 122(2):441–485.

Frankel, D. M. and Volij, O. (2011). Measuring school segregation. Journal of Economic Theory,146(1):1–38.

Gottschalk, P. and Spolaore, E. (2002). On the evaluation of economic mobility. The Review ofEconomic Studies, 69(1):191–208.

Lorenz, M. O. (1905). Methods of measuring the concentration of wealth. Publications of theAmerican Statistical Association, 9(70):209–219.

Marmaros, D. and Sacerdote, B. (2006). How do friendships form? The Quarterly Journal ofEconomics, 121(1):79–119.

Massey, D. S. and Denton, N. A. (1988). The dimensions of residential segregation. SocialForces, 67(2):281–315.

Moffitt, R. A. and Gottschalk, P. (2002). Trends in the transitory variance of earnings in theunited states. Economic Journal, 112(478):C68–C73.

Prais, S. J. (1955). Measuring social mobility. Journal of the Royal Statistical Society. Series A(General), 118(1):56–66.

Shorrocks, A. (1978a). Income inequality and income mobility. Journal of Economic Theory,19(2):376–393.

Shorrocks, A. (1978b). The measurement of mobility. Econometrica, 46(5):1013–1024.

Wells, A. S. and Crain, R. L. (1994). Perpetuation theory and the long-term effects of schooldesegregation. Review of Educational Research, 64(4):531–555.

Yaari, M. E. (1988). A controversial proposal concerning inequality measurement. Journal ofEconomic Theory, 44(2):381–397.

191

Page 218: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

4.A Mathematicalproofs

4.A.1 EquivalenceofthetwodefinitionsoftheGiniindex

We prove here that the definitions of the Gini index provided in equations (4.2) and (4.3)are equivalent, i.e.:

G = 1− 2

∫ 1

0

L(u) du =1

2N2

N∑i=1

N∑j=1

|yi − yj| (4.39)

Without losing generality, we can assume that i < j implies yi < yj , i.e. that the incomesare sorted in ascending order. Under that assumption, the double sum from the right hand sidecan be rewritten:

N∑i=1

N∑j=1

|yi − yj| =∑yj≥yi

(yj − yi) +∑yj<yi

(yi − yj)

= 2∑yj≥yi

(yj − yi)

= 2N∑i=1

N∑j=i

(yj − yi)

1

2N2

N∑i=1

N∑j=1

|yi − yj| =1

N2

N∑i=1

N∑j=i

(yj − yi)

We now transform this double sum into a double integral, by noting that if x = i/N , F−1(x) =

yi:

1

N2

N∑i=1

N∑j=i

(yj − yi) =

∫ 1

0

∫ 1

x

(F−1(t)−F−1(x)

)dt dx

=

∫ 1

0

[∫ 1

x

(F−1(t)−F−1(x)

)dt]

dx

=

∫ 1

0

[∫ 1

x

F−1(t) dt− (1− x)F−1(x)

]dx

Note that ∫ 1

0

F−1(x) dx = y

192

Page 219: Inégalités scolaires, ségrégation et effets de pairs

4.A. Mathematical proofs

and ∫ 1

x

F−1(t) dt =∫ 1

0

F−1(t) dt−∫ x

0

F−1(t) dt = y − L(x)

Therefore

1

N2

N∑i=1

N∑j=i

(yj − yi) =

∫ 1

0

[∫ 1

x

F−1(t) dt− (1− x)F−1(x)

]dx

=

∫ 1

0

[y − L(x)−F−1(x) + xF−1(x)

]dx

=

∫ 1

0

[xF−1(x)− L(x)

]dx

We integrate the first term under the integral by parts, noting that a primitive of F−1 is yLaccording to definition (4.1):

1

N2

N∑i=1

N∑j=i

(yj − yi) =

∫ 1

0

[xF−1(x)− L(x)

]dx

=

∫ 1

0

xF−1(x) dx−∫ 1

0

L(x) dx

=[x · yL(x)

]10− 2

∫ 1

0

L(x) dx

= 1− 2

∫ 1

0

L(x) dx

which proves equality (4.39).

4.A.2 Normalizationoftheexposureindex

The normalized exposure index is defined by

P =1

p(1− p)

K∑k=1

Nk

N(pk − p)2 (4.40)

We are interested in the extreme values of

f(p) =K∑k=1

Nk(pk − p)2 (4.41)

193

Page 220: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

subject toK∑k=1

Nkpk = p (4.42)

where p = (pk)k∈1,...,K ∈ [0; 1]K .

We introduce the Lagrangian:

L(p, λ) =K∑k=1

Nk(pk − p)2 − λ

(K∑k=1

Nkpk − p

)(4.43)

and we differentiate with respect to pk:

∂L∂pk

(p, λ) = 2Nk(pk − p)− λNk (4.44)

The derivative equals 0 if and only if pk = p + λ/2. Plugging this equality in the constraint(4.42) shows that λ must equal zero, therefore pk ≡ p for all k. This case corresponds to theminimal value of the exposure index (P = 0). Since the Lagrangian has no other extremum,the maximum values are reached on the corners of the domain [0; 1]K , i.e. if pk ∈ 0; 1 for allk. In that case, p2k = pk, therefore with the constraint (4.42):

f(p) =K∑k=1

Nk(pk−p)2 =K∑k=1

Nk(pk−2 ·p ·pk+p2) = N ·p−2 ·N ·p2+N ·p2 = N ·p(1−p)

(4.45)Hence the normalization in equation (4.40).

4.A.3 Normalizedexposureisequaltotheexposuregap

The normalized exposure index is defined by

P =1

p(1− p)

K∑k=1

Nk

N(pk − p)2

We first want to show thatP = 1− µB

p

where µB is the average exposure of group B to group A.

194

Page 221: Inégalités scolaires, ségrégation et effets de pairs

4.A. Mathematical proofs

Denote NB = N(1 − p) the number of individuals in group B and NBk = Nk(1 − pk) the

number of individuals from group B in cluster k. Then, the definition of µB is:

µB =1

NB

K∑k=1

NBk pk =

1

N(1− p)

K∑k=1

Nk(1− pk)pk =K∑k=1

Nk

N· pk(1− pk)

1− p

Multiply the first two equations by p(1− p):

p(1− p)P =K∑k=1

Nk

N(pk − p)2

p(1− p)P = p(1− p)− (1− p)µB = p(1− p)−K∑k=1

Nk

Npk(1− pk)

We need to show thatK∑k=1

Nk

N(pk − p)2 = p(1− p)−

K∑k=1

Nk

Npk(1− pk)

i.e.

p(1− p) =K∑k=1

Nk

N(pk − p)2 +

K∑k=1

Nk

Npk(1− pk)

We start from the right hand side of this last equality:K∑k=1

Nk

N(pk − p)2 +

K∑k=1

Nk

Npk(1− pk) =

K∑k=1

Nk

N

[(pk − p)2 + pk(1− pk)

]=

K∑k=1

Nk

N

[p2k − 2p · pk + p2 + pk − p2k

]= p2 + (1− 2p)

K∑k=1

Nk

Npk

= p2 + (1− 2p) · p

= p(1− p)

because the sum of Nk/N is one and the sum of (Nk/N)pk is the weighted average of pk, whichis equal to p. Hence the intermediary result:

P = 1− µB

p

195

Page 222: Inégalités scolaires, ségrégation et effets de pairs

4. Measuring Social Environment Mobility

Introduce µA, the average exposure of the reference group to itself. The average exposure ofthe population to the reference group is equal to p. It is also equal to the weighted average ofthe exposures of groups A and B, i.e.:

p = p · µA + (1− p) · µB

Therefore, if p = 0

µA = 1− 1− p

pµB

which yields the final result:

µA − µB = 1− 1− p

pµB − µB = 1− µB

p= P

4.A.4 UpperenvelopeoftheLorenzcurveoflifetimeso-

cialenvironments

As stated in section 4.3.2, ”in the best case scenario, there is no difference in µi betweenindividuals from the reference group and between individuals from the group B, i.e. µi = µg if i ∈ g

where g denotes group A or B: if SEM is optimal, it will eliminate differences within each group,but it cannot eliminate differences between the two groups.”

The values of the exposures in each group can be derived from equation (4.24):

µA = p(1− P ) + P

µB = p(1− P )

Since group B has the lowest average exposure to the reference group and it represents ashare 1− p of the population, the inverse of the cumulative distribution function is given by

F∗−1(u) =

µB = p(1− P ) if u < 1− p

µA = p(1− P ) + P otherwise(4.46)

The cdf is piecewise constant, therefore the Lorenz curve, which is defined by

L∗(u) =1

p

∫ u

0

F∗−1(t) dt (4.47)

196

Page 223: Inégalités scolaires, ségrégation et effets de pairs

4.A. Mathematical proofs

is continuous and piecewise linear: it is a spline of degree one, with a knot at u = 1− p (at thelevel of the discontinuity in F∗−1). We always have L∗(0) = 0 and L∗(1) = 1, therefore weonly need to determine L∗(1− p) in order to draw the curve in Figure 4.6:

L∗(1− p) =1

p

∫ 1−p

0

p(1− P ) dt = (1− p)(1− P )

197

Page 224: Inégalités scolaires, ségrégation et effets de pairs