l’échantillonnage des enquêtes...

41
L’échantillonnage des enquêtes ménages - hors Emploi et DOM - Enquêtes et Sondages - CNAM - UE STA 108 Sylvie Rousseau 12/01/07

Upload: others

Post on 30-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

L’échantillonnage des enquêtes ménages

- hors Emploi et DOM -

Enquêtes et Sondages - CNAM - UE STA 108

Sylvie Rousseau 12/01/07

Page 2: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

2

Sommaire

I. Les principes généraux

II. La principale base de sondage : l’échantillon-maître

III. L’échantillonnage d’une enquête

Page 3: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

3

I. Principes généraux

I.1. Objectif d’une enquête-ménagesI.2. Cadre institutionnelI.3. Définition d’un ménageI.4. L’unité d’échantillonnage I.5. Principes d’échantillonnage I.6. Modes de collecte

Page 4: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

4

I.1. Objectif d’une enquête-ménages

Fournir de l’information sur la population pour éclairer le débat socialExemples :

• un seuil de revenu ;

• la proportion de locataires ;• l’état de santé moyen de la population ;• …

Page 5: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

5

I.2. Cadre institutionnelProgramme d’enquêtes annuel visé par le Conseil National de l’information Statistique (publié au JO).

Le CNIS assure la concertation entre les producteurs et les utilisateurs de statistiques publiques.Enquêtes « d'intérêt général et de qualité statistique », ayant successivement reçu :

Avis d'opportunité : l'enquête répond à un besoin d'intérêt public, elle ne fait pas double emploi avec d'autres sources statistiques ;Avis de conformité attestant de la qualité de l'opération.

Loi sur le secret statistique (1951)Loi "Informatique et libertés" (1978)

Page 6: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

6

I.3. Définition d’un ménage

ménage-logement » : ensemble des personnes habitant le même logement au titre de leur résidence principale

« ménage-unité de vie » : ensemble des personnes partageant la même résidence habituelle et le même budget

Page 7: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

7

I.4. L’unité d’échantillonnage

C’est le logement « ordinaire »En l’absence de registres de populationGrâce au recensement de la population et au suivi de la construction neuve

On construit des échantillons de logts ordinairesOn atteint les ménages et/ou les individus par l'intermédiaire de leur logement

Page 8: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

8

I.5. Principes d’échantillonnage

Echantillons probabilistes de logementsTous les logements principaux possèdent la même probabilité de participer à l’enquêtei.e. chaque logt tiré représente w ménages

Ex : w ≅ 2 000 pour une enquête de taille 10 000

à moins de viser davantage certaines populations

Un même logt ne peut-être interrogé pour des enquêtes distinctes entre deux recensements

Page 9: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

9

I.6. Modes de collecte

Enquêtes généralement en face à faceQuelques enquêtes par téléphone

Camme, ré-interrogations Loyers et Charges

Coûts de collecte Stabilité du réseau d'enquêteurs

localisation de l’échantillon

Page 10: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

10

Conclusion

Tirage des échantillons en 2 temps

1ère phase de localisation des enquêtes, i.e. tirage de bases de sondage intermédiaires:

l’Echantillon-Maître (EM99) pour les logts recensés en 1999 La Base de Sondage des Logements Neufs (BSLN) pour les

logements construits après mars 1999

2ème phase de tirage des échantillons des enquêtes dans ces 2 bases de sondage intermédiaires

Page 11: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

11

II. La principale base de sondage: l’Echantillon-Maître (EM)

Entre contraintes pratiques et désir de précision

Etablir une réserve de logements localiséepour alimenter la plupart des enquêtes ménages

hors DOM, enquête Emploi, enquêtes locales,…

Optimiser la précision des résultats nationaux

Page 12: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

12

Page 13: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

13

1. Taille de l’EM99

2 022 889 logements 7 % des logts recensés en mars 99

Réserve calibrée dans l’optique des prévisions suivantes :

10 enquêtes nationales par année,de 10 000 ménages chacune en moyenne,pendant 6 ans (d’octobre 2001 à fin 2007)

Page 14: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

14

2. Constitution de l’EM99

L’EM s’obtient selon un tirage stratifiéà 1 ou 2 degrés selon la strate

Page 15: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

15

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

Page 16: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

16

a. Stratification quadrillant le territoire selon les régions et la densité d’habitat

Collecte des enquêtes en Direction RégionaleLe degré d’urbanisation explique assez bien le comportement des ménages

(ex : logement, conditions de vie, …)

Cette stratification est un élément de qualité

Page 17: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

17

87 strates de tirage

Strate de gestion

Nombre de communes* au RP 99

Nombre d’unités urbaines au RP 99

Nombre de régions

0 30 611 - 22 1 3 167 1 762 22 2 1 097 180 22 3 1 294 52 20 4 396 1 1

Total 36 565 1 995 87 * : tous arrondissements compris

Page 18: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

18

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

Page 19: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

19

b. Localisation des enquêtes dans des UP (i) Définition des UP

En strates 0, 1 et 2, une UP correspond au rayon d’action d’un enquêteurEn strates 2, 3 et 4 une UP = une UU

Page 20: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

20

b. Localisation des enquêtes dans des UP (i) Définition des UP

En strate 0, une UP est formée de :- une ou plusieurs communes rurales contigües- situées dans la même région - où résident des ménages au profil de revenu voisin- ayant entre 1 800 à 3 600 logements principaux

⇒plus de 30 000 communes rurales regroupées en 2 227 UP

En strate 1, une UP est formée de :- de 1 ou 2 UU proches de la même région- de profil de revenu moyen le plus semblable possible - d’au moins 1 800 logements principaux

Page 21: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

21

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – réserve minimale

En strates 0, 1 et 2, chaque UP contient au moins

30 × 10 × 6 = 1800 logements

1 UP = 1 enquêteur 10 enquêtes /an pendant 6 ans≤ 30interviews

Dans les strates 2, 3 et 4 : UP de plus de 20000 habitants (tirage d’US)

Page 22: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

22

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP

Dans une des strates 0, 1 ou 2 d’une région donnée de taille 400 000 logts par exemple, on retiendra :

On enquête environ 1 UP = 1 enquêteur 1 logement sur 2000 ≥ 20 interviews

UP10201

2000400000

Page 23: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

23

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP

Dans les strates 3 et 4, toutes les UP sont retenues et impactées avec un taux de sondage moyen de 1/2000Unité Urbaine

Nombre d'habitants

Nombre de logtsprincipaux

Nombre de FA

Nombre d’enquêteurs

Angoulême 100 000 46 000 23 1

2

≅ 4

≅ 7

Paris 9 644 507 4 039 349 2 020 ≅80

Reims 215 000 94 000 47

Nantes 500 000 234 000 117

Lille 1 001 000 388 000 194

Page 24: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

24

b. Localisation des enquêtes dans des UP (iii) Tirage des UP

Stratifié dans 66 strates de tirage croisant 22 régions et les 3 strates de gestion 0, 1 et 2A probabilités inégales des UP proportionnellement à leur nombre de résidences principales dans la strate de tirageEquilibré sur des critères de revenu et d'âge au niveau de groupes de régions

revenu net total imposable (source DGI 1996)effectifs des 3 tranches d'âges [0,19] , [20,59] et [60,+] ans

(source RP99)

Page 25: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,
Page 26: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

26

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

Page 27: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

27

c. Choix de districts dans les UP retenues de plus de 20 000 habitants

Uniquement en strates de gestion 2, 3 et 4Tirage stratifié par groupes de communes pour garantir la dispersion géographique des districts Tirage à probabilités égales des districts dans l’UU (ex : 1 district sur 20 en strates 3 et 4)Tirage équilibré sur l’UU par la méthode du Cube sur les critères de revenu et d’âge

Page 28: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,
Page 29: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

29

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

Page 30: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

30

d. Désignation des logts retenus dans l’EM

Strates 0 et 1 : tous les logts des UP tirées

Strates 2, 3 et 4 : tous les logts des US sélectionnées dans les UP tirées

Page 31: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

31

Page 32: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

32

Ile de France

Page 33: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

33

Bretagne

Page 34: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

Quelques données numériques sur l'Echantillon-Maître

Strate 0 Strate 1 Strate 2 Strate 3 Strate 4 Total

Nombre d’UP au RP99

2 227 975 180 52 1 3 435

Nombre d’UP-EM 128 75 93 52 1 349

Nombre de communes EM

2 018 284 610 1317 415 4 644

Nombre total de logements RP99

7 382 976 4 934 454 3 839 693

7 988 099

4 549 934 28 696 156

Nombre total de logements EM

451 776 444 978 497 962 399 845 228 328 2 022 889

Proportion de logements EM

6 9 13 5 5 7

Page 35: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

35

Remarque

En vue du tirage des enquêtes dans l’EM (qui obéit à un plan stratifié par groupes de communes), on a construit des groupes de communes en strates 0 et 1, avec :

- une commune en strate 1 - un regroupement de communes rurales

d’au moins 100 logements en strate 0

Page 36: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

36

III. Echantillonnage d’une enquête

On échantillonne surtout des logements recensés comme principaux On sélectionne également des résidences secondaires, occasionnelles ou vacantes au RP99 pour tenir compte des changements intervenus depuis 1999On tire des logements neufs avec la même probabilité que les principaux (i.e. tous possèdent la même pondération)

Page 37: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

37

III. Echantillonnage d’une enquêteDes enquêtes impactent davantage certaines catégories de populations

Mais après tirage de l’échantillon d’une telle enquête, l’ EM doit continuer d’être « représentatif » pour les enquêtes ultérieures

⇒ Tirage en 2 phases1) Tirage de S1 (n1 > n ) dans l’EM, à probas égales 2) Tirage de S2 dans S1 de taille n, à probas inégalesEnfin marquage dans l’EM des unités de S1

1 /2 1 /3

2 /3

1 /1

Page 38: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

38

III. Echantillonnage d’une enquête

On impacte toutes les UP de l’EM Plan stratifié par groupes de communesTirage systématique des logts, dans chaque strate, sur un fichier trié par catégorie de logt au RPSi besoin, tirage en 2 phases

Page 39: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

39

Page 40: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

40

Conclusion et perspectives

Le contexte du nouveau recensement Enjeux organisationnels et choix méthodologiques

Choix des critères de stratificationZones d’emploi, activités économiques dominantes, Prix du locatif, proximité à des équipements, …

D’autres modes de collecteInternet, téléphone

De nouveaux besoins Panel de ménages, enquêtes locales

Page 41: L’échantillonnage des enquêtes ménagescedric.cnam.fr/~saporta/STA108%20Enqu%EAtes%20m%E9nages...Tirage des échantillons en 2 temps 1ère phase de localisation des enquêtes,

41

Bibliographiewww.cnis.frwww.insee.frL'échantillon maître de 1999 et application au tirage des unités primaires par la macro "Cube", L.Wilms, Journées de Méthodologie Statistique, 2002. La correction de la non-réponse par repondération et par imputation, N.Caron, Document de travail n°M0502,http://www.insee.fr/fr/nom_def_met/methodes/doc_travail/docs_doc_travail/M0502.pdfTechniques de sondage, P.Ardilly, Technip, 2006La méthode de partage des poids, P. Lavallée, Dunod, 2004