introduction aux méthodes de sondage -...

40
Introduction Objectif d’un sondage Caractéristiques d’un échantillon Méthodes de sondage Notations et conventions Introduction aux méthodes de sondage Myriam Maumy-Bertrand 1 1 IRMA, Université de Strasbourg Strasbourg, France Master 2ème Année 05-10-2011 Myriam Maumy-Bertrand Introduction aux méthodes de sondage

Upload: others

Post on 01-Jan-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Introduction aux méthodes de sondage

Myriam Maumy-Bertrand1

1IRMA, Université de StrasbourgStrasbourg, France

Master 2ème Année 05-10-2011

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Ce chapitre s’appuie essentiellement sur deux livres :« Éléments de statistiques »,de Jean-Jacques Droesbeke,Université de Bruxelles, 2001.« Les techniques de sondage »de Pascal Ardilly,éditions Technip, 2006.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sommaire

1 Introduction

2 Objectif d’un sondage

3 Caractéristiques d’un échantillon

4 Méthodes de sondage

5 Notations et conventions

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionRecensement : Observation exhaustive de tous les élémentsd’une population.

DéfinitionSondage : Méthode qui permet de construire un échantillon etqui prélève qu’une partie des informations existantes.

Le recensement semble a priori plus naturel. Ne sommes-nouspas sûrs d’avoir plus de précision et un résultat de meilleurequalité en relevant toutes les informations possibles ?

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Historique

17ème siècle : Changement d’idée ! L’école d’« arithmétique politique » anglaise et l’apparition despremiers résultats de la théorie des probabilités suscitentde l’intérêt pour les relevés partiels.Fin du 19ème siècle : Le concept de représentativitéd’un échantillon est discuté.Après 1925 : La question qui se pose naturellement est :« Comment choisir un échantillon ? »

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Une polémique commence.

DéfinitionL’échantillonnage probabiliste : Attribuer à chaque individules mêmes « chances » d’être choisi.

Opposition entre :les tenants de l’échantillonnage probabiliste ;et ceux dont l’objectif est plus pragmatique : Commentobtenir, en un temps minimal et au moindre coût, unéchantillon dont les qualités soient suffisantes pour« représenter » une population ?

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Comme dans toutes les réalisations humaines, ces deuxsolutions présentent des qualités mais aussi des défauts.Une démarche scientifique, soucieuse de passercorrectement du partiel à l’exhaustif, plaide généralementpour l’échantillonnage probabiliste.Nous essayerons d’en donner les raisons dans ce cours.Si le recensement se révèle théoriquement meilleur qu’unsondage parcequ’il est exhaustif, il n’en est pas moins vraique le sondage se voit souvent préféré.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Pourquoi le sondage se voit souvent préféré à unrecensement ?Parce qu’il est :

plus facile à obtenir,d’un coût moins élevé.

Autres avantages

Le sondage est souvent confié à une équipe réduite etspécialisée. Ainsi nous évitons des erreurs dues :

au caractère inexpérimenté des personnes chargées del’enquêteaux difficultés d’être exhaustif.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Si un échantillon probabiliste est synonyme d’une rigueurscientifique plus grande, les sondages dits judicieux comme

les sondages par choix raisonné,

les sondages selon la méthode des quotas, qui seraprésentée dans ce cours

sont parfois applicables là où les premiers ont échoués.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Ne condamnons pas systématiquement les enquêteseffectuées par les organismes privés qui recourent souventà la méthode des quotas.

Comme nous venons de le dire, la méthode des quotasconstitue parfois la seule façon d’agir pratiquement. Ellepeut être même justifiée sous des hypothèses de travailbien spécifiques.

Le caractère empirique des méthodes implique que cessondages doivent être organisés par des personnescompétentes et intègres. Leur interprétation doit se faireavec circonspection.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

ExempleLes « sondages à chaud » effectués au cours des émissionstélévisées pour mesurer le degré de persuasion de l’orateurpolitique invité.

ExempleLes « sondages » obtenus par certains journaux qui sollicitentdes réponses de leurs lecteurs.

Nous ne pouvons en aucun cas imaginer que ces relevéspartiels et partiaux traduisent l’opinion de toute une population !

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Dans ce cours, nous trouverons :une présentation des méthodes qui proposent, d’un point devue statistique, des propriétés qui permettent d’atteindre unobjectif précis :Comment, à partir d’une information partielle,pouvons-nous obtenir certaines conclusions au niveau dela population toute entière ?

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Si nous nous intéressons à certains paramètres de lapopulation, il est IMPOSSIBLE d’en connaître la valeurexacte sur la base de l’information fournie par l’échantillon.

Néanmoins, l’échantillon peut donner une estimation deces paramètres, comme nous allons le voir dès le chapitredeux.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sommaire

1 Introduction

2 Objectif d’un sondage

3 Caractéristiques d’un échantillon

4 Méthodes de sondage

5 Notations et conventions

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Situation générale :Population U composée de N individus ou éléments appelésunités statistiques. N est la taille de la population U,supposée finie.

Exemples de population :L’ensemble des touristes d’un pays, l’ensemble des ménagesd’un pays, la production de pièces mécaniques d’une usine...

Nous pouvons dresser une liste exhaustive des éléments de lapopulation U, appelée base de sondage où chaque élémentest représenté soit par son nom soit par un numéro comprisentre 1 et N.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Objectif :Relever auprès de chaque individu de la population U, à l’aided’un questionnaire ou d’un autre moyen de collecte (queconnaissez-vous comme autre moyen ?), la valeur d’une ou deplusieurs variables d’intérêt.

Soit une variable Y , appelée variable d’intérêt, dont lesvaleurs associées à chaque unité de sondage sont notéesy1, . . . , yN .

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Retour aux trois exemplesU = touristes⇒ Y =budget dépensé

U = ménages⇒ Y = revenu du ménage

U = pièces produites ⇒ Y = caractère défectueux ou nonde la pièce.

RemarqueLes deux premières variables sont quantitatives, la dernièrene l’est pas ! Quelle est donc sa nature ?

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

RemarqueLa dernière variable est dichotomique.

Dans le cas de notre dernier exemple, pour représenter cettevariable, nous la quantifions au moyen d’une fonctionindicatrice selon laquelle la valeur Y prise par la pièce estégale à 1 si la pièce est défectueuse, 0 sinon.

RemarqueCe processus se généralise dès que nous avons à faire à unevariable dichotomique !

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

NotationsAfin de ne pas alourdir la terminologie : deux simplifications.

1 Représenter chaque individu par son indice k et non paruk .Notation : k ∈ U.

2 Assimiler les individus interrogés par le questionnaire etleurs caractéristiques.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionNous utilisons le terme « population » pour désigner

aussi bien l’ensemble des individus susceptibles d’êtresoumis à l’étude

que la distribution des valeurs d’une variable associée àces individus.

RemarquePour simplifier la présentation de ce cours, la variable étudiéesera quantitative.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Dans ce cas, une population est résumée partiellement pardes paramètres comme :

la moyenne µ =1N

∑k∈U

yk ,

le total T =∑k∈U

yk = Nµ,

la variance σ2 =1N

∑k∈U

(yk − µ)2.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Par exemple, l’objectif d’une étude peut consister às’interroger sur leur valeur.

Leur valeur exacte ne peut être connue que si nousdisposons de toutes les valeurs de la population.

Dans le cas contraire, nous procédons à une estimationprésentée au moyen d’un exemple.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Nous nous intéressons à une population de tailles (encentimètres) dont la moyenne µ est inconnue.

Si nous prélevons un échantillon, il semble opportun decalculer sa moyenne arithmétique avec l’espoir que cettedernière nous permette d’estimer la valeur de µ.

Remarque

En général, la moyenne arithmétique de l’échantillon seradistincte de la moyenne µ de la population.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionNous disons que la première est une estimation de laseconde, notée µ̂.

DéfinitionL’erreur que nous commettons en remplaçant µ par µ̂ résulte dufait qu’une partie de la population a été omise, appelée erreurd’échantillonnage.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Deux questionsDeux questions se posent naturellement :

1. Comment choisir un estimateur d’un paramètre à partirdes valeurs fournies par l’échantillon ?Nous venons d’évoquer l’estimateur pour la moyenne, maisd’autres cas sont envisageables comme un estimateurpour le total, pour la variance, pour la médiane...

2. Est-il possible de quantifier l’erreur d’échantillonnageafin de se rendre compte de son importance en fonction dela connaissance que nous avons sur la population etl’échantillon ?

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Il est évident que les réponses à ces questions dépendentde la manière de prélever l’information.

Et c’est ce sujet que nous allons aborder dans leparagraphe suivant !

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sommaire

1 Introduction

2 Objectif d’un sondage

3 Caractéristiques d’un échantillon

4 Méthodes de sondage

5 Notations et conventions

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Définitionéchantillon : Il est composé de n individus, où n varie de 1 àN. L’échantillon est dit alors de taille n. Le prélèvement desindividus est, en général, de telle sorte que les individus soientdistincts des uns des autres.

RemarqueDans ce cas, l’échantillon S est un sous-ensemble de lapopulation U (U comme univers). Nous noterons : S ⊂ U.

RemarqueS est utilisé pour rappeler que nous parlons d’un échantilloncar en langue anglaise, un échantillon se dit « sample ».

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

échantillon : des variables Yi pour lesquelles i ∈ S.Cas étudié ici : une seule variable d’intérêt notée Y .échantillon {Yi , i ∈ S} : une série statistique dont nouspouvons déterminer des paramètres comme la moyenne µ̂et la variance σ̂2 :

µ̂ =1n

∑i∈S

Yi , σ̂2 =1n

∑i∈S

(Yi − µ̂)2.

DéfinitionTaux de sondage :

f =nN,

avec n : taille de l’échantillon et N : taille de la population.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Ainsi, compte tenu du paragraphe précédent, les valeursde µ̂ et de σ̂2 sont des estimateurs (et non desestimations) des paramètres correspondants de µ et deσ2 (définis dans le slide 21) de la population U.

Maintenant, notre attention va porter sur leurs qualités etla possibilité de mesurer l’erreur d’échantillonnage(définie dans le slide 24). Dans ce but, nous allons préciserdans quelles circonstances cet objectif est atteint.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sommaire

1 Introduction

2 Objectif d’un sondage

3 Caractéristiques d’un échantillon

4 Méthodes de sondage

5 Notations et conventions

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionMéthode de sondage ou de tirage : Définir la façon dont nousdevons prélever des individus (des valeurs) dans unepopulation afin de constituer un échantillon.

RemarqueNous distinguons deux grandes catégories de sondages :

les sondages probabilistes ;les sondages empiriques.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionUn sondage est probabiliste ou aléatoire si chaque individude la population a une probabilité donnée connue d’avance etnon nulle d’appartenir à l’échantillon. Cette probabilité estappelée probabilités d’inclusion ou probabilité de sélection.Nous parlons alors d’échantillon aléatoire ou d’échantillonprobabiliste.

DéfinitionLes sondages empiriques sont ceux qui ne permettent pas decalculer la probabilité d’inclusion des individus. Comme nousl’avons déjà dit il s’agit principalement des méthodes de quotasou encore de la méthode d’unités-types.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

DéfinitionUn plan de sondage est l’association des deux élémentssuivants :

la méthode de tirageet l’expression de l’estimateur.

RemarquePour une méthode de tirage donnée, il existe de nombreuxestimateurs concurrents.Réciproquement, un estimateur donné peut être appliqué à deséchantillons sélectionnés selon des méthodes de tiragedifférentes.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sélectionner un échantillon avec une méthode de tiragealéatoire équivaut à doter la population d’une distributionde probabilités qui définit un certain nombre depropriétés des valeurs retenues dans l’échantillon ou desparamètres construits à partir de ces derniers.

Ainsi, si nous observons une valeur dans la population, ladonnée observée y est considérée comme la valeur d’unevariable aléatoire Y admettant pour loi la distribution deprobabilités de la population.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Individus sélectionnés avec la même probabilité⇒ Sondage Aléatoire à Probabilités Égales (SAPE).

Individus sélectionnés avec des probabilités différentes lesunes des autres⇒ Sondage Aléatoire à Probabilités Inégales (SAPI).

Pour chaque méthode de tirage, deux manières de réaliser untel sondage selon que nous effectuons un prélèvement avec ousans remise, ce qui fait déjà quatre méthodes de tiragealéatoire.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Sommaire

1 Introduction

2 Objectif d’un sondage

3 Caractéristiques d’un échantillon

4 Méthodes de sondage

5 Notations et conventions

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Dans ce cours, nous nous intéresserons qu’à l’estimation d’unparamètre initial θ qui a la forme d’une moyenne, d’uneproportion ou d’un total.Il est à noter qu’une proportion est une moyenne particulière. µet T sont tous deux des sommes pondérées des valeurs Yi detous les individus de la population. Nous disons qu’il s’agit deparamètres fonction linéaire des Yi .Par conséquent les estimateurs utilisés seront construits sur lemême modèle que le paramètre qu’ils cherchent à estimer.Nous chercherons donc des estimateurs linéaires, qui fontintervenir non seulement les Yi des individus i de l’échantillonsmais aussi un système de poids par individu i , notés Wi(S),où S désigne l’échantillon de taille n.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Ainsi, l’estimateur θ̂ est de la forme :

θ̂ =∑i∈S

Wi(S)Yi .

Wi(S) est le poids de sondage (W comme weight en anglais).Toutes nos préoccupations tourneront autour du choix de cespoids.Le problème du sondage est un problème de pondération :chaque individu de l’échantillon représente un certain nombred’individus de la population et c’est pour cette raison qu’il doitêtre dilaté de Wi(S).

Myriam Maumy-Bertrand Introduction aux méthodes de sondage

IntroductionObjectif d’un sondage

Caractéristiques d’un échantillonMéthodes de sondage

Notations et conventions

Dans la suite de ce cours, sauf mention contraire, noussupposerons que la taille de la population, notée N, estconnue.Si ce n’est pas le cas, nous serions amenés à produire unestimateur sans biais de N pour pouvoir estimer desmoyennes dans le cas de plans à probabilités d’inclusionquelconque.Dans le cas des plans à probabilités d’inclusion égales et detaille fixe, il est nécessaire de connaître N pour estimer sansbiais un total.

Myriam Maumy-Bertrand Introduction aux méthodes de sondage