module : statistique descriptive eléments du...

14
1 Module : STATISTIQUE DESCRIPTIVE Eléments du cours INTODUCTION ET CHAPITRE 1

Upload: hatuyen

Post on 13-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

1

Module : STATISTIQUE DESCRIPTIVE

Eléments du cours

INTODUCTION ET CHAPITRE 1

Page 2: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

2

INTRODUCTION AU COURS

I- Définitions et Objectifs de la statistique

1- les objectifs de la statistique

La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de

nombreux faits correspondant à l’observation d’un phénomène , dans le but de

rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de

décision.

Les objectifs de la statistique descriptive sont de décrire, de synthétiser, de

comparer des données recueillies sur un phénomène donné au cours des

différentes périodes ou en différents endroits.

2- Définitions

La statistique est une méthode de collecte, de présentation et d’analyse des

observations relatives à des individus appartenant à un même ensemble défini de

manière précise afin de mettre en évidence certaines propriétés générales de cet

ensemble.

La statistique descriptive est la partie de la statistique dont le rôle est de décrire un

phénomène ; en d’autres termes ; à le mesurer, à l’évaluer, à classer les mesures, à

présenter ces mesures sous forme de tableaux ou graphiques, à synthétiser ces

mesures par quelques indicateurs de manière à avoir une idée rapide et simple du

phénomène étudié et aussi pour permettre de faire des comparaisons.

Remarque : Il faut faire une distinction entre les statistiques et la statistique.

Les statistiques désignent les données quantitatives (chiffrés), c’est

l’information brute sous forme de données numérique

Exemple : Les statistiques de FMI , les statistiques de l’OMC ….

La statistique est la discipline qui s’attache à étudier ces données

numériques brutes dans le but de fournir le maximum des renseignements

sur le phénomène en question. Donc la statistique est une méthode

scientifique qui vise la description quantitative des chiffres bruts

Page 3: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

3

II- Apport de la statistique à la science économique :

a) La statistique est indispensable aux théoriciens de l’économie, puisqu’elle permet de

mettre en évidence l’interdépendance des phénomènes économiques et de vérifier la

validité de certaines hypothèses par confrontation de la théorie à la réalité.

b) La statistique est indispensable aux praticiens de l’économie, elle permet : aux

pouvoirs publics d’agir correctement en matière de politique économique et d’éviter le

déclenchement des cycles économiques négatifs (crises économiques) et permet aussi une

aide précieuse aux opérateurs privés dans leurs processus de prise de décisions en vue

d’une rationalisation optimale de la gestion des entités économiques.

III- Méthodes d’observation statistique

Deux méthodes principales pour collecter des données :

1- Recensement (enquête exhaustive)

Le recensement est une opération de collecte d’information qui porte sur toutes les

unités formant la population étudiée.

Exemple : Le Recensement général de la population en 2004 et en 2014

2- Enquête par sondage (enquête partielle)

C’est une opération portant sur une partie de la population. Les unités statistiques

concernées par ce sondage constituent un échantillon. Ce dernier est choisi de

manière à représenter la population mère

Exemple : L’enquête nationale sur la dépense des ménages en 2012

IV- Vocabulaire utilisé en statistique descriptive :

La statistique utilise comme toute science qui se respecte un vocabulaire et des

concepts spécifiques qu’il faut présenter et définir avant tout propos.

1- Population statistique (ou univers statistique) : c’est l’ensemble de tous les

individus auxquels l’étude statistique s’intéresse.

Exemples : étudiants de La faculté de droit

Parc de voiture de la wilaya de casa

Population urbaine

2- Unité statistique (ou individu statistique) : un élément de cet ensemble ou plus

précisément élément qui composent la population

Exemple : un étudiant de la faculté de droit

Une voiture de parc de la wilaya de casa

Page 4: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

4

3- L’échantillon : c’est une partie ou un sous ensemble de la population mère

Exemple : les étudiants de master de la faculté de droit

Les voitures de marque peugeot de la wilaya de casa

4- Caractère statistique : c’est la propriété retenue pour développer l’étude

statistique

Exemple : l’âge, la taille ; le poids, le niveau d’instruction…….

5- La Modalité : les modalités sont les différents états possibles d’un caractère ;

Exemple : Le caractère : sexe des étudiants

Modalités : féminin ou masculin

s

Un caractère peut être qualitatif ou quantitatif

a. Il est qualitatif lorsqu’ il ne peut être exprimé en valeur, on ne peut pas le

mesurer ou le quantifier mais seulement le repérer.

Exemple : la couleur des voitures

b. Il est quantitatif quand il peut être exprimé en valeur, il est mesurable ;

chiffrable.

Exemple : Le nombre d’enfants d’un couple

Un caractère peut être quantitatif discret (discontinu) ou quantitatif continu.

Il est quantitatif discret si ses modalités sont des nombres entiers isolés ;

Exemple : Le nombre de pièces dans un logement

Il est quantitatif continu si ses modalités sont exprimées par des intervalles

de valeurs ;

Exemple : Les classes de revenus

6- Variable statistique : chaque modalité d’un caractère est constituée par un

nombre ou un ensemble de valeurs, appelé variable. Selon la nature de la

variable il y a variable discrète et variable statistique continue.

Variable discrète prend des valeurs entières

Variable continue prend toute valeur dans un intervalle de mesure

Page 5: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

5

7- Classe : c’est un groupement de valeurs selon les intervalles qui peuvent être

– ou non – égaux ; une classe se définit par deux limites : la limite inférieure

appartient à la classe, la limite supérieure est exclue de la classe. La différence

entre les deux limites donne l’amplitude.

Exemple : les classes de salaires

8- L’effectif ou fréquence absolu : c’est le nombre d’individus ayant une valeur

de la modalité.

Exemple : 18 Femmes et 12 hommes

9- Fréquence relative : c’est la part de l’effectif de la modalité à l’effectif total

Exemple : f1=18/30 f2=12/30

10- Série statistique : c’est l’ensemble des valeurs qui mesurent le caractère.

V- Symboles mathématiques utilisés en STATISTIQUE.

1- les valeurs de caractère sont symbolisées par ni xxxx ......,,...,, 21 on parle des xi

Si la série est une série avec des classes les xi représenteront les centres de classes.

2- les effectifs sont symbolisés par ni nnnn .,.................,, 21 on parle des ni

L’effectif total est symbolisé par N .

3- la fréquence relative s’écrit : N

nf i

i

4-L’opérateur somme ∑ (se lit Sigma) ; On utilise ce symbole pour designer

l’opération Somme.

n

i

ini xxxxx1

21 ..........

Exemple : on a : 4321 xxxx =

4

1i

ix

5

2

5

2

5

2

44)(i

i

i i

ii bxabaxbax = a(x 2 )-(b) + ax 3 - b + ax 4 -b + ax 5 -b

= a ( 5432 xxxx ) – 4b.

Propriétés du sigma

ana .

ii xaax

naxax ii

iiii yxyx

5- - L’opérateur somme (se lit Pi).

On utilise ce symbole si la variable se multiplie.

n

n

i

i xxxx

....21

1

Exemple :x 1 x 2 x 3 =

3

1i

ix ; ax 2 ax 3 ax 4 =a 3

4

2i

ix

Page 6: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

6

Chapitre I : Elaboration des tableaux statistiques

et représentation graphique.

Avant toute représentation graphique des données statistiques, il est primordial de faire

une classification de ses données dans des tableaux statistiques

I- Présentation des tableaux statistiques. Le dépouillement (dénombrement) des données statistiques permet de les synthétiser dans

des tableaux statistiques.

A- Présentation générale du tableau statistique

Considérons une population statistique P composé de n individu et décrite suivant le

caractère C dont les modalités sont : m1 , m2, ……,mk .on désigne par ni le nombre

présentant la modalité mi d’effectif ou fréquence absolue. Ainsi nous aurons le

tableau suivant :

Caractère étudié Effectif ou

fréquence absolue

Fréquence relative Pourcentage

(%)

m1

m2

.

.

mi

.

.

.

mk

n1

n2

.

.

ni

.

.

.

nk

f1= n1/N

f2= n2/N

.

.

fi= ni/N

.

.

.

fk= nk/N

P1=f1 x100

P2=f2 x100

Pi=fi x100

.

.

.

Pk=fk x100

TOTAL Nn

k

i

i 1

11

k

i

if 1001

k

i

iP

N= effectif total

ni = nombre d’observation correspondant à la modalité mi

N = ki

k

i

i nnnnn

.........21

1

B- Cas d’un caractère qualitatif :

Une enquête sur la nationalité des touristes visitant le Maroc a concerné un échantillon de

500 touristes

Unité statistique : un touriste ;

Population : l'ensemble des touristes visitant le Maroc ;

Caractère étudié : nationalité ;

Type de caractère : qualitatif.

Les résultats obtenus sont condensés dans le tableau suivant :

Page 7: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

7

Nationalité Effectif (fréquence

absolue)

Fréquence

relative

Fréquence relative

En %

Française

Allemande

Italienne

Hollandaise

Belge

Américaine

autres

85

106

62

44

40

70

93

0.17

0.212

0.124

0.088

0.08

0.14

0.186

17

21.2

12.4

8.8

8

14

18.6

Total 500 1 100

B- cas d’un caractère quantitatif discret :

Exemple :

Une enquête chez 1000 commerçants porte sur le nombre d'employés.

-Unité statistique : un commerçant ;

-Population : l'ensemble des 1000 commerçants ;

-Caractère étudié : nombre d'employés ;

-Type de caractère : variable statistique discrète.

Les résultats obtenus sont condensés dans la distribution de fréquences suivante

Page 8: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

8

C- Cas d’un caractère quantitatif continu

Dans ce cas chaque modalité est une classe,[L1-L2[ et les classes peuvent être a

amplitudes égales ou inégales.- La limite inférieure de la classe fait partie de cette classe,

alors que la limite supérieure est exclue, mais fait partie de la classe suivante : [L1-L2[

- La 1ère

et la dernière classe de la série peuvent avoir des amplitudes indéterminées,

il convient de préciser leur limite.

- La colonne fi℅ cumulées croissante nous donne le ℅ des individus ayant une valeur

inférieure à xi.

- La colonne fi℅ cumulées décroissante nous donne le ℅ des individus ayant une

valeur supérieure à xi.

Exemple : On a mesuré le poids en kilogramme de 80 personnes.

-Unité statistique : une personne ;

-Population : l'ensemble des 80 personnes ;

-Caractère : poids en kilogramme ;

-Type de caractère : variable statistique continue.

POIDS Effectif(ni) ni c ni c fi% fic

croissant

fi c

décroissant

50-55

55-60

60-65

65-70

70-75

75-80

80-85

85-90

90-95

95-100

1

2

11

10

12

21

6

9

4

4

1

3

14

24

36

57

63

72

76

80

80

79

77

66

56

44

23

17

8

4

1.25

2.5

13.75

12.5

15

26.25

7.5

11.25

5

5

1.25

3.75

17.5

30

45

71.25

78.75

90

95

100

100

98.75

96.25

82.5

70

55

28.75

21.25

10

5

Total 80 - - 100 - -

I) Représentations Graphiques.

Les graphiques constituent un mode de présentation de résultats statistiques sous forme

de tracé géométrique qui permet une description immédiate et complète. Selon la nature

du caractère, il y’a différents types de représentations graphiques.

Page 9: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

9

A- Représentation graphique d’un caractère qualitatif :

Plusieurs types de graphiques sont utilisés pour représenter ce caractère, nous retenons 2

types : Les tuyaux d’orgue et le diagramme circulaire ou semi circulaire.

1-le diagramme en tuyaux d’orgue :

Ce sont des tuyaux dont les bases sont égales, alors que la hauteur est proportionnelle

à l’effectif ou à la fréquence relative de la modalité.

Exemple1 : 200 chefs de ménages sont répartis selon l’état matrimonial.

0

20

40

60

80

100

C M V D

ni

2-diagramme circulaire

Dans le diagramme à secteurs chaque modalité est représentée par un secteur dont

l'angle est proportionnel à l'effectif correspondant. La totalité de la circonférence

correspond à l'effectif total.

Pour calculer les secteurs angulaires on a la formule suivante αi=fix360°

Exemple : Pour le même exemple précédent, on doit déterminer pour chaque

nationalité l'angle proportionnel à l'effectif correspondant

Nationalité ni fi% αi°

Française

Allemande

Italienne

Hollondaise

Américaines

Belge

autres

85

106

62

44

40

70

93

17

21.2

12.4

8.8

8

14

18.6

61.2

76.32

44.46

31.68

28.8

50.4

66.96

TOTAL 500 100 360°

Caractère Effectif ni Fréquence fi

Célibataire (C) Marié (M)

Veuf (V) Divorcé (D)

70 90

10 30

0,35 0,45

0,05 0,15

∑ 200 1

Page 10: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

10

B- Représentation graphique d’un caractère quantitatif discret :

Il peut être représenté par 2 types de graphiques :

Le digramme en bâtons utilisant des effectifs ou des fréquences relatives.

La courbe cumulative qui nécessite des fréquences cumulées croissantes ou

décroissantes.

1- le diagramme en bâtons :

Chaque bâton issu d’une modalité à une longueur proportionnelle à l’effectif ou à

la fréquence de la modalité.

Exemple : 50 logements sont répartis selon les pièces par logement

Pièces

xi Effectif

ni fi % < a xi > a xi

fi % cum fi % cum

1 2

3

4 5

5 20

15

8 2

10 40

30

16 4

0 10

50

80 96

100

100

90 50

20

4 0

∑ 50 100 — —

DIAGRAMME CIRCULAIRE

Française

Allemande

Italienne

Hollondaise

Américaines

Belge

autres

Page 11: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

11

2- la courbe cumulative croissante et décroissante.

C’est la courbe qui représente la fonction de répartition F(x).C’est une courbe en

escaliers.

Définition :on appelle fonction cumulative ou fonction de répartition la fonction

F(x) qui à toute valeur, associe la portion des individus dont le caractère est

strictement inférieur ( <) à x.

F(x) est définie pour toute valeur réelle de x telle que : x < xi

F(-∞) = 0 et F(+∞) = 1

0102030405060708090

100110

0 1 2 3 4 5 6 7 8xi

fi %

-∞

+∞

Page 12: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

12

C- Représentation graphique d’un caractère quantitatif continu.

On a 2 types de graphiques :

- l’histogramme pour représenter les effectifs ou les fréquences relatives.

- La courbe cumulative pour représenter les effectifs ou les fréquences

cumulées croissantes ou décroissantes.

1- l’histogramme :

c’est un ensemble de rectangles adjacents ayant des bases égales aux amplitudes

des classes et des hauteurs correspondant aux effectifs ou aux fréquences

relatives.

1er

cas : les classes ont des amplitudes égales.

Page 13: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

13

2ème

cas : les classes ont des amplitudes inégales. Il faut corriger les effectifs

ou les fréquences relatives en choisissant une amplitude de base a0 (en général

la plus petite)

i

ii

an

acorrigéna

ancorigénii

i

0. 0

Exemple : les 200 ouvriers répartis selon le salaire.

0

20

40

60

80

100

120

1 2 3 4 5 6 7

2- La courbe cumulative :

C’est le graphique représentant la fonction de réparation F(x)

Les valeurs de x sont les limites des classes, les valeurs de y sont les fi % cumulés

croissantes ou décroissantes

Si la courbe cumulative est croissante elle a pour coordonnées les limites supérieurs

des classes et les fi % cumulés croissantes

Exemple : soit la série statistique relative à la répartition de 200 salariés selon le salaire en 103

DH.

Salaire DH 103 ni ni corrigé

[0-2[ [2-3[

[3-5[ [5-7[

50 100

30 20

25 100

15 10

∑ 200 –

Page 14: Module : STATISTIQUE DESCRIPTIVE Eléments du …p5.storage.canalblog.com/51/82/1177787/100938437.pdf · Le dépouillement (dénombrement) des données statistiques permet de les

14

Salaire

103 DH

Effectifs

ni

fi % =

ni x 100 ∑ ni

fi %

cum

fi %

cum

1 – 2

2 – 4 4 – 6

6 – 8 8 – 14

20

100 30

40 10

10

50 15

20 5

10

60 75

95 100

100

90 40

25 5

∑ 200 100 X X

0

25

50

75

100

0 2 4 6 8 10 12 14 16

fi %

xi

c. cum.

c. cum.

Remarque : l’intersection des 2 courbes donne la valeur médiane Me