module : statistique descriptivep5.storage.canalblog.com/51/12/1177787/99809261.pdf6-variable...
Post on 02-Mar-2020
3 Views
Preview:
TRANSCRIPT
1
UNIVERSITE HASSAN II FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET SOCIALES CASABLANCA AIN CHOCK
Module : STATISTIQUE DESCRIPTIVE
Premier semestre
Eléments du cours de M. DAAMOUCH
2014-2015
Ensembles 5 et 6
Avertissement et conseil : Ce document est incomplet, il
ne comprend ni l’intégralité du cours, ni les applications, ni les exemples, ni le travail pédagogique indispensable pour le comprendre. L’étudiant est tenu d’assister aux séances de cours
2
INTRODUCTION AU COURS
I- Définitions et Objectifs de la statistique
1- les objectifs de la statistique
La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de
nombreux faits correspondant à l’observation d’un phénomène , dans le but de
rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de
décision.
Les objectifs de la statistique descriptive sont de décrire, de synthétiser, de
comparer des données recueillies sur un phénomène donné au cours des
différentes périodes ou en différents endroits.
2- Définitions
La statistique est une méthode de collecte, de présentation et d’analyse des
observations relatives à des individus appartenant à un même ensemble défini de
manière précise afin de mettre en évidence certaines propriétés générales de cet
ensemble.
La statistique descriptive est la partie de la statistique dont le rôle est de décrire un
phénomène ; en d’autres termes ; à le mesurer, à l’évaluer, à classer les mesures, à
présenter ces mesures sous forme de tableaux ou graphiques, à synthétiser ces
mesures par quelques indicateurs de manière à avoir une idée rapide et simple du
phénomène étudié et aussi pour permettre de faire des comparaisons.
Remarque : Il faut faire une distinction entre les statistiques et la statistique.
Les statistiques désignent les données quantitatives (chiffrés), c’est
l’information brute sous forme de données numérique
Exemple :
La statistique est la discipline qui s’attache à étudier ces données
numériques brutes dans le but de fournir le maximum des renseignements
sur le phénomène en question. Donc la statistique est une méthode
scientifique qui vise la description quantitative des chiffres bruts
3
II- Apport de la statistique à la science économique :
a) La statistique est indispensable aux théoriciens de l’économie, puisqu’elle permet de
mettre en évidence l’interdépendance des phénomènes économiques et de vérifier la
validité de certaines hypothèses par confrontation de la théorie à la réalité.
b) La statistique est indispensable aux praticiens de l’économie, elle permet : aux
pouvoirs publics d’agir correctement en matière de politique économique et d’éviter le
déclenchement des cycles économiques négatifs (crises économiques) et permet aussi une
aide précieuse aux opérateurs privés dans leurs processus de prise de décisions en vue
d’une rationalisation optimale de la gestion des entités économiques.
III- Méthodes d’observation statistique
Deux méthodes principales pour collecter des données :
1- Recensement (enquête exhaustive)
Le recensement est une opération de collecte d’information qui porte sur toutes les
unités formant la population étudié.
Exemple :
2- Enquête par sondage (enquête partielle)
C’est une opération portant sur une partie de la population. Les unités statistiques
concernées par ce sondage constituent un échantillon. Ce dernier est choisi de
manière à représenter la population mère
Exemple :
IV- Vocabulaire utilisé en statistique descriptive :
La statistique utilise comme toute science qui se respecte un vocabulaire et des
concepts spécifiques qu’il faut présenter et définir avant tout propos.
1- Population statistique (ou univers statistique) : c’est l’ensemble de tous les
individus auxquels l’étude statistique s’intéresse.
Exemple :
2- Unité statistique (ou individu statistique) : un élément de cet ensemble ou plus
précisément élément qui composent la population
Exemple :
4
3- L’échantillon : c’est une partie ou un sous ensemble de la population mère
Exemple :
4- Caractère statistique : c’est la propriété retenue pour développer l’étude
statistique
Exemple :
5- La Modalité : les modalités sont les différents états possibles d’un caractère ;
Exemple :
Un caractère peut être qualitatif ou quantitatif
a. Il est qualitatif lorsqu’ il ne peut être exprimé en valeur, on ne peut pas le
mesurer ou le quantifier mais seulement le repérer.
Exemple :
b. Il est quantitatif quand il peut être exprimé en valeur, il est mesurable ;
chiffrable.
Exemple :
Un caractère peut être quantitatif discret (discontinu) ou quantitatif continu.
Il est quantitatif discret si ses modalités sont des nombres entiers isolés ;
Exemple :
Il est quantitatif continu si ses modalités sont exprimées par des intervalles
de valeurs ;
Exemple :
6- Variable statistique : chaque modalité d’un caractère est constituée par un
nombre ou un ensemble de valeurs, appelé variable. Selon la nature de la
variable il y a variable discrète et variable statistique continue.
5
Variable discrète prend des valeurs entières
Variable continue prend toute valeur dans un intervalle de mesure
7- Classe : c’est un groupement de valeurs selon les intervalles qui peuvent être
– ou non – égaux ; une classe se définit par deux limites : la limite inférieure
appartient à la classe, la limite supérieure est exclue de la classe. La différence
entre les deux limites donne l’amplitude.
Exemple :
8- L’effectif ou fréquence absolu : c’est le nombre d’individus ayant une valeur
de la modalité.
Exemple :
9- Fréquence relative : c’est la part de l’effectif de la modalité à l’effectif total
Exemple :
10- Série statistique : c’est l’ensemble des valeurs qui mesurent le caractère.
V- Symboles mathématiques utilisés en STATISTIQUE.
1- les valeurs de caractère sont symbolisées par ni xxxx ......,,...,, 21 on parle des xi
Si la série est une série avec des classes les xi représenteront les centres de classes.
2- les effectifs sont symbolisés par ni nnnn .,.................,, 21 on parle des ni
L’effectif total est symbolisé par N.
3- la fréquence relative s’écrit : N
nf i
i
3- L’opérateur somme ∑ (se lit Sigma) ; On utilise ce symbole pour designer l’opération
Somme.
n
i
ini xxxxx1
21 ..........
Exemple : on a : 4321 xxxx =
4
1i
ix
5
2
5
2
5
2
44)(i
i
i i
ii bxabaxbax = a(x 2 )-(b) + ax 3 - b + ax 4 -b + ax 5 -b
= a ( 5432 xxxx ) – 4b.
6
Propriétés du sigma
ana .
ii xaax
naxax ii
iiii yxyx
5- - L’opérateur produit (se lit Pi).
On utilise ce symbole si la variable se multiplie.
n
n
i
i xxxx
....21
1
Exemple :x 1 x 2 x 3 =
3
1i
ix ; ax 2 ax 3 ax 4 =a 3
4
2i
ix
7
Chapitre I : Elaboration des tableaux statistiques
et représentation graphique.
Avant toute représentation graphique des données statistiques, il est primordial de faire
une classification de ses données dans des tableaux statistiques
I- Présentation des tableaux statistiques. Le dépouillement (dénombrement) des données statistiques permet de les synthétiser dans
des tableaux statistiques.
A- Présentation générale du tableau statistique
Considérons une population statistique P composé de n individu et décrite suivant le
caractère C dont les modalités sont : m1 , m2, ……,mk .on désigne par ni le nombre
présentant la modalité mi d’effectif ou fréquence absolue. Ainsi nous aurons le
tableau suivant :
Caractère étudié Effectif ou
fréquence absolue
Fréquence relative Pourcentage (%)
m1
m2
.
.
mi
.
.
.
mk
n1
n2
.
.
ni
.
.
.
nk
f1= n1/N
f2= n2/N
.
.
fi= ni/N
.
.
.
fk= nk/N
P1=f1 x100
P2=f2 x100
Pi=fi x100
.
.
.
Pk=fk x100
TOTAL Nn
k
i
i 1
11
k
i
if 1001
k
i
iP
N= effectif total
ni = nombre d’observation correspondant à la modalité mi
N = ki
k
i
i nnnnn
.........21
1
B- Cas d’un caractère qualitatif :
8
B- cas d’un caractère quantitatif discret :
Exemple (2) :
C- Cas d’un caractère quantitatif continu
Dans ce cas chaque modalité est une classe,[L1-L2[ et les classes peuvent être a
amplitudes égales ou inégales.
Exemple 3 : Soit une distribution statistique des ouvriers d’une E se selon leur âge.
9
- La limite inférieure de la classe fait partie de cette classe, alors que la limite
supérieure est exclue, mais fait partie de la classe suivante : [L1-L2[
- La 1ère
et la dernière classe de la série peuvent avoir des amplitudes indéterminées,
il convient de préciser leur limite.
- La colonne fi℅ cumulées croissante nous donne le ℅ des individus ayant une valeur
inférieure à xi.
Exemple :
- La colonne fi℅ cumulées décroissante nous donne le ℅ des individus ayant une
valeur supérieure à xi.
Exemple :
II) Représentations Graphiques.
Les graphiques constituent un mode de présentation de résultats statistiques sous forme
de tracé géométrique qui permet une description immédiate et complète. Selon la nature
du caractère, il y’a différents types de représentations graphiques.
A- Représentation graphique d’un caractère qualitatif :
Plusieurs types de graphiques sont utilisés pour représenter ce caractère, nous retenons 2
types : Les tuyaux d’orgue et le diagramme circulaire ou semi circulaire.
1-le diagramme en tuyaux d’orgue :
Ce sont des tuyaux dont les bases sont égales, alors que la hauteur est proportionnelle
à l’effectif ou à la fréquence relative de la modalité.
Exemple1 :
10
2-diagramme circulaire
B- Représentation graphique d’un caractère quantitatif discret :
Il peut être représenté par 2 types de graphiques :
Le digramme en bâtons utilisant des effectifs ou des fréquences relatives.
La courbe cumulative qui nécessite des fréquences cumulées croissantes ou
décroissantes.
1- le diagramme en bâtons :
Chaque bâton issu d’une modalité à une longueur proportionnelle à l’effectif ou à
la fréquence de la modalité.
Exemple :
11
2- la courbe cumulative croissante et décroissante.
C’est la courbe qui représente la fonction de répartition F(x).C’est une courbe en
escaliers.
Définition :on appelle fonction cumulative ou fonction de répartition la fonction
F(x) qui à toute valeur, associe la portion des individus dont le caractère est
strictement inférieur ( <) à x.
F(x) est définie pour toute valeur réelle de x telle que : x < xi
F(-∞) = 0 et F(+∞) = 1
Exemple :
C- Représentation graphique d’un caractère quantitatif continu.
On a 2 types de graphiques :
- l’histogramme pour représenter les effectifs ou les fréquences relatives.
- La courbe cumulative pour représenter les effectifs ou les fréquences
cumulées croissantes ou décroissantes.
1- l’histogramme :
c’est un ensemble de rectangles adjacents ayant des bases égales aux amplitudes
des classes et des hauteurs correspondant aux effectifs ou aux fréquences
relatives.
1er
cas : les classes ont des amplitudes égales.
Exemple :
12
2ème
cas : les classes ont des amplitudes inégales. Il faut corriger les effectifs
ou les fréquences relatives en choisissant une amplitude de base a0 (en général
la plus petite)
i
ii
an
acorrigéna
ancorigénii
i
0. 0
Exemple :
13
2- La courbe cumulative :
C’est le graphique représentant la fonction de réparation F(x)
Les valeurs de x sont les limites des classes, les valeurs de y sont les fi % cumulés
croissantes ou décroissantes
Si la courbe cumulative est croissante elle a pour coordonnées les limites supérieurs
des classes et les fi % cumulés croissantes
Exemple :
15
CHAPITRE II : Les caractéristiques de tendance centrale
Les représentations graphiques, en permettant de faire une 1ère
synthèse des
informations contenues dans les tableaux et de donner les 1ères
conclusions pour une
distribution donnée, restent insuffisantes quand aux conclusions comparatives entre 2 ou
plusieurs séries statistiques, d’où l’importance des paramètres centraux.
On retient ceux les plus utilisés : la médiane (Me), le Mode (Mo), et les moyennes.
I- la médiane (Me).
A- définition : La médiane (Me) est la valeur du caractère telle que la moitié des
individus ont une valeur inférieure et l’autre moitié ont une valeur supérieure, la valeur
médiane partage l’histogramme en 2 aires égales.
B- Détermination de la médiane (Me).
1- cas d’une série simple :
a- Le nombre d’observation est impair N=2n+1=> n=2
1N ; la médiane correspond à la
(n+1) ème observations.
Exemple :les notes d’un candidat à l’examen sont :5-6-8-12-13-14-15.
N = 7 = 2n+1 => n = 3 ; la médiane correspond à la (n+1) observations. C’est la 4ème
note : Me=12.
b-le nombre d’observation est pair : N = 2n => n=2
N, la médiane correspond à
la2
1somme de (n) et la (n+1) observations.
Exemple : un étudiant a obtenu les notes suivantes :3-14-8-11-10-14-16-12.
Classement :3-8-10-11-12-14-14-16.
n =2
8 = 4. Me =
2
1211 = 11,5 ici on a un intervalle médian.
2-cas d’une série classée :
Exemple :
16
a) détermination graphique de la médiane Me.
On trace les courbes cumulatives croissantes et décroissantes.
L’intersection des 2 courbes nous donne la médiane
b) détermination de la médiane par le calcul
Les étapes :
1 ere étape : le rang de la médiane 2
ni ou
2
% fi ou
2
fi
2ème
étape : détermination de la classe médiane [L1 , L2]
3ème
étape : calcul par interpolation linéaire
:
)(
)2
(
)(12
1
12
1
ii
i
i
nn
nn
LL
LMe Me = L 1 + [ (L 2 - L
1)
)(
)2
(
12
1
ii
i
i
nn
nn
]
Exemple
17
II- Le mode (Mo)
A- Définition :
On appelle Mode (Mo) ou dominante d’une série statistique la valeur du caractère qui
a le plus grand effectif (ni) ou la plus grande fréquence relative (fi), c’est la plus
fréquente.
B- Détermination du mode Mo
1-cas d’une Variable discrète
La détermination est directe : le Mode (Mo) est la valeur de la modalité qui a le
plus grand effectif (ni) ou la fréquence relative (fi) la plus grande.
Exemple :
2-cas d’une variable continue.
a- Détermination graphique :
On trace l’histogramme, on joint les limites > du tuyau modal et de celui avant mode,
et on joint les limites < du tuyau modal et de celui après mode. L’intersection est
projetée sur l’axe des x.
18
b- calcul du Mode :
On suit les étapes suivantes
* On corrige les ni si les classes sont d’amplitudes inégales
* On trace l’histogramme (facultatif) .
* On détermine la classe modale [L1-L2[.
* L’amplitude de la classe modale bi.
* La 1ère
différence 1 = ni – ni-1
* La 2ème
différence 2 = ni – ni+1
Le mode Mo est donné par la formule suivante :
Mo = L 1 + [ ib
21
1 ]
Exemple
19
III- Les moyennes :
A- La moyenne arithmétique :
1- Définition : on appelle moyenne arithmétique de la variable xi, notée x (se
lit x barre) la valeur obtenue, en divisant la sommes des valeurs observées
de la variable par l’effectif total.
2- Formules de la moyenne x :
a- Formule simple : chaque valeur xi est observée une seule fois xi = 1
x = k
k
nnnn
xxxx
....
....
321
321 = N
x
n
xk
i
i
k
i
i
k
i
i
1
1
1
Exemple : la taille (en m) de 5 étudiants est : 1,56 m, 1,6 m, 1,62 m, 1,7 m, 1,8 m
x = N
xi
i
5
1 = 5
8,17,162,16,156,1 =
5
28,8 = 1,656 m.
Chaque étudiant a une taille moyenne de 1,656 m.
b- Formule pondérée xi 1
x = k
kk
nnn
xnxnxn
.....
....
21
2211 =
k
i
i
k
i
ii
n
xn
1
1
Formule selon laquelle la fréquence utilisée (absolue ou relative).
n
i
i
n
i
ii
n
xn
x
1
1 = 100
%1
n
i
ixfi
=
n
i
ii xf1
c- Les propriétés de la moyenne :
C-1 :
i
ii
n
xxn )( = 0
C-2 c’est par rapport à x que la quantité
i
ii
n
xxn 2)( est minimum.
20
B- La moyenne géométrique :
On utilise cette moyenne lorsque la variable xi se multiplie.
Soit une variable xi prenant des valeurs x1, x2, x3,……xn.
1- Définition :
On appelle moyenne géométrique notée G, la racine Nème
du produit des
valeurs, elle a pour expression :
G = nxxxx ...321 = [
n
i
ix1
] 1/N
formule simple si xi=1
Si xi 1 : G = ni n
n
nn nxxx ....21
21 = [
n
i
xi1
ni]
1/∑ ni
2- Calcul de la moyenne géométrique notée G.
On utilise les logarithmes Log.
Soit G = (valeur obtenue) 10
.
Si ni=1, Log G = in
1log xi
et si ni 1 Log G =
n
i
i
n
i
ii
n
xLogn
1
1
..
.
C- La moyenne harmonique :
1- Définition : Soit la variable statistique xi qui a pour valeurs x 1 , x 2 , x 3 ,……, x n .
On appelle moyenne harmonique notée H, le nombre dont l’inverse est égal à la moyenne
arithmétique des inverses des valeurs observées.
2- Formule de H.
Si ni = 1 H
1 =
N
1
ix
1 Formule simple
3- Formule pondérée : ni 1
H
1 = i
i
i x
n
n
1
H =
ix
N
1
H =
i
i
i
x
n
n
21
On l’utilise quand le phénomène varie comme l’inverse de la variable ou quand la
variable possède une unité composée ; telle la vitesse.
D- La moyenne quadratique
1- Définition : On appelle moyenne quadratique notée Q de n valeurs x1,x2,x3….xn
prises par la variable statistique x, la valeur dont le carré est égale a la moyenne
arithmétique des carrés de ces valeurs.
2- Formule deQ .
* Formule simple : ni = 1 : Q2
= N
xxx n
22
2
2
1 .......=
N
xi2
Q =N
xi2
.
* Formule pondérée : ni 1 : Q2
=
i
ii
i
ii
n
xnQ
n
xn22
.
* Elle est utilisée quand la variable est élevée au carré.
Remarque : Les valeurs des 4 moyennes vérifient l’inégalité suivante :
H < G < < Q
Exemple : le personnel d’une entreprise est reparti selon le nombre d’enfants à leur
charge
x G H Q
Enfants
xi
Personnel
ni
1
2
3
4
5
6
10
30
20
50
20
10
140
22
Chapitre III : Les caractéristiques de dispersion
Les caractéristiques de tendance centrale ne sont pas toujours suffisantes pour
caractériser une série statistique, car 2 séries peuvent avoir Mo= Me = x alors qu’elles
sont distribuées de façon différente comme le montre l’exemple suivant :
Exemple : on a 2 séries relatives au nombre de pièces mauvaises produites par 2
machines A et B par semaine.
Machine A : 39, 40, 40, 41, 41, 41, 42, 42,43
Machine B : 1, 21, 21, 41, 41, 41, 61, 61,81
On constate que ces 2 séries ont : Me = Mo = x = 41 pièces mauvaises, cependant les 2
séries sont différentes par la dispersion de leurs valeurs.
Pour la série A : les valeurs se concentrent autour de la valeur centrale tandis que
Pour la série B : les valeurs sont plus dispersées par rapport à la valeur centrale.
Pour mesurer le degré de dispersion de ces valeurs par la valeur centrale on fait appel a
quelques caractéristiques de dispersion telles : l’entendue (E) ; les quantiles ; la variance
et l’écart type.
I - L’étendue (E) ou l’intervalle de variation :
L’étendue notée (E) ou l’intervalle de variation d’une série statistique est la différence
entre la plus grande valeur et la plus petite valeur de la variable statistique
E = Limite finale – limite initiale
Exemple précèdent :
Machine A : E = 43 – 39 = 4
Machine B : E = 81 – 1 = 80
Remarques : - l’étendue est facile à calculer et contient 100% des observations.
- cette caractéristique n’est pas très fiable car elle dépend des
valeurs extrêmes du caractère, valeurs souvent aberrantes ou
accidentelles.
II- Les quantiles :
Ce sont des paramètres qui nous renseignent sur la dispersion des valeurs de la
variable par rapport à la médiane.
A- Les quartiles
1- Définition : les quartiles Q i sont des valeurs de variables qui partagent la série en 4
parties égales ; on a 3 quartiles notés Q 1 , Q 2 , Q 3 .
* Le premier quartile Q 1 est la valeur du caractère tel que 25% des observations de la
série ont une valeur inférieure à Q 1 et 75% des observations ont une valeur supérieure à
Q 1 .
* Q 2 c’est le éme2 quartile qui correspond à la médiane Q 2 =Me.
23
* Le eme3 quartile Q 3 : c’est la valeur du caractère tel que 75% des observations de la
série ont une valeur inférieure à Q 3 et 25% des observations ont une valeur supérieure à
Q 3 .
__ E
QQQ _____________________0 321 _____
25% 25% Me 25% 25% 100%
2- L’intervalle interquartile : c’est la différence entre 3Q et 1Q noté : Iq = 3Q - 1Q
cet intervalle contient 50% des observations centrales, on peut le comparer à l’étendue
pour mesurer son importance par rapport à la série.
3- Détermination des quartiles 1Q et 3Q .
Comme la médiane Me, les quartiles se déterminent à partir des ni cum ↗ ou fi cum
↗ et ce graphiquement ou par le calcul.
a/ calcul de 1Q , 3Q , Me.
Exemple : répartition de 100 salariés d’une entreprise se selon le salaire mensuel en
(1000 DH)
Salaires ni
8 – 10
10 – 12
10 – 14
14 – 16
16 - 18
22
28
30
15
5
100
24
B- les déciles (Di) et les centiles (Ci)
1- les déciles : on divise la population en 10 parties égales on obtient 9 déciles
D 1 , D 2 ………D 9 .
* Le premier décile D 1 est la valeur du caractère telle que 10% des observations de la
série ont une valeur inférieure à D 1 et 90% des observations ont une valeur supérieure à
D 1 .
* Le eme9 décile D 9 : c’est la valeur du caractère tel que 90% des observations de la série
ont une valeur inférieure à D 9 . et 10% des observations ont une valeur supérieure à D 9 .
Remarque : l’intervalle interdécile D 9 - D 1 contient 80% des observations
détermination des déciles graphiquement ou par calcul. On utilise les ni cumulatif.
* Calcul de D 1 et D 9 :
2- Les centiles Ci
On divisent les observations d’une série statistique en 100 parties égales on
obtient 99 centiles.
25
* Le premier centile C 1 est la valeur du caractère telle que 1% des observations de la
série ont une valeur inférieure à C 1 et 99% des observations ont une valeur supérieure à
C 1 .
* Le eme99 centile C 99 : c’est la valeur du caractère tel que 99% des observations de la
série ont une valeur inférieure à C 99 . et 1% des observations ont une valeur supérieure à
C 99 .
Remarque : l’intervalle intercentile C 99 - C 1 contient 98% des observations
a- Détermination des centiles C 1 et C 99 . On utilise les ni cumulatifs.
III - La variance V(x) et l’écart type (σx)
A- La variance V(x) :
1- Définition : la variance est la moyenne arithmétique des carrés des écarts de la
variable xi à sa moyenne arithmétique x .
Elle se définit par la quantité suivante :
n
xxixVnsi
n
xxinxVnsi
i
i
ii
2
2
)(:1.
)()(:1.
formule de définition.
En développant la formule de définition on obtient une formule développée :
26
V(x) =
i
ii
n
xxn 2)( =
i
ii
n
xn2
- x 2 = 2
ii xf - x 2 = 100
%2
ii xf- x 2 = Q 2 - x 2 .
2- l’écart type (σx) : l’écart type est la racine carrée de la variance V(x)
σx = )(xV =
21
2)(
i
ii
n
xxn
L’écart type montre de combien en moyenne, la variable xi s’écarte de sa moyenne x .
3- Le coefficient de variation C.V.
Le C.V. est le rapport de l’écart type à la moyenne qui s’exprime en %
C.V. = x
x100.
On utilise le CV pour apprécier l’importance de la dispersion d’une série ou pour
comparer deux séries entre elles .
B/ Calcul de V(x), σx et C.V.
On reprend l’exemple précèdent : le salaire mensuel (10 3 DH)
27
Chapitre IV : Les caractéristiques de concentration :
L’étude de la concentration permet de caractériser un certain nombre de grandeurs
économiques (salaire, revenu, l’impôt, chiffres d’affaires, superficie …). On parle de
concentration chaque fois qu’il y a une inégalité de répartition entre les individus d’une
population donnée. C’est une notion statistique qui ne concerne que certaines séries
statistiques, celles où le caractère peut être additionné.
On peut donc parler de concentration de revenus, de concentration foncière, de
concentrations de capitaux …
I –MESURE DE LA CONCENTRATION PAR L’INDICATEUR
ECART MEDIANE – MEDIALE
La détermination de cet indicateur nécessite au préalable la connaissance de la notion
médiale.
A- La médiale
1-Définition :
La médiale d’un caractère statistique est la valeur qui partage la masse des valeurs en
deux parties égales
la Mle est donc la valeur du caractère qui partage la somme des ni xi en 2 parties égales,
50% de cette masse (∑ ni xi) est < à cette valeur et 50% est ≥ à cette valeur.
2-Exemple de détermination de la médiale :
28
B- L ‘écart Médiale – Médiane : ΔM
La comparaison de la valeur de la médiale et de la médiane constitue une mesure de
la concentration
La mesure de l’écart entre médiale et médiane renseigne sur le degré de concentration
Plus l’écart est grand et plus la concentration est forte et il est nul en cas de parfaite
égalité.
ΔM = Mle - Me
Pour apprécier la concentration, on rapporte l’écart à l’étendue de la série :
100
E
M
Si ΔM est grand par rapport à l’étendue : la concentration est forte
Si ΔM est petit par rapport à l’étendue : la concentration est faible
Si ΔM est nul : la concentration est nulle(Mle =Me)→égalité parfaite
Exemple
29
II- LA COURBE DE LORENTZ (COURBE DE CONCENTRATION) :
La courbe de concentration permet de représenter graphiquement la répartition des
valeurs d’un caractère quantitatif, discret ou continu, entre les individus de la population.
La courbe de concentration permet de comparer à une répartition strictement égalitaire, la
répartition d’une série statistique donnée.
A- Construction de la courbe de Lorentz :
Sur les 2 côtés d’un carré, on porte (à la même échelle) :
Sur les abscisses (axe OX), les fréquences cumulées croissantes en % des
individus de chaque classe soit fi % cumulés croissantes ou Fi
Sur les ordonnés (axe OY), les fréquences cumulées croissantes en % des
masses soit les nixi en % cumulés croissantes ou Fnixi
Remarque : Fnixi → 100 ii
ii
xn
xn cum ↗
On porte dans le carré les différents points cordonnées (Fi , Fnixi) ou (fi %
cum ↗, nixi en % cum ↗). La courbe de concentration est obtenue en
joignant les points représentés.
30
Exemple d’application : Dans le service après vente d’un grand magasin
d’électroménagers. On a relevé la durée des dépannages effectués pendant un trimestre
Durée de dépannage (en minutes) Nombre
0 - 20
20 – 40
40 – 60
60 – 80
80 – 100
100 – 120
120 - 140
4
36
64
80
58
24
14
31
B- Interprétation de la représentation
Une répartition strictement égalitaire est représentée par la diagonale du carré, encore
appelé ligne d’équirépartition.
Ainsi plus la courbe correspondante à la distribution étudiée s’éloigne de cette ligne
(bissectrice), plus la série des valeurs du caractère étudié est inégalitaire et montre
une concentration de plus en plus importante à mesure que l’éloignement est grand.
III- L’INDICE DE CONCENTRATION OU COEFFICIENT DE GINI
A- Définition
L’indice de Gini est le rapport de l’aire situé entre la bissectrice et la courbe de
Lorentz à l’aire totale de demi- carré.
OABtriangledeAire
ionconcentratdeAireIG
32
C- Calcul pratique : Méthode des trapèzes
L’aire sous la courbe est décomposée en triangle et trapèzes dont on calcule la surface
(ΣSi).
On obtient un triangle et des trapèzes
Aire de triangle OAB = 50002
100100
,
Aire de concentration = Aire de triangle OAB –Σ Si = 5000- Σ Si
OABtriangledeAire
ionconcentratdeAireIG
5000
5000
i
G
SI
Exemple : On reprend l’exemple précédent
33
D- Interprétation de l’indice de Gini
L’indice de Gini est toujours compris entre 0 et 1. Plus il est proche de 1 plus la
concentration est forte et plus il est proche de 0 plus la concentration est faible.
- Si IG = 0 → cela signifie que l’aire de concentration est nul, la courbe est
confondu avec la bissectrice, on dit qu’on une situation d’égalité parfaite.
- Si IG = 1 → cela signifie que l’aire de concentration est égal à l’aire de
triangle OAB, on dit qu’on une situation d’inégalité parfaite.
top related