1 statistiques 1. introduction.. 2 11. utilité. 3 12. schéma d une étude. modélisation décision...
TRANSCRIPT
1
Statistiques
1. Introduction.
2
11. Utilité.
Aider à comprendre la complexité d’un environnement ;
Aider à la prise de décision ;
Disposer de moyens susceptibles de
prévoir et d’anticiper.
3
12. Schéma d ’une étude.
Modélisation
Décision
Statistiques et informatique
Dépouillem ent de l'inform ation recueillie.
Tableaux statistiques. Graphiques. Valeurs caractéristiques. Autres analyses.
Prévision. Décision.
Com m entaires et recom m andations.
Recherche d'inform ation à propos des variables choisies.
C h oix d e variab les .
Phénom ène étudié.
Risque
4
121. Modélisation.
Choix de variables.
Phénom ène étudié.
1. Etude de la rentabilité financière d’un projetd’investissement ;
2. Construction d’un S.I.A.D.A. ;
3. Fabrication et mise en place d’un baromètre susceptible demesurer dans le temps le sentiment d’une population sur unepopularité, l’insécurité ou une image ;
4. Typologie d’une clientèle ;
5. Liaison entre le chiffre d’affaires et les besoins en maind’œuvre.
5
122. Statistique, informatique et traitement de l’information ;
Dépouillem ent de l'inform ation recueillie .
Tableaux statistiques. Graphiques. Valeurs caractéristiques. Autres analyses.
Recherche d'inform ation à propos des variables choisies.
6
123. Décision.
Prévis ion. D éc is ion.
C om m enta ires e t recom m andations .
Risque
7
13. Mots clés.
131. Population : référentiel sur lequel porte l’étude. Ensemble d’individus, d’objets, de faits, d’unités de temps, de codes…;
8
132.Variable : une caractéristique que l’on désire étudier sur chaque individu de la population.
Qualitative
Discret Continu
Type.
Quantitative
Nature
Variable.
9
Exemples.
- Catégorie professionnelle d’une personne : variable qualitative ; - Le nombre d’enfants à charge d’un foyer ou le nombre de pièces d’un appartement :variables quantitatives discrètes ; - l’âge d’un individu ou le revenu d’un foyer fiscal : variables quantitatives continues.
10
133. Information.
Interne à l'entreprise. Externe à l'entreprise.
Existe.
Inform ation à créer.
N'existe pas.
Inform ation.
11
Principales sources internes :
- Données comptableset budgétaires ;
- Informations commerciales ;- Données concernant la production ;- Sources du service du personnel.
Principales sources externes :
- Les sources professionnelles ;- Les sources publiques ;- Les organismes spécialisés.
12
I n f o r m a t i o n à c r é e r : o n p e u t a v o i r r e c o u r s à d e ss o n d a g e s :
A 2 degrés En grappe
A 2 niveaux Statifié
Non sim ple Sim ple
Aléatoire
M éthode des tinéraires M éthode des quotas
Em pirique
Echantillons.
13
134. Dépouillements.
- T r i à p l a t : t a b l e a u s i m p l e e n t r é e ;
Nom enc la ture .
V ariab le q ua lita tive
S érie s ta tis tique
V ariab le q uan tita tive
T ri à p la t
- T r i c r o i s é : t a b l e a u 2 e n t r é e s o ut a b l e a u d e c o n t i n g e n c e ;
14
- Mentions obligatoires dans la constitution d’un tableau :
Le titre ; La source d’information avec les références complètes ; Les unités utilisées ; Les intitulés des lignes et des colonnes.
15
1
Méthodes statistiques.
2. Tris, imagerie, position.
16
21. Tris211. Tri à plat.
a. Nomenclature. Par exemple:
On a relevé la couleur des yeux de 10 individus d’une population. Les résultats sont présentés dans l’ordre où ils ont été obtenus.
Vert ; bleu ; marron ; marron ; marron ; bleu ; bleu ; marron ; marron ; bleu.
17
Modalités : Couleurs effectifs fréquence Pourcentage
( %) vert 4 0.4 40 bleu 5 0.5 50
marron 1 0.1 10 10 1 100
Le tri à plat (nomenclature) nous est donné dans le tableau ci-après, en utilisant la fréquence absolue, la fréquence relative et le pourcentage.
18
b. Série statistique.
Par exemple:
Semaines 1 2 3 4 5 6 7 Nombre d’absents 0 2 1 3 0 2 3
Semaines 8 9 10 11 12 13 Nombre d’absents 1 0 2 1 0 4
On relève sur 13 semaines le nombre d’individus absents. Les résultats sont présentés dans le tableau suivant.
19
Modalités : nombre
d’absents
Effectifs : nombre de semaines
fréquence Pourcentage
( % )
0 4 0.308 30.8 1 3 0.254 25.4 2 3 0.254 25.4 3 2 0.174 17.4 4 1 0.090 9.0 13 1 100.
La série statistique est donnée dans le tableau suivant, accompagnée de la fréquence et des pourcentages.
20
Nous remarquons que les formes des 2 tableaux sont les mêmes; mais que dans un cas il n ’est pas possible d ’ordonner les modalités alors que dans l ’autre, les modalités sont ordonnées de manière croissante.
On peut également choisir de classer les modalités dans des classes de même amplitude ou d’amplitudes différentes.
21
212. Tri croisé.Exemple:On relève pour 10 livraisons les quantités
livrées et le montant des factures correspondantes. Les résultats sont présentés dans le tableau suivant :
22
Numéro de livraison.
Modalités de la variable 1 :
quantité
Modalités de la variable 2 : montant facturé (1 000 euros )
1 12 31 2 20 35 3 15 29 4 13 18 5 14 31 6 17 35 7 11 31 8 12 18 9 13 35 10 12 18
23
Le tri croisé de ces 2 variables peut-être réalisé de la manière suivante:
Modalités de la variable X
Modalités de la variable Y
X Y 18 19 31 35
11 1
12 2 1
13 1 1
14 1
15 1
17 1
20 1
24
D ’un tableau de contingence on peut extraire:a. deux tableaux marginaux;b. k tableaux conditionnels avec k égal au
nombre de modalités de la variable X + nombre de modalités de la variable Y
25
D ’un tableau de contingence on peut également déduire deux tableaux profilés:
a. Tableau des profils/lignes;b. Tableau des profils/ colonnes
Ces tableaux peuvent être utilisés dans le cadre de l’étude de proximités mais aussi en analyse des correspondances.
26
Premiers éléments visuels importants pour l ’analyse.
22. Imagerie.
27
221.Variable qualitativeIl y a trois possibilités:
a. diagramme à barres;b. diagramme à bandes;c. diagramme à secteurs.
28
Le chiffre d’affaires réalisé sur 3 produits par une entreprise est donné dans le tableau suivant :
Produits. A B C total C.A. (1000 euros) 40 160 200 400
C.A. (%) 10 40 50 100
Par exemple, si on considère la statistique suivante:
29
A
B
C
Diagramme à barres.
Diagramme à bandes.
Diagramme à secteurs.
CB
A
C B
A
30
222. Variable quantitative discrète: « diagramme à bâtons ».
Sur 60 jours d’observation, nous avons relevé le nombre d’employés absents. L’ensemble des résultats est donné dans le tableau ci-après.
Nombre d’absents par jour
0 1 2 3 4 5 Total
Nombre de jours. 10 18 20 6 4 2 60
31
La représentation est un diagramme à bâtons.
Nombre deJours. 20
10
0 1 2 3 4 5 Nombre d’absents par jour.
32
223. Variable quantitative classée:Histogramme dont le principe de représentation
est le suivant:
« L’aire de l’histogramme et de chaque rectangle construit est proportionnelle à l’effectif total et à l’effectif de chaque classe. »
33
Par exemple, si on considère la statistique suivante:
La statistique suivante donne l’âge de 40 individus ventilé en 6 classes.
Modalités : classes d’âge.
Effectifs : individus.
[18 – 20[ 4 [20 – 22[ 10 [22 – 24[ 12 [24 – 26[ 8 [26 – 28[ 4 [28 – 30[ 2
40
34
L ’amplitude des classes est la même pour toutes les classes et l ’histogramme a une représentation simple:
Nombre d’individus.
18 20 22 24 26 28 30 âge
35
Admettons maintenant que les deux dernières classes soient regroupées en une classe unique d’amplitude 4 années et d’effectif 6.
36
Nombre d’individus.
18 20 22 24 26 30 âge
4 10 12 8 3 3
Nombre d’individus.
18 20 22 24 26 30 âge
4 10 12 8 6 6
Image correcte.
Image incorrecte.
37
Classes Effectifs
[18, 20[ 40
[20, 22[ 100
[22, 25[ 120
[25, 30[ 80
[30, 40[ 50
[40, 50[ 45
[50, 55[ 30
[55, 60[ 15
[60, 65[ 5
Soit à représenter la variable classée:
38
Utilisation d’une macro
39
Classes d’âge
Effectifs
0
20
40
60
80
100
120
140
[18, 20[ [20, 22[ [22, 25[ [25, 30[ [30, 40[ [40, 50[ [50, 55[ [55, 60[ [60, 65[
40
23. Valeurs caractéristiques:la position.
3 types:
• Le mode;
• la médiane;
• les moyennes.
41
231. Le mode.C ’est la modalité de la variable la plus fréquemment
rencontrée.
• Ne se calcule pas;
• peut-être conventionnel;
• n ’est pas unique;
• n’a d’intérêt que s ’il domine véritablement;
• c ’est la modalité la plus probable.
42
232. La médiane.Valeur de la variable qui divise les observations en
deux groupes de même importance.
• On peut l’obtenir graphiquement en utilisant les cumuls croissants; ou par le calcul, si la variable est classée;
• 50 % des observations ont une valeur inférieure à la médiane.
43
Par exemple:a. 50 % des français ont un revenu salarié inférieur à
1350 euros;b. 50 % des salariés d ’une entreprise ont plus de 32
ans. c. Avec 50 % de nos clients on réalise un chiffre
d ’affaires inférieur à 15 500 euros.
44
233. Les moyennes:
Moyenne arithmétique : n
xnx
pi
iii
1
Moyenne harmonique : Moyenne géométrique : G xi
n
i
i p
ni
1
1
Moyenne quadratique : Q =n x
n
i ii
i p n2
1
1
Hnn
xi
ii
i n
1
45
Exemple de moyenne géométrique:On dispose de l’information concernant le chiffre d’affaires d’une entreprise sur 4 trimestres consécutifs.
Trimestres. Chiffre d’affaires (1000 euros)
1 100 2 140 3 152 4 190
46
Notons t le taux de croissance cherché, c’est à dire le taux de croissance trimestriel moyen sur l’année. La relation que t doit vérifier est donnée par :
19031100 t
Ainsi, la valeur de t peut-être calculée:
31
3
111
i
i itt
47
Exemple de moyenne harmonique: Considérons 3 individus qui ont sur l’exécution d’un certain type d’opérations des rendements horaires différents.
Individu rendement horaire 1 50 2 80 3 100
48
Il est connu qu’un rendement horaire est égal auquotient suivant :
Nombre total d’opérations à traiter.r =
Temps mis pour réaliser cesopérations.
La valeur ensuite dépend des circonstances danslesquelles le travail est réalisé.
49
Ce nombre peut-être arithmétique si le travail à réaliser est affecté globalement; mais il est harmonique si il est réparti également par exemple.