statistique 01
Post on 14-Oct-2015
38 Views
Preview:
TRANSCRIPT
-
Elment du Module:
1 - Statistique
CHERIF Walid - Statistique Anne universitaire: 2013/2014
Enseign par:
CHERIF Walid
ENSAJ
-
Ch. 01: Introduction la Statistique
1. Rappels et Gnralits:
CHERIF Walid - Statistique
La Statistique: mthode scientifiqueLes statistiques: produit de la statistique
Population et Individu: lunit {vivant sous le mme toit: mnage; liens demariage/sang: famille}
Echantillon: Maroc: a 6 000 000 mnages7200 : est un chantillon
: on peut mesurer lerreur dchantillon
Caractre: - qualitatif : * nominal: sexe.* ordinal: degr de satisfaction (peu, assez)
- quantitatif : * continu: ge* discret: taille du mnage
-
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Ex: Rpartition des mnages marocains selon les classes de dpense (en dh) entre 1999 et 2010
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10 ( * )
* : donne approximative (refus de dclaration)
Lgende : pour prciser plus dinformations
Tableau 01: rpartition des mnages marocainssuivant les classes de dpenses
Titre
Source 01: Enqute nationale sur la consommation. Direction de la statistique (2011)
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10
Effectif absolu
1510Total
Frquence relative
33,11 %
16,55 %
43,04 %
6,62 %
0,66 %
500
1510
250
1510
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Frquences absolues Frquences relatives Frquences cumules F . Cumules inverse
] 0 ; 1500 ] 500 33,11 % 33,11 % 100 %
] 1500 ; 5000 ] 250 16,55 % 49,66 % 66,99 %
] 5000 ; 15000 ] 650 43,04 % 92,7 % 51,33 %
] 15000 ; 30000 ] 100 6,62 % 99,33 % 7,3 %
] 30000 ; 100000] 10 0,66 % 100 % 0,66 %
1510Total
=
=
=1
= 100% 1
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Modalit Frquences absolues Frquence corrige
1 400 400
2 500 250
3 360 120
4 40 10
5 100 20
Frquence corrige :
=
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
a. Caractre qualitatif : Diagramme en tuyau dorgues / diagramme circulaire
Degr de satisfaction des clients
satisfait
moyen
peu
non0
10
20
30
40
Hommes Femmes
Nombre d'accidents
Nombred'accidents
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
b. Caractre quantitatif discret : Diagramme en bton
0
2
4
6
1999 2003 2007 2011
Tailles des mnages
Tailles desmnages
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
c. Caractre quantitatif continu: Histogramme
0
100
200
300
400
500
600
Dpenses des mnages
Dpenses desmnages
Ch. 01: Statistique un seul caractre
-
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
Polygone de frquence: Relie les points ( ; )
0
1
2
3
4
5
0 2 4 6 8 10 12
Evolution deschanges
ci : centres des classes
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
Yule :
Les caractristiques de tendance centrale doivent vrifier les conditions de Yule :- Proches des observations (1, 2 )- Etre bien dfinies- Tenir compte de toutes les observations (1, 2 )- Etre simples calculer- Avoir une signification- Se prter au calcul algbrique- Etre peu sensible aux fluctuations dchantillonnage.
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Observations individuelles : 1, 2 Observations groupes : 1 1 , 2 2
]1, 2] , ]1, 2] ]1, 2]
Dfinition:Valeur du caractre qui spare la population en 2 parties: 50% se situent au-dessous de la mdiane et 50% se situent au dessus
Exemple:Les notes de 5 tudiants: 15, 12, 03, 11, 02On classe les notes,La mdiane est la valeur du milieu: 11
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Pour N impair : = +12
Pour N pair : On aura 2 valeurs: = 2
et = +22
Par convention, on prend: = 2
] ; ]
] ; ]
] ; ]
ou
Cas des observations groupes:
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
= ()
= ()
= ()
Cas dun caractre quantitatif discret
() =
50%
tel que:
() < 50% ()
()
On prend:
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
10 1 5 % 5 %
20 2 10 % 15 %
28 3 14 % 29 %
52 4 26 % 55 %
70 5 35 % 90 %
20 6 10 % 100 %
Cas dun caractre quantitatif discret
= 4
On a: 3 = 29 %
4 = 55 %
3 < 50% 4
Donc :
200
Ch. 01: Statistique un seul caractre
-
47
53
45
50
55
24 ? 29
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Cas dun caractre quantitatif continu
=
= ,
[, ]
tel que:
= 50%
On a:
=
i.e:()()
()()=
a.n:
53 5053 47
=29 2924
c/c:
a
A
bB
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
1) La mdiane rend minimale la somme des carts absolus des observations % nombre u :
= =1
| u|
Ceci explique que la mdiane est la valeur la moins loigne des observations.(conditions de Yule)
2) La mdiane est invariable par transformation linaire :Si: , ont pour mdiane .Alors: , telles que : = . +
ont pour mdiane: = . +
3) Pour deux fonctions :croissante, et dcroissante, on a: = pour = .
Proprits de la mdiane :
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Dfinition:Valeur du caractre pour laquelle les frquences relatives sont les plusleves
Exemple:
Le nom Mohammed pour les prnoms arabes musulmans
4 Taille modale
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Classe modale
Dterminer le mode : m
m
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Remarque
Plusieurs populations => Plusieurs modes
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.1 - Moyenne arithmtique
1, 2 : des observations individuelles = =1
Proprits :
1) =1 ( ) = 0
2) Thorme de Koenig: =1 ( ) =
=1 ( ) +
2
3) B = =1 ( ) atteint son minimum pour : =
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
Proprits : 1) =1 ( ) = 0
2) Thorme de Koenig: =1 ( ) = =1
( ) + 2
3) B = =1 ( ) atteint son minimum pour : =
4) Si: = + Alors: = +
5) Soit une sous population de taille 1, et de moyenne 1, et une autre sous
population de taille 2, et de moyenne 2, alors: =11+22
1+2
6) Gnralisation: = =1
=1
3.1 - Moyenne arithmtique
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
- Cas dun caractre quantitatif discret:
3.1 - Moyenne arithmtique
- Observation individuelles: = =1
- Observation groupes:
= =1 =1
- Cas dun caractre quantitatif continu:
= =1 =1 : centre de classe =
1+2
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Gnralisation:
= 1 +
= . 1
= 11
:
= 1. (1 + )
= 1. (1 + )
1 = 2. (1 + ) = 1. 1 + = 2. (1 + ) = 1. (1 + )
1
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Application:
Vous avez investi en bourse le Mercredi : 05/02/14 un montant de 1000 dh.
Le jeudi : 06/02/14 a connu une croissance de 1 %.
Le vendredi : 07/02/14 a connu une baisse de 1 %.
Pouvez-vous retirer votre argent le vendredi?
Ch. 01: Statistique un seul caractre
=
=1
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Gnralisation:
= 1. 1 + 1 = 2. 1 + 2 . 1 + 1 =
1 2 3 4
= 0. =1
1 +
1 + (1 + )
= 0. (1 + )
1 + =
=1
1 +
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.3 - Moyenne harmonique
Application:
Sur lautoroute El Jadida Casablanca, la vitesse de la voiture varie d 1 Km un autre.
Calculer le temps moyen du trajet.
1 2 3 90
1 V2 90 3
= 1
=
1 = =1 1
:
=
=1 1
/:
Ch. 01: Statistique un seul caractre
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.4 - Moyenne quadratique
Application: Donnez le ct moyen des carrs
= =1
Gnralisation:
()= =1
= =1
Soit :
Ch. 01: Statistique un seul caractre
Notons les cts des carrs:
Les superficies des carrs sont donc:
La superficie moyenne des carrs est: =1
Do, le ct moyen est:
-
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.5 Comparaison des moyennes
Comparez les 4 moyennes : (n=2)
- =1+2
2
- = 1. 2
- =21
1+1
2
- =1+2
2
Ch. 01: Statistique un seul caractre
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Dispersion:
Htrognit
1, 2 : caractre quantitatif
: =
Exemple: N=31, 2, 3 12 = 2 1
13 = 3 1
23 = 3 2
=12 + 13 + 23
3
=(2 1) + (3 1) + (3 2)
3=2(3 1)
3=2( )
3=2
3
:
Ch. 01: Statistique un seul caractre
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Htrognit
1, 2 : caractre quantitatif
: =
1
2
3
fractile25 %
50%
75%
Ch. 01: Statistique un seul caractre
Fractile dordre 50 % = Mdiane
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Ch. 01: Statistique un seul caractre
Exemple :
10 %
25 %
30 %
] ; ] 10 %
] ; ] 20 %
] ; ]
= (10 %)
= (90 %)
(1) ()
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
2. Ecart absolu:
1, 2 : caractre quantitatif
=1
=1
Ch. 01: Statistique un seul caractre
=1
=1
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
2. Ecart type:
1, 2 : caractre quantitatif
=1
=1
( )
Ch. 01: Statistique un seul caractre
= V(X): Variance de X
: est appel coefficient de variation
-
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
2. Ecart type:
Ch. 01: Statistique un seul caractre
Proprit:
Si: a pour cart type Alors: ( + ) a pour cart type
=
- Dmontrez la proprit.
- Dmontrez que:
-
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
1. Mdiale: la distribution de 250 employs selon leur salaire
Salaire(en 1000 dh)
Centres de classes
Effectifs .
. cumuls croissants
[8 - 8,4[ 8,2 10 82 82
[8,4 - 8,8[ 8,6 30 258 340
[8,8 - 9,0[ 8,9 60 534 874
[9,0 - 9,2[ 9,1 72 655,2 1 529,2
[9,2 - 9,6[ 9,4 40 376 1 905,2
[9,6 - 10,2[ 9,9 24 237,6 2 142,8
[10,2 - 10,9[ 10,55 14 147,7 2 290,5
Total 250 2 290,5
On appelle mdiale le salaire Ml correspondant la moiti de la masse des salaires distribus
/2 = 1145,25
- Pour moins de 9000 dh, la somme des salaires est : 874 000 dh- Pour moins de 9200 F CFA, la somme des salaires est : 1 529 200 dhComme pour la mdiane, on dduit le salaire mdial: 9083 dh
La mdiane partage la masse des effectifs en deux fractions de mme poids.La mdiale partage la masse des . en deux fractions de mme poids.
-
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Lindice de Gini est une mesure statistique de la dispersion d'une distribution dans unepopulation donne, variant de 0 1:0 signifie l'galit parfaite et 1 signifie l'ingalit totale.Il est trs utilis pour mesurer l'ingalit des revenus dans un pays. Sil dpasse 0.67, le payspasse un tat critique.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0% 5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
55%
60%
65%
70%
75%
80%
85%
90%
95%
100
%
Part cumule de la population
Part cumule du revenu
-
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Analytiquement, pour n tranches, le coefficient de Gini s'obtient par la formule de Brown:
= 1 =0
1
+1 . +1
: part cumule de la population. : part cumule du revenu.
Pour n personnes ayant des revenus indics par ordre croissant ( +1):
=2 =1 . =1 + 1
-
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
-
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
1. Frquences:
=
= =1
:
=
-
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
2. Mode, mdiane et mdiale:
- Mdiane: Valeur du caractre qui spare la population en 2 parties:50% se situent au-dessous et 50% se situent au dessus.
- Mode: Valeur du caractre pour laquelle les frquences relativessont les plus leves.
- Mdiale: Valeur du caractre qui spare lensemble des valeurs observesen 2 parties: 50% se situent au-dessous et 50% au dessus.
-
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
3. Moyennes :
Moyenne Formule Utilisation Exemple
= =1
Observations indpendantes - Moyenne des salaires- Moyenne des tailles
=
=1
Observations dpendantes
Variation en (1+)- Taux bancaires- Bourse- Gomtrie
=
=1 1
Ecriture en 1
- Moyenne des vitesses- Moyenne des concentrations
= =1
Ecriture en - Moyenne des surfaces carrs
-
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
3. Ecarts :
=1
=1
=1
=1
=1
=1
( )
=
-
Fin du chapitre 1
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
-
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Comparaison
Dfinition Une srie statistique deux caractres est une srie dont les valeurs etles valeurs peuvent tre observes simultanment. Elles sont donnes pardes couples (; ).Leur reprsentation dans un repre orthogonal forment les points decoordonnes (; ). On lappelle nuage de points.
Statistique un seul caractre Statistique deux caractres
Taille 1,80 1,75 1,95 2,05 1,70
Athltes 30 20 12 3 15
Salaire [5000, 8000[
[8000, 11000[
[11000, 14000[
Employs 30 20 12
Taille dun chantillon de 80 athltes
Tranches de salaires des employsdune socit
Taille 1,80 1,75 1,95 2,05 1,70
Poids 75 74 90 93 85
Taille et poids dun chantillon dathltes
-
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Exemple 1 :Tailles et Poids des 10 athltes
Poids 80 90 93 75 86 97 124 88 90 75
Taille 1,82 1,88 1,97 1,65 1,92 1,99 2,01 1,88 1,93 1,75
Donner le nuage de points associ cette srie statistique
1,61,65
1,71,75
1,81,85
1,91,95
22,05
2,1
70 90 110
-
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Exemple 2 : La moyenne des tudiants suivant le nombre dheures deprparation des examens
Nombre dheures 2 10 30 15 13 28 22
Moyenne 6 14 15 16 10 18 14
Donner le nuage de points associ cette srie statistique
02468
101214161820
0 10 20 30 40
-
Ch. 02: Statistique 2 variables :
Exemple 3 : La part consacre au logement dans le budget dun foyer ( en 1000 dh).
CHERIF Walid - Statistique
Revenu 8,6 10,5 9,5 8,1 9,7 6,5 7,1
D. Logement 4,4 5,2 4,3 3,2 3,3 2,8 3,5
Donner le nuage de points associ cette srie statistique
0
1
2
3
4
5
6
6 7 8 9 10 11
Logement
-
Ch. 02: Statistique 2 variables :
2.1 - Point moyen
CHERIF Walid - Statistique
0
1
2
3
4
5
6
6 7 8 9 10 11
Le point moyen dun nuage de points est le point G de coordonnes ( ; ) o :
=1
=0 =
1
=0
-
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
Effectuer un ajustement de en dun nuage de points par la mthode desmoindres carrs consiste trouver la fonction f du modle retenu qui minimise la
somme des carrs des carts entre les valeurs observes et les valeurs f()donnes par le modle.
La fonction f doit donc minimiser lexpression: =1
( f())
CHERIF Walid - Statistique
Interprtation graphique:
Cela revient minimiser la somme des carrs des distances verticales entre la courbe et les points du nuage :
(1 1) + (2 2) + + ( )
-
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Remarque :
1. Pour une valeur 0 donne du caractre , la fonction f permet de prvoir le rsultat correspondant de la variable .
On supposera que 0 f(0).
2. Si 0 appartient est compris entre 1 et :on parle dinterpolation.
3. Si 0 est en dehors de lintervalledobservation du caractre x:
on parle dextrapolation
-
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Ajustement affine par la mthode des moindres carrs:
On appelle covariance de et de le nombre :
cov , =1
=1
( )( )
La variance du caractre est:
V =1
=1
Elle est utilise pour le calcul de lcart type :
() = ()
V = cov ,
-
Ch. 02: Statistique 2 variables :
Thorme :
CHERIF Walid - Statistique
Lors dun ajustement affine par la mthode des moindres carrs:
La droite (D) servant lajustement de en :- a comme coefficient directeur:
=(, )
()- passe par le point moyen du nuage: G( , ).
1. Ces deux donnes permettent de dterminer une quation de cette droite.
2. Cette droite est appele droite de rgression de y en x.
-
Ch. 02: Statistique 2 variables :
Exemple : On prend lexemple des parts du logement, mais en remplaant lavariable par = 1978 (prendre le rang des annes)
CHERIF Walid - Statistique
Anne 1978 1984 1992 1994 2000 2004 2009
Rang des annes 0 6 14 16 22 26 31
Part en % 4,4 5,2 4,3 3,2 3,3 2,8 3,5
On a dj vu que: = 16,42 et = 3, 81.Pour calculer la variance et la covariance:
La liste 1 (1) contient les La liste 2 (2) contient les La liste 3 (3) contient , cest--dire : 3 = 1 16,42 La liste 4 (4) contient ( ), cest--dire : 4 = 3. La liste 5 (5) contient , cest--dire: 5 =2 3, 81 La liste 6 (6) contient ( ) ( ), cest--dire 6 = 3 5
On a alors: =(, )
()(, )=
(6)
7()=
(4)
7
La droite de rgression: = (,)
() + b. Elle passe par G (on obtient b).
-
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Dans le cas d'un nuage de points de forme allonge, et afin de faciliter l'tude de la srie, il est possible de remplacer ce nuage par une droite appele droite d'ajustement affine.Pour tracer cette droite, on utilise la mthode de Mayer.Exemple : Le tableau suivant donne le chiffre d'affaire ralis au cours des 6 derniers mois par un site de vente en fonction du nombre de commandes reues:
Nombre de commandes
6 400 8 350 9 125 9 600 10 050 12 000
Chiffre daffaire mensuel
250 000 320 000 335 000 350 000 370 000 400 000
-
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Reprsentation du nuage de points :
200000
250000
300000
350000
400000
450000
5000 7000 9000 11000 13000
-
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Calcul des coordonnes des points moyens 1 et 2:
On partage le nuage de points en deux groupes de mme importance suivant les valeurscroissantes de , et on calcule les coordonnes des points moyens 1 et 2 de chaquegroupe de points:
1=6400+8350+9125
31(1, 1) 1=
250000+320000+335000
3
2=9600+10050+12000
32(2, 2) 2=
350000+370000+400000
3
On trace la droite d'ajustement qui passe par les deux points 1 et 2
Equation de la droite d'ajustement affine :
= + o: =21
21 = 1 . 1 = 2 . 2
-
Ch. 02: Statistique 2 variables :
Exercice 01:
CHERIF Walid - Statistique
Depuis 1900, les chercheurs ont relev des tats de contamination du virus RG2 chezcertaines races doiseaux.Leur recherche les a men lier la cause du virus au climat des rgions concernes.Le tableau suivant regroupe le nombre doiseaux atteints par ce virus:
Climat 81 84 89 93 97 99
Nombre doiseaux
2 500 3 200 4 500 3 300 1 900 4 900
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Question 01 :Existe-t-il une relation entre les investissements publicitaires duneentreprise et lvolution de son chiffre daffaires ?
Question 02:Existe-t-il une relation entre la place dun tudiant dans la classe et sa notefinale?
Ltude de la corrlation entre deux sries permet didentifier ladpendance ou lindpendance qui existe entre deux sries. Ce degr dedpendance peut tre vrifi en calculant le coefficient de corrlation ouvrifi par les droites dajustement.
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Interprtation:
-1 r 1
Lorsque la corrlation est forte (r ):les droites de rgression sont trs proches et le nuage peut treapproxim par une droite.
Lorsque la corrlation est faible, le nuage de points ne peut pas treajust par une droite, mais il se peut quune autre courbe permette unbon ajustement.
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple:
Existe une corrlation entre la taille et le poids des athltes dun clubdescalade.Les donnes individuelles sont indiques dans le tableau suivant:
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Droite dajustement (ou de rgression des moindres carrs):
Nous avons vu quil tait possible de calculer la droite dajustement dunesrie de donnes. De la mme faon il est possible de calculer la droitedajustement dune srie 2 variables.Cette dernire na de sens que sil existe une corrlation entre les deuxsries de donnes.
Rappel:Droite de la forme y = a.x + b de telle sorte que la somme des carts positifs la droite soit gale la somme des carts ngatifs
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
La droite trace se prsente ainsi, la corrlation de 0,949 est forte et lespoints sont resserrs autour de la courbe de tendance.
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 1:
Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs et les plus-values ralises.
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 1:
Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs et les plus-values ralises.
La droite trace correspond unecorrlation faible, et les pointssont disperss autour de la droite.
Un coefficient de corrlation de +1 correspond une courbe de tendance ascendante et une corrlation ngative une courbe descendante.
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 2:
Nous tudions la corrlation entre le prix de vente dun article et le chiffre daffaires ralis. Un article vendu gnre 50 dh de CA et 5 articles gnrent 250 dh de CA.
La corrlation est totale le coefficient de +1=> La courbe est ascendante
-
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 3:
Nous tudions la corrlation entre le nombre darticles achet et son prix dachat. Plus la quantit achete est importante et plus le prix dachat unitaire est faible.
La corrlation est total le coefficient de -1=> La courbe est descendante :
-
CHERIF Walid - Statistique
- Suite -
La socit Pol-Arctique est spcialisedans la commercialisation de vtementsde sport.On vous communique ci-dessous le CAdes 6 dernires annes et les dpenses depublicit
1. Existe-t-il une corrlation entre lesdpenses de publicit et le CA ?
2. Calculer le CA Prvisionnel de 2010
Exercice 02
Ch. 02 - TD
-
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Le tableau suivant donne la rpartition dun chantillon de mnages
ruraux selon la dpense annuelle totale X en milliers de dirhams et la
dpense annuelle en lectricit Y en centaines de dirhams.
Pour mesurer lintensit de la corrlation entre deux caractres quantitatifs, on
tudie les variations des moyennes conditionnelles ou
X \ Y 0-3 3-4 4-5 5-7,5 7,5-10 Total
0-5 6,3 1,1 0,4 0,4 0,4 8,6
5-7,5 3,6 1,5 0,8 1,7 0,2 7,6
7,5-10 2,5 1,1 1,7 1,3 0,4 7,0
10-14 4,4 5,0 2,8 4,2 1,5 17,9
14-18 0,4 2,9 3,8 6,3 2,2 15,6
18-24 0,6 1,5 2,8 7,0 2,3 14,2
24-30 1,3 0,5 3,2 14,0 9,6 28,9
Total 19,1 13,9 15,5 34,9 16,6 100,00
-
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Complter le tableau de calcul:
Moyennes conditionnelles suivant Y
Moyennes conditionnelles suivant X
1 =2,5 6,3 + 6,25 3,6 + 8,75 2,5 + 12 4,4 + 16 0,4 + 21 0,6 + 27 1,3
6,3 + 3,6 + 2,5 + 4,4 + 0,4 + 0,6 + 1,3
X \ Y 0-3
0-5 6,3
5-7,5 3,6
7,5-10 2,5
10-14 4,4
14-18 0,4
18-24 0,6
24-30 1,3
Total 19,1
-
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Dans le tableau de calcul: on a remplac chaque classe par son centre et
on a calcul les moyennes conditionnelles :
2,5 6,25 8,75 12,00 16,00 21,00 27,00
2,4535 3,4135 3,8393 4,25 5,5288 5,8187 6,5969
Moyennes conditionnelles suivant Y
1,5 3,5 4,5 6,25 8,75
8,745 12,946 16,805 20,034 21,812
Moyennes conditionnelles suivant X
Analyse 1: La dpense moyenne en lectricit croit avec le centre
La dpense moyenne en lectricit croit avec le centre
-
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Courbe de rgression Y en X Courbe de rgression X en Y
-
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Quoiquil ny a pas de relation directe entre la dpense annuelle en
lectricit et la dpense annuelle totale dun mnage, on peut affirmer
que quand la dpense totale augmente, la dpense en lectricit
augmente, mais seulement en moyenne .
Dfinition:
On appelle:
courbe de rgression Y en X, la ligne brise qui joint les pointsMi(xi, yi).
courbe de rgression X en Y, la ligne brise qui joint les points Mj(yj, xi).
Ces deux courbes nous renseignent graphiquement sur le sens et le degr
de la corrlation entre X et Y.
-
Ch. 02: Statistique 2 variables :
1. Distributions marginales
CHERIF Walid - Statistique
On note le nombre dindividus prsentant les modalits et .
( =1 =1 = )
Tableau statistique dune tude simultane de deux caractres
Modalits du caractre X
Modalits du caractre Y Distribution marginale de X
1
1
11 1 1
1
1
1 .
.
.
Distribution de Y . 1 . . . . =
-
Ch. 02: Statistique 2 variables :
1. Distributions marginales
CHERIF Walid - Statistique
On appelle frquence du couple (ou frquence totale) des modalits et la
proportion dindividus qui prsentent simultanment les modalits et :
=
Distributions marginales :
Les effectifs . dfinissent la distribution marginale de X.La frquence marginale de la modalit est :
. = .
De mme pour Y, on dfinit les frquences marginales . =.
-
Ch. 02: Statistique 2 variables :
2. Distributions conditionnelles
CHERIF Walid - Statistique
La j me colonne du tableau statistique dcrit la sous population des individus possdant la modalit suivant le caractre X. La frquence conditionnelle
de la modalit sachant (ou lie ) est: =
.( f i sachant j)
De mme, la distribution conditionnelle sachant est :
= .
Remarque:
== . .
= . .
-
Ch. 02: Statistique 2 variables :
3. Indpendance et dpendance
CHERIF Walid - Statistique
Le caractre X est indpendant du caractre Y si les distributions
conditionnelles (|) sont identiques entre elles :
ne dpend pas de et
sont alors identiques la distribution de X.
Les colonnes du tableau statistique sont proportionnelles entre elles.
Exemple: - caractres indpendants -
Modalits du caractre X
Modalits du caractre Y
1 2 3 4
1
2
3
3 5 2 4
6 10 4 8
12 20 8 16
-
Ch. 02: Statistique 2 variables :
3. Indpendance et dpendance
CHERIF Walid - Statistique
Le Chi-deux : - mesure de lintensit de la dpendance entre X et Y -
Le Chi-deux permet de comparer le tableau des effectifs relevs cequil aurait du tre si les caractres avaient t indpendants.
= =1
=1
(
. . . )
. . .
= N ( =1
=1
. . . 1)
Proprits :
- Les caractres X et Y sont indpendants ssi X=0.- X 0 est dautant plus grand que la liaison entre X et Y est forte.
-
Ch. 02: Statistique 2 variables :
Application
Indpendance:
CHERIF Walid - Statistique
P1. X et Y sont indpendants si les distributions conditionnelles
selon le caractre Y, pour X fix sont identiques.
X/Y B1 B2 B3 B4 Total
A1 5 15 20 10 50
A2 8 24 32 16 80
A3 7 21 28 14 70
Total 20 60 80 40 200
(n11)
(n21)
(n.1) (n.2)
1. Considrons les individus qui prsentent la modalit B3, parmi ceux qui
prsentent les modalits A1, A2 et A3:100 x 20/50 = 40% pour A1
100 x 32/80 = 40% pour A2
100 x 28/70 = 40% pour A3
3/1 = 3/2
= 3/3= 40 %
3/1
3/2
.
P2. X et Y sont indpendants si et seulement si les frquencesconditionnelles
sont le produit des frquences marginales . et .
top related