statistique 01

Upload: sidimohamedben

Post on 14-Oct-2015

38 views

Category:

Documents


2 download

TRANSCRIPT

  • Elment du Module:

    1 - Statistique

    CHERIF Walid - Statistique Anne universitaire: 2013/2014

    Enseign par:

    CHERIF Walid

    ENSAJ

  • Ch. 01: Introduction la Statistique

    1. Rappels et Gnralits:

    CHERIF Walid - Statistique

    La Statistique: mthode scientifiqueLes statistiques: produit de la statistique

    Population et Individu: lunit {vivant sous le mme toit: mnage; liens demariage/sang: famille}

    Echantillon: Maroc: a 6 000 000 mnages7200 : est un chantillon

    : on peut mesurer lerreur dchantillon

    Caractre: - qualitatif : * nominal: sexe.* ordinal: degr de satisfaction (peu, assez)

    - quantitatif : * continu: ge* discret: taille du mnage

  • Ch. 01: Statistique un seul caractre

    2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Tableau statistique

    Ex: Rpartition des mnages marocains selon les classes de dpense (en dh) entre 1999 et 2010

    Classes de dpense Nombre de mnages

    ] 0 ; 1500 ] 500

    ] 1500 ; 5000 ] 250

    ] 5000 ; 15000 ] 650

    ] 15000 ; 30000 ] 100

    ] 30000 ; 100000] 10 ( * )

    * : donne approximative (refus de dclaration)

    Lgende : pour prciser plus dinformations

    Tableau 01: rpartition des mnages marocainssuivant les classes de dpenses

    Titre

    Source 01: Enqute nationale sur la consommation. Direction de la statistique (2011)

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Tableau statistique

    Classes de dpense Nombre de mnages

    ] 0 ; 1500 ] 500

    ] 1500 ; 5000 ] 250

    ] 5000 ; 15000 ] 650

    ] 15000 ; 30000 ] 100

    ] 30000 ; 100000] 10

    Effectif absolu

    1510Total

    Frquence relative

    33,11 %

    16,55 %

    43,04 %

    6,62 %

    0,66 %

    500

    1510

    250

    1510

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Tableau statistique

    Classes de dpense Frquences absolues Frquences relatives Frquences cumules F . Cumules inverse

    ] 0 ; 1500 ] 500 33,11 % 33,11 % 100 %

    ] 1500 ; 5000 ] 250 16,55 % 49,66 % 66,99 %

    ] 5000 ; 15000 ] 650 43,04 % 92,7 % 51,33 %

    ] 15000 ; 30000 ] 100 6,62 % 99,33 % 7,3 %

    ] 30000 ; 100000] 10 0,66 % 100 % 0,66 %

    1510Total

    =

    =

    =1

    = 100% 1

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Tableau statistique

    Modalit Frquences absolues Frquence corrige

    1 400 400

    2 500 250

    3 360 120

    4 40 10

    5 100 20

    Frquence corrige :

    =

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Reprsentation graphique

    a. Caractre qualitatif : Diagramme en tuyau dorgues / diagramme circulaire

    Degr de satisfaction des clients

    satisfait

    moyen

    peu

    non0

    10

    20

    30

    40

    Hommes Femmes

    Nombre d'accidents

    Nombred'accidents

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Reprsentation graphique

    b. Caractre quantitatif discret : Diagramme en bton

    0

    2

    4

    6

    1999 2003 2007 2011

    Tailles des mnages

    Tailles desmnages

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Reprsentation graphique

    c. Caractre quantitatif continu: Histogramme

    0

    100

    200

    300

    400

    500

    600

    Dpenses des mnages

    Dpenses desmnages

    Ch. 01: Statistique un seul caractre

  • 2. Tableaux statistiques et reprsentations graphiques:

    CHERIF Walid - Statistique

    Reprsentation graphique

    Polygone de frquence: Relie les points ( ; )

    0

    1

    2

    3

    4

    5

    0 2 4 6 8 10 12

    Evolution deschanges

    ci : centres des classes

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    Yule :

    Les caractristiques de tendance centrale doivent vrifier les conditions de Yule :- Proches des observations (1, 2 )- Etre bien dfinies- Tenir compte de toutes les observations (1, 2 )- Etre simples calculer- Avoir une signification- Se prter au calcul algbrique- Etre peu sensible aux fluctuations dchantillonnage.

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    Observations individuelles : 1, 2 Observations groupes : 1 1 , 2 2

    ]1, 2] , ]1, 2] ]1, 2]

    Dfinition:Valeur du caractre qui spare la population en 2 parties: 50% se situent au-dessous de la mdiane et 50% se situent au dessus

    Exemple:Les notes de 5 tudiants: 15, 12, 03, 11, 02On classe les notes,La mdiane est la valeur du milieu: 11

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    Pour N impair : = +12

    Pour N pair : On aura 2 valeurs: = 2

    et = +22

    Par convention, on prend: = 2

    ] ; ]

    ] ; ]

    ] ; ]

    ou

    Cas des observations groupes:

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    = ()

    = ()

    = ()

    Cas dun caractre quantitatif discret

    () =

    50%

    tel que:

    () < 50% ()

    ()

    On prend:

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    10 1 5 % 5 %

    20 2 10 % 15 %

    28 3 14 % 29 %

    52 4 26 % 55 %

    70 5 35 % 90 %

    20 6 10 % 100 %

    Cas dun caractre quantitatif discret

    = 4

    On a: 3 = 29 %

    4 = 55 %

    3 < 50% 4

    Donc :

    200

    Ch. 01: Statistique un seul caractre

  • 47

    53

    45

    50

    55

    24 ? 29

    Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    Cas dun caractre quantitatif continu

    =

    = ,

    [, ]

    tel que:

    = 50%

    On a:

    =

    i.e:()()

    ()()=

    a.n:

    53 5053 47

    =29 2924

    c/c:

    a

    A

    bB

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    1. La mdiane :

    1) La mdiane rend minimale la somme des carts absolus des observations % nombre u :

    = =1

    | u|

    Ceci explique que la mdiane est la valeur la moins loigne des observations.(conditions de Yule)

    2) La mdiane est invariable par transformation linaire :Si: , ont pour mdiane .Alors: , telles que : = . +

    ont pour mdiane: = . +

    3) Pour deux fonctions :croissante, et dcroissante, on a: = pour = .

    Proprits de la mdiane :

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    2. Le mode :

    Dfinition:Valeur du caractre pour laquelle les frquences relatives sont les plusleves

    Exemple:

    Le nom Mohammed pour les prnoms arabes musulmans

    4 Taille modale

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    2. Le mode :

    Cas dune distribution continue

    Classe modale

    Dterminer le mode : m

    m

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    2. Le mode :

    Cas dune distribution continue

    Remarque

    Plusieurs populations => Plusieurs modes

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.1 - Moyenne arithmtique

    1, 2 : des observations individuelles = =1

    Proprits :

    1) =1 ( ) = 0

    2) Thorme de Koenig: =1 ( ) =

    =1 ( ) +

    2

    3) B = =1 ( ) atteint son minimum pour : =

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    Proprits : 1) =1 ( ) = 0

    2) Thorme de Koenig: =1 ( ) = =1

    ( ) + 2

    3) B = =1 ( ) atteint son minimum pour : =

    4) Si: = + Alors: = +

    5) Soit une sous population de taille 1, et de moyenne 1, et une autre sous

    population de taille 2, et de moyenne 2, alors: =11+22

    1+2

    6) Gnralisation: = =1

    =1

    3.1 - Moyenne arithmtique

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    - Cas dun caractre quantitatif discret:

    3.1 - Moyenne arithmtique

    - Observation individuelles: = =1

    - Observation groupes:

    = =1 =1

    - Cas dun caractre quantitatif continu:

    = =1 =1 : centre de classe =

    1+2

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.2 - Moyenne gomtrique

    Gnralisation:

    = 1 +

    = . 1

    = 11

    :

    = 1. (1 + )

    = 1. (1 + )

    1 = 2. (1 + ) = 1. 1 + = 2. (1 + ) = 1. (1 + )

    1

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.2 - Moyenne gomtrique

    Application:

    Vous avez investi en bourse le Mercredi : 05/02/14 un montant de 1000 dh.

    Le jeudi : 06/02/14 a connu une croissance de 1 %.

    Le vendredi : 07/02/14 a connu une baisse de 1 %.

    Pouvez-vous retirer votre argent le vendredi?

    Ch. 01: Statistique un seul caractre

    =

    =1

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.2 - Moyenne gomtrique

    Gnralisation:

    = 1. 1 + 1 = 2. 1 + 2 . 1 + 1 =

    1 2 3 4

    = 0. =1

    1 +

    1 + (1 + )

    = 0. (1 + )

    1 + =

    =1

    1 +

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.3 - Moyenne harmonique

    Application:

    Sur lautoroute El Jadida Casablanca, la vitesse de la voiture varie d 1 Km un autre.

    Calculer le temps moyen du trajet.

    1 2 3 90

    1 V2 90 3

    = 1

    =

    1 = =1 1

    :

    =

    =1 1

    /:

    Ch. 01: Statistique un seul caractre

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.4 - Moyenne quadratique

    Application: Donnez le ct moyen des carrs

    = =1

    Gnralisation:

    ()= =1

    = =1

    Soit :

    Ch. 01: Statistique un seul caractre

    Notons les cts des carrs:

    Les superficies des carrs sont donc:

    La superficie moyenne des carrs est: =1

    Do, le ct moyen est:

  • Caractristiques de tendance centrale de position ou de location

    CHERIF Walid - Statistique

    3. La moyenne:

    3.5 Comparaison des moyennes

    Comparez les 4 moyennes : (n=2)

    - =1+2

    2

    - = 1. 2

    - =21

    1+1

    2

    - =1+2

    2

    Ch. 01: Statistique un seul caractre

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    1. Dispersion:

    Htrognit

    1, 2 : caractre quantitatif

    : =

    Exemple: N=31, 2, 3 12 = 2 1

    13 = 3 1

    23 = 3 2

    =12 + 13 + 23

    3

    =(2 1) + (3 1) + (3 2)

    3=2(3 1)

    3=2( )

    3=2

    3

    :

    Ch. 01: Statistique un seul caractre

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    1. Fractiles:

    Htrognit

    1, 2 : caractre quantitatif

    : =

    1

    2

    3

    fractile25 %

    50%

    75%

    Ch. 01: Statistique un seul caractre

    Fractile dordre 50 % = Mdiane

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    1. Fractiles:

    Ch. 01: Statistique un seul caractre

    Exemple :

    10 %

    25 %

    30 %

    ] ; ] 10 %

    ] ; ] 20 %

    ] ; ]

    = (10 %)

    = (90 %)

    (1) ()

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    2. Ecart absolu:

    1, 2 : caractre quantitatif

    =1

    =1

    Ch. 01: Statistique un seul caractre

    =1

    =1

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    2. Ecart type:

    1, 2 : caractre quantitatif

    =1

    =1

    ( )

    Ch. 01: Statistique un seul caractre

    = V(X): Variance de X

    : est appel coefficient de variation

  • Caractristiques de dispersion et de forme

    CHERIF Walid - Statistique

    2. Ecart type:

    Ch. 01: Statistique un seul caractre

    Proprit:

    Si: a pour cart type Alors: ( + ) a pour cart type

    =

    - Dmontrez la proprit.

    - Dmontrez que:

  • Complment

    CHERIF Walid - Statistique

    Mdiale et indice de Gini

    Ch. 01: Statistique un seul caractre

    1. Mdiale: la distribution de 250 employs selon leur salaire

    Salaire(en 1000 dh)

    Centres de classes

    Effectifs .

    . cumuls croissants

    [8 - 8,4[ 8,2 10 82 82

    [8,4 - 8,8[ 8,6 30 258 340

    [8,8 - 9,0[ 8,9 60 534 874

    [9,0 - 9,2[ 9,1 72 655,2 1 529,2

    [9,2 - 9,6[ 9,4 40 376 1 905,2

    [9,6 - 10,2[ 9,9 24 237,6 2 142,8

    [10,2 - 10,9[ 10,55 14 147,7 2 290,5

    Total 250 2 290,5

    On appelle mdiale le salaire Ml correspondant la moiti de la masse des salaires distribus

    /2 = 1145,25

    - Pour moins de 9000 dh, la somme des salaires est : 874 000 dh- Pour moins de 9200 F CFA, la somme des salaires est : 1 529 200 dhComme pour la mdiane, on dduit le salaire mdial: 9083 dh

    La mdiane partage la masse des effectifs en deux fractions de mme poids.La mdiale partage la masse des . en deux fractions de mme poids.

  • Complment

    CHERIF Walid - Statistique

    Mdiale et indice de Gini

    Ch. 01: Statistique un seul caractre

    2. Indice de GINI :

    Lindice de Gini est une mesure statistique de la dispersion d'une distribution dans unepopulation donne, variant de 0 1:0 signifie l'galit parfaite et 1 signifie l'ingalit totale.Il est trs utilis pour mesurer l'ingalit des revenus dans un pays. Sil dpasse 0.67, le payspasse un tat critique.

    0%

    10%

    20%

    30%

    40%

    50%

    60%

    70%

    80%

    90%

    100%

    0% 5%

    10%

    15%

    20%

    25%

    30%

    35%

    40%

    45%

    50%

    55%

    60%

    65%

    70%

    75%

    80%

    85%

    90%

    95%

    100

    %

    Part cumule de la population

    Part cumule du revenu

  • Complment

    CHERIF Walid - Statistique

    Mdiale et indice de Gini

    Ch. 01: Statistique un seul caractre

    2. Indice de GINI :

    Analytiquement, pour n tranches, le coefficient de Gini s'obtient par la formule de Brown:

    = 1 =0

    1

    +1 . +1

    : part cumule de la population. : part cumule du revenu.

    Pour n personnes ayant des revenus indics par ordre croissant ( +1):

    =2 =1 . =1 + 1

  • Complment

    CHERIF Walid - Statistique

    Mdiale et indice de Gini

    Ch. 01: Statistique un seul caractre

    2. Indice de GINI :

  • Rsum

    CHERIF Walid - Statistique

    Ch. 01: Statistique un seul caractre

    1. Frquences:

    =

    = =1

    :

    =

  • Rsum

    CHERIF Walid - Statistique

    Ch. 01: Statistique un seul caractre

    2. Mode, mdiane et mdiale:

    - Mdiane: Valeur du caractre qui spare la population en 2 parties:50% se situent au-dessous et 50% se situent au dessus.

    - Mode: Valeur du caractre pour laquelle les frquences relativessont les plus leves.

    - Mdiale: Valeur du caractre qui spare lensemble des valeurs observesen 2 parties: 50% se situent au-dessous et 50% au dessus.

  • Rsum

    CHERIF Walid - Statistique

    Ch. 01: Statistique un seul caractre

    3. Moyennes :

    Moyenne Formule Utilisation Exemple

    = =1

    Observations indpendantes - Moyenne des salaires- Moyenne des tailles

    =

    =1

    Observations dpendantes

    Variation en (1+)- Taux bancaires- Bourse- Gomtrie

    =

    =1 1

    Ecriture en 1

    - Moyenne des vitesses- Moyenne des concentrations

    = =1

    Ecriture en - Moyenne des surfaces carrs

  • Rsum

    CHERIF Walid - Statistique

    Ch. 01: Statistique un seul caractre

    3. Ecarts :

    =1

    =1

    =1

    =1

    =1

    =1

    ( )

    =

  • Fin du chapitre 1

    CHERIF Walid - Statistique

    Ch. 01: Statistique un seul caractre

  • Ch. 02: Statistique deux caractres

    CHERIF Walid - Statistique

    Comparaison

    Dfinition Une srie statistique deux caractres est une srie dont les valeurs etles valeurs peuvent tre observes simultanment. Elles sont donnes pardes couples (; ).Leur reprsentation dans un repre orthogonal forment les points decoordonnes (; ). On lappelle nuage de points.

    Statistique un seul caractre Statistique deux caractres

    Taille 1,80 1,75 1,95 2,05 1,70

    Athltes 30 20 12 3 15

    Salaire [5000, 8000[

    [8000, 11000[

    [11000, 14000[

    Employs 30 20 12

    Taille dun chantillon de 80 athltes

    Tranches de salaires des employsdune socit

    Taille 1,80 1,75 1,95 2,05 1,70

    Poids 75 74 90 93 85

    Taille et poids dun chantillon dathltes

  • Ch. 02: Statistique deux caractres

    CHERIF Walid - Statistique

    Exemple 1 :Tailles et Poids des 10 athltes

    Poids 80 90 93 75 86 97 124 88 90 75

    Taille 1,82 1,88 1,97 1,65 1,92 1,99 2,01 1,88 1,93 1,75

    Donner le nuage de points associ cette srie statistique

    1,61,65

    1,71,75

    1,81,85

    1,91,95

    22,05

    2,1

    70 90 110

  • Ch. 02: Statistique deux caractres

    CHERIF Walid - Statistique

    Exemple 2 : La moyenne des tudiants suivant le nombre dheures deprparation des examens

    Nombre dheures 2 10 30 15 13 28 22

    Moyenne 6 14 15 16 10 18 14

    Donner le nuage de points associ cette srie statistique

    02468

    101214161820

    0 10 20 30 40

  • Ch. 02: Statistique 2 variables :

    Exemple 3 : La part consacre au logement dans le budget dun foyer ( en 1000 dh).

    CHERIF Walid - Statistique

    Revenu 8,6 10,5 9,5 8,1 9,7 6,5 7,1

    D. Logement 4,4 5,2 4,3 3,2 3,3 2,8 3,5

    Donner le nuage de points associ cette srie statistique

    0

    1

    2

    3

    4

    5

    6

    6 7 8 9 10 11

    Logement

  • Ch. 02: Statistique 2 variables :

    2.1 - Point moyen

    CHERIF Walid - Statistique

    0

    1

    2

    3

    4

    5

    6

    6 7 8 9 10 11

    Le point moyen dun nuage de points est le point G de coordonnes ( ; ) o :

    =1

    =0 =

    1

    =0

  • Ch. 02: Statistique 2 variables :

    2.2 - Ajustement par la mthode des moindres carrs

    Effectuer un ajustement de en dun nuage de points par la mthode desmoindres carrs consiste trouver la fonction f du modle retenu qui minimise la

    somme des carrs des carts entre les valeurs observes et les valeurs f()donnes par le modle.

    La fonction f doit donc minimiser lexpression: =1

    ( f())

    CHERIF Walid - Statistique

    Interprtation graphique:

    Cela revient minimiser la somme des carrs des distances verticales entre la courbe et les points du nuage :

    (1 1) + (2 2) + + ( )

  • Ch. 02: Statistique 2 variables :

    2.2 - Ajustement par la mthode des moindres carrs

    CHERIF Walid - Statistique

    Remarque :

    1. Pour une valeur 0 donne du caractre , la fonction f permet de prvoir le rsultat correspondant de la variable .

    On supposera que 0 f(0).

    2. Si 0 appartient est compris entre 1 et :on parle dinterpolation.

    3. Si 0 est en dehors de lintervalledobservation du caractre x:

    on parle dextrapolation

  • Ch. 02: Statistique 2 variables :

    2.2 - Ajustement par la mthode des moindres carrs

    CHERIF Walid - Statistique

    Ajustement affine par la mthode des moindres carrs:

    On appelle covariance de et de le nombre :

    cov , =1

    =1

    ( )( )

    La variance du caractre est:

    V =1

    =1

    Elle est utilise pour le calcul de lcart type :

    () = ()

    V = cov ,

  • Ch. 02: Statistique 2 variables :

    Thorme :

    CHERIF Walid - Statistique

    Lors dun ajustement affine par la mthode des moindres carrs:

    La droite (D) servant lajustement de en :- a comme coefficient directeur:

    =(, )

    ()- passe par le point moyen du nuage: G( , ).

    1. Ces deux donnes permettent de dterminer une quation de cette droite.

    2. Cette droite est appele droite de rgression de y en x.

  • Ch. 02: Statistique 2 variables :

    Exemple : On prend lexemple des parts du logement, mais en remplaant lavariable par = 1978 (prendre le rang des annes)

    CHERIF Walid - Statistique

    Anne 1978 1984 1992 1994 2000 2004 2009

    Rang des annes 0 6 14 16 22 26 31

    Part en % 4,4 5,2 4,3 3,2 3,3 2,8 3,5

    On a dj vu que: = 16,42 et = 3, 81.Pour calculer la variance et la covariance:

    La liste 1 (1) contient les La liste 2 (2) contient les La liste 3 (3) contient , cest--dire : 3 = 1 16,42 La liste 4 (4) contient ( ), cest--dire : 4 = 3. La liste 5 (5) contient , cest--dire: 5 =2 3, 81 La liste 6 (6) contient ( ) ( ), cest--dire 6 = 3 5

    On a alors: =(, )

    ()(, )=

    (6)

    7()=

    (4)

    7

    La droite de rgression: = (,)

    () + b. Elle passe par G (on obtient b).

  • Ch. 02: Statistique 2 variables :

    Droite d'ajustement affine : Mthode de Mayer

    CHERIF Walid - Statistique

    Dans le cas d'un nuage de points de forme allonge, et afin de faciliter l'tude de la srie, il est possible de remplacer ce nuage par une droite appele droite d'ajustement affine.Pour tracer cette droite, on utilise la mthode de Mayer.Exemple : Le tableau suivant donne le chiffre d'affaire ralis au cours des 6 derniers mois par un site de vente en fonction du nombre de commandes reues:

    Nombre de commandes

    6 400 8 350 9 125 9 600 10 050 12 000

    Chiffre daffaire mensuel

    250 000 320 000 335 000 350 000 370 000 400 000

  • Ch. 02: Statistique 2 variables :

    Droite d'ajustement affine : Mthode de Mayer

    CHERIF Walid - Statistique

    Reprsentation du nuage de points :

    200000

    250000

    300000

    350000

    400000

    450000

    5000 7000 9000 11000 13000

  • Ch. 02: Statistique 2 variables :

    Droite d'ajustement affine : Mthode de Mayer

    CHERIF Walid - Statistique

    Calcul des coordonnes des points moyens 1 et 2:

    On partage le nuage de points en deux groupes de mme importance suivant les valeurscroissantes de , et on calcule les coordonnes des points moyens 1 et 2 de chaquegroupe de points:

    1=6400+8350+9125

    31(1, 1) 1=

    250000+320000+335000

    3

    2=9600+10050+12000

    32(2, 2) 2=

    350000+370000+400000

    3

    On trace la droite d'ajustement qui passe par les deux points 1 et 2

    Equation de la droite d'ajustement affine :

    = + o: =21

    21 = 1 . 1 = 2 . 2

  • Ch. 02: Statistique 2 variables :

    Exercice 01:

    CHERIF Walid - Statistique

    Depuis 1900, les chercheurs ont relev des tats de contamination du virus RG2 chezcertaines races doiseaux.Leur recherche les a men lier la cause du virus au climat des rgions concernes.Le tableau suivant regroupe le nombre doiseaux atteints par ce virus:

    Climat 81 84 89 93 97 99

    Nombre doiseaux

    2 500 3 200 4 500 3 300 1 900 4 900

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Question 01 :Existe-t-il une relation entre les investissements publicitaires duneentreprise et lvolution de son chiffre daffaires ?

    Question 02:Existe-t-il une relation entre la place dun tudiant dans la classe et sa notefinale?

    Ltude de la corrlation entre deux sries permet didentifier ladpendance ou lindpendance qui existe entre deux sries. Ce degr dedpendance peut tre vrifi en calculant le coefficient de corrlation ouvrifi par les droites dajustement.

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Interprtation:

    -1 r 1

    Lorsque la corrlation est forte (r ):les droites de rgression sont trs proches et le nuage peut treapproxim par une droite.

    Lorsque la corrlation est faible, le nuage de points ne peut pas treajust par une droite, mais il se peut quune autre courbe permette unbon ajustement.

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Exemple:

    Existe une corrlation entre la taille et le poids des athltes dun clubdescalade.Les donnes individuelles sont indiques dans le tableau suivant:

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Droite dajustement (ou de rgression des moindres carrs):

    Nous avons vu quil tait possible de calculer la droite dajustement dunesrie de donnes. De la mme faon il est possible de calculer la droitedajustement dune srie 2 variables.Cette dernire na de sens que sil existe une corrlation entre les deuxsries de donnes.

    Rappel:Droite de la forme y = a.x + b de telle sorte que la somme des carts positifs la droite soit gale la somme des carts ngatifs

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    La droite trace se prsente ainsi, la corrlation de 0,949 est forte et lespoints sont resserrs autour de la courbe de tendance.

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Exemple 1:

    Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs et les plus-values ralises.

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Exemple 1:

    Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs et les plus-values ralises.

    La droite trace correspond unecorrlation faible, et les pointssont disperss autour de la droite.

    Un coefficient de corrlation de +1 correspond une courbe de tendance ascendante et une corrlation ngative une courbe descendante.

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Exemple 2:

    Nous tudions la corrlation entre le prix de vente dun article et le chiffre daffaires ralis. Un article vendu gnre 50 dh de CA et 5 articles gnrent 250 dh de CA.

    La corrlation est totale le coefficient de +1=> La courbe est ascendante

  • Ch. 02: Statistique 2 variables :

    Corrlation

    CHERIF Walid - Statistique

    Exemple 3:

    Nous tudions la corrlation entre le nombre darticles achet et son prix dachat. Plus la quantit achete est importante et plus le prix dachat unitaire est faible.

    La corrlation est total le coefficient de -1=> La courbe est descendante :

  • CHERIF Walid - Statistique

    - Suite -

    La socit Pol-Arctique est spcialisedans la commercialisation de vtementsde sport.On vous communique ci-dessous le CAdes 6 dernires annes et les dpenses depublicit

    1. Existe-t-il une corrlation entre lesdpenses de publicit et le CA ?

    2. Calculer le CA Prvisionnel de 2010

    Exercice 02

    Ch. 02 - TD

  • Ch. 02: Statistique 2 variables :

    Apprciation graphique de la corrlation

    Les courbes de rgression

    CHERIF Walid - Statistique

    Le tableau suivant donne la rpartition dun chantillon de mnages

    ruraux selon la dpense annuelle totale X en milliers de dirhams et la

    dpense annuelle en lectricit Y en centaines de dirhams.

    Pour mesurer lintensit de la corrlation entre deux caractres quantitatifs, on

    tudie les variations des moyennes conditionnelles ou

    X \ Y 0-3 3-4 4-5 5-7,5 7,5-10 Total

    0-5 6,3 1,1 0,4 0,4 0,4 8,6

    5-7,5 3,6 1,5 0,8 1,7 0,2 7,6

    7,5-10 2,5 1,1 1,7 1,3 0,4 7,0

    10-14 4,4 5,0 2,8 4,2 1,5 17,9

    14-18 0,4 2,9 3,8 6,3 2,2 15,6

    18-24 0,6 1,5 2,8 7,0 2,3 14,2

    24-30 1,3 0,5 3,2 14,0 9,6 28,9

    Total 19,1 13,9 15,5 34,9 16,6 100,00

  • Ch. 02: Statistique 2 variables :

    Apprciation graphique de la corrlation

    Les courbes de rgression

    CHERIF Walid - Statistique

    Complter le tableau de calcul:

    Moyennes conditionnelles suivant Y

    Moyennes conditionnelles suivant X

    1 =2,5 6,3 + 6,25 3,6 + 8,75 2,5 + 12 4,4 + 16 0,4 + 21 0,6 + 27 1,3

    6,3 + 3,6 + 2,5 + 4,4 + 0,4 + 0,6 + 1,3

    X \ Y 0-3

    0-5 6,3

    5-7,5 3,6

    7,5-10 2,5

    10-14 4,4

    14-18 0,4

    18-24 0,6

    24-30 1,3

    Total 19,1

  • Ch. 02: Statistique 2 variables :

    Apprciation graphique de la corrlation

    Les courbes de rgression

    CHERIF Walid - Statistique

    Dans le tableau de calcul: on a remplac chaque classe par son centre et

    on a calcul les moyennes conditionnelles :

    2,5 6,25 8,75 12,00 16,00 21,00 27,00

    2,4535 3,4135 3,8393 4,25 5,5288 5,8187 6,5969

    Moyennes conditionnelles suivant Y

    1,5 3,5 4,5 6,25 8,75

    8,745 12,946 16,805 20,034 21,812

    Moyennes conditionnelles suivant X

    Analyse 1: La dpense moyenne en lectricit croit avec le centre

    La dpense moyenne en lectricit croit avec le centre

  • Ch. 02: Statistique 2 variables :

    Apprciation graphique de la corrlation

    Les courbes de rgression

    CHERIF Walid - Statistique

    Courbe de rgression Y en X Courbe de rgression X en Y

  • Ch. 02: Statistique 2 variables :

    Apprciation graphique de la corrlation

    Les courbes de rgression

    CHERIF Walid - Statistique

    Quoiquil ny a pas de relation directe entre la dpense annuelle en

    lectricit et la dpense annuelle totale dun mnage, on peut affirmer

    que quand la dpense totale augmente, la dpense en lectricit

    augmente, mais seulement en moyenne .

    Dfinition:

    On appelle:

    courbe de rgression Y en X, la ligne brise qui joint les pointsMi(xi, yi).

    courbe de rgression X en Y, la ligne brise qui joint les points Mj(yj, xi).

    Ces deux courbes nous renseignent graphiquement sur le sens et le degr

    de la corrlation entre X et Y.

  • Ch. 02: Statistique 2 variables :

    1. Distributions marginales

    CHERIF Walid - Statistique

    On note le nombre dindividus prsentant les modalits et .

    ( =1 =1 = )

    Tableau statistique dune tude simultane de deux caractres

    Modalits du caractre X

    Modalits du caractre Y Distribution marginale de X

    1

    1

    11 1 1

    1

    1

    1 .

    .

    .

    Distribution de Y . 1 . . . . =

  • Ch. 02: Statistique 2 variables :

    1. Distributions marginales

    CHERIF Walid - Statistique

    On appelle frquence du couple (ou frquence totale) des modalits et la

    proportion dindividus qui prsentent simultanment les modalits et :

    =

    Distributions marginales :

    Les effectifs . dfinissent la distribution marginale de X.La frquence marginale de la modalit est :

    . = .

    De mme pour Y, on dfinit les frquences marginales . =.

  • Ch. 02: Statistique 2 variables :

    2. Distributions conditionnelles

    CHERIF Walid - Statistique

    La j me colonne du tableau statistique dcrit la sous population des individus possdant la modalit suivant le caractre X. La frquence conditionnelle

    de la modalit sachant (ou lie ) est: =

    .( f i sachant j)

    De mme, la distribution conditionnelle sachant est :

    = .

    Remarque:

    == . .

    = . .

  • Ch. 02: Statistique 2 variables :

    3. Indpendance et dpendance

    CHERIF Walid - Statistique

    Le caractre X est indpendant du caractre Y si les distributions

    conditionnelles (|) sont identiques entre elles :

    ne dpend pas de et

    sont alors identiques la distribution de X.

    Les colonnes du tableau statistique sont proportionnelles entre elles.

    Exemple: - caractres indpendants -

    Modalits du caractre X

    Modalits du caractre Y

    1 2 3 4

    1

    2

    3

    3 5 2 4

    6 10 4 8

    12 20 8 16

  • Ch. 02: Statistique 2 variables :

    3. Indpendance et dpendance

    CHERIF Walid - Statistique

    Le Chi-deux : - mesure de lintensit de la dpendance entre X et Y -

    Le Chi-deux permet de comparer le tableau des effectifs relevs cequil aurait du tre si les caractres avaient t indpendants.

    = =1

    =1

    (

    . . . )

    . . .

    = N ( =1

    =1

    . . . 1)

    Proprits :

    - Les caractres X et Y sont indpendants ssi X=0.- X 0 est dautant plus grand que la liaison entre X et Y est forte.

  • Ch. 02: Statistique 2 variables :

    Application

    Indpendance:

    CHERIF Walid - Statistique

    P1. X et Y sont indpendants si les distributions conditionnelles

    selon le caractre Y, pour X fix sont identiques.

    X/Y B1 B2 B3 B4 Total

    A1 5 15 20 10 50

    A2 8 24 32 16 80

    A3 7 21 28 14 70

    Total 20 60 80 40 200

    (n11)

    (n21)

    (n.1) (n.2)

    1. Considrons les individus qui prsentent la modalit B3, parmi ceux qui

    prsentent les modalits A1, A2 et A3:100 x 20/50 = 40% pour A1

    100 x 32/80 = 40% pour A2

    100 x 28/70 = 40% pour A3

    3/1 = 3/2

    = 3/3= 40 %

    3/1

    3/2

    .

    P2. X et Y sont indpendants si et seulement si les frquencesconditionnelles

    sont le produit des frquences marginales . et .