cours statistique.pdf

12
http://xmaths.free.fr/ TES Statistiques page 1 STATISTIQUES I Statistiques à une variable - rappels Exercice 01 (voir réponses et correction ) On a relevé le prix de vente d'un CD et le nombre de CD vendus chez différents fournisseurs. Les résultats forment une série statistique à une variable, donnée dans le tableau suivant : Prix de vente en euros 15 16 17 18 19 Nombre de CD vendus 83 48 32 20 17 Quelles sont les différentes valeurs de la série. Donner la fréquence correspondant à chacune de ces valeurs. Donner la moyenne et l'écart-type de la série. Que représentent ces nombres ? Représenter la série par un diagramme à barres. Définitions On considère une série statistique donnée par le tableau suivant : Valeur : x i x 1 x 2 x 3 x p Effectif : n i n 1 n 2 n 3 n p La moyenne de cette série est : x = n 1 x x 1 + n 2 x x 2 + n 3 x x 3 + … + n p x x p n 1 + n 2 + n 3 + … + n p = n i x i n i La moyenne permet d'avoir une idée du "centre" de la série, c'est une mesure de tendance centrale. La variance de cette série est : V = n 1 x (x 1 - x ) 2 + n 2 x (x 2 - x ) 2 + n 3 x (x 3 - x ) 2 + … + n p x (x p - x ) 2 n 1 + n 2 + n 3 + … + n p On note V = n i (x i - x ) 2 n i ; on a aussi V = n i (x i ) 2 n i - x 2 L'écart-type de cette série est : σ = V L'écart-type permet d'avoir une idée de la façon dont les valeurs de la série s'écartent par rapport à la moyenne. C'est une mesure de dispersion. Un écart-type faible correspond à une série concentrée autour de la moyenne. Remarques Si la série statistique n'est pas donnée avec les effectifs mais avec les fréquences f i , on a : x = f 1 x x 1 + f 2 x x 2 + f 3 x x 3 + … + f p x x p = f i x i et V = f 1 x (x 1 - x ) 2 + f 2 x (x 2 - x ) 2 + f 3 x (x 3 - x ) 2 + … + f p x (x p - x ) 2 = f i (x i - x ) 2 Les calculs de moyenne, de variance et d'écart-type sont, pour des séries prenant un grand nombre de valeurs, des calculs compliqués. Les calculatrices utilisées en mode statistique et les ordinateurs rendent alors de grands services pour ces calculs. Propriété Lorsqu'on augmente (ou lorsqu'on diminue) d'un même nombre r chacune des valeurs du caractère d'une série statistique, la moyenne augmente (ou diminue) de r. Lorsqu'on multiplie (ou lorsqu'on divise) par un même nombre non nul k chacune des valeurs du caractère d'une série statistique, la moyenne est multipliée (ou divisée) par k. Exercice 02 (voir réponses et correction ) Dans une classe de 30 élèves, la moyenne des 20 filles est 11,5 et la moyenne des 10 garçons est 8,5. Donner la moyenne de la classe.

Upload: houcine

Post on 28-Sep-2015

5 views

Category:

Documents


0 download

TRANSCRIPT

  • http://xmaths.free.fr/ TES Statistiques page 1

    STATISTIQUES

    I Statistiques une variable - rappels

    Exercice 01 (voir rponses et correction)

    On a relev le prix de vente d'un CD et le nombre de CD vendus chez diffrents fournisseurs. Les rsultats forment une srie statistique une variable, donne dans le tableau suivant :

    Prix de vente en euros 15 16 17 18 19

    Nombre de CD vendus 83 48 32 20 17

    Quelles sont les diffrentes valeurs de la srie. Donner la frquence correspondant chacune de ces valeurs. Donner la moyenne et l'cart-type de la srie. Que reprsentent ces nombres ? Reprsenter la srie par un diagramme barres.

    Dfinitions

    On considre une srie statistique donne par le tableau suivant :

    Valeur : xi x1 x2 x3 xp

    Effectif : ni n1 n2 n3 np

    La moyenne de cette srie est : x = n1 x x1 + n2 x x2 + n3 x x3 + + np x xp

    n1 + n2 + n3 + + np = nixini

    La moyenne permet d'avoir une ide du "centre" de la srie, c'est une mesure de tendance centrale.

    La variance de cette srie est : V = n1 x (x1 -

    x )2 + n2 x (x2 - x )2 + n3 x (x3 -

    x )2 + + np x (xp - x )2

    n1 + n2 + n3 + + np

    On note V = ni(xi -

    x )2

    ni ; on a aussi V =

    ni(xi)2

    ni - x 2

    L'cart-type de cette srie est : = V

    L'cart-type permet d'avoir une ide de la faon dont les valeurs de la srie s'cartent par rapport la moyenne. C'est une mesure de dispersion. Un cart-type faible correspond une srie concentre autour de la moyenne.

    Remarques

    Si la srie statistique n'est pas donne avec les effectifs mais avec les frquences fi, on a :

    x = f1 x x1 + f2 x x2 + f3 x x3 + + fp x xp = fi xi et V = f1 x (x1 -

    x )2 + f2 x (x2 - x )2 + f3 x (x3 -

    x )2 + + fp x (xp - x )2 = fi(xi -

    x )2

    Les calculs de moyenne, de variance et d'cart-type sont, pour des sries prenant un grand nombre de valeurs, des calculs compliqus. Les calculatrices utilises en mode statistique et les ordinateurs rendent alors de grands services pour ces calculs.

    Proprit

    Lorsqu'on augmente (ou lorsqu'on diminue) d'un mme nombre r chacune des valeurs du caractre d'une srie statistique, la moyenne augmente (ou diminue) de r. Lorsqu'on multiplie (ou lorsqu'on divise) par un mme nombre non nul k chacune des valeurs du caractre d'une srie statistique, la moyenne est multiplie (ou divise) par k.

    Exercice 02 (voir rponses et correction)

    Dans une classe de 30 lves, la moyenne des 20 filles est 11,5 et la moyenne des 10 garons est 8,5. Donner la moyenne de la classe.

  • http://xmaths.free.fr/ TES Statistiques page 2

    Proprit

    Soit une srie statistique d'effectif N, partage en deux groupes : un groupe d'effectif p et de moyenne m1 un groupe d'effectif q = N - p et de moyenne m2

    Alors la moyenne m de la srie est m = p x m1 + q x m2

    N

    Dfinitions

    On considre une srie, dont les valeurs sont ordonnes (ranges dans l'ordre croissant). Si la srie comporte un nombre pair 2n de termes, la mdiane de cette srie est la demi-somme de la valeur du terme de rang n et de la valeur du terme de rang n+1. Si la srie comporte un nombre impair 2n+1 de termes, la mdiane de cette srie est la valeur du terme de rang n+1 (c'est--dire le terme partageant la srie en deux groupes de mme effectif). On appelle premier quartile d'une srie la plus petite valeur q des termes de la srie pour laquelle au moins un quart (25%) des donnes sont infrieures ou gales q. On appelle troisime quartile d'une srie la plus petite valeur q' des termes de la srie pour laquelle au moins trois quarts (75%) des donnes sont infrieures ou gales q'. On appelle intervalle interquartile l'intervalle [q ; q']. On appelle cart interquartile l'amplitude de l'intervalle [q ; q'], c'est--dire le nombre q' - q. On appelle premier dcile d'une srie la plus petite valeur d des termes de la srie pour laquelle au moins un dixime (10%) des donnes sont infrieures ou gales d. On appelle neuvime dcile d'une srie la plus petite valeur d' des termes de la srie pour laquelle au moins neuf diximes (90%) des donnes sont infrieures ou gales d'. On appelle intervalle interdcile l'intervalle [d ; d']. On appelle cart interdcile l'amplitude de l'intervalle [d ; d'], c'est--dire le nombre d' - d.

    Exercice 03 (voir rponses et correction)

    Dterminer la mdiane de chacune des sries : 101 101 105 105 107 108 108 110 87 88 89 89 90 92 92 93 97 99 99

    Exercice 04 (voir rponses et correction)

    Dterminer la mdiane, les quartiles et l'cart interquartile de la srie : 11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 , 18 , 19 , 20 , 22 , 23

    Exercice 05 (voir rponses et correction)

    Dterminer la mdiane, les quartiles, les dciles, l'cart interquartile et l'cart interdcile de la srie : 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17

    Exercice 06 (voir rponses et correction)

    Dterminer la moyenne et l'cart-type de la srie : 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17

    Exercice 07 (voir rponses et correction)

    Le tableau suivant donne une rpartition des salaires mensuels en euros des employs d'une entreprise.

    Salaire [1000 ; 1200[ [1200 ; 1500[ [1500 ; 2000[ [2000 ; 3000[ [3000 ; 10000[

    Effectif 326 112 35 8 3

    1) Quel est le nombre d'employs de l'entreprise ? 2) Quel est le nombre d'employs touchant un salaire mensuel suprieur ou gal 1200 euros. 3) Reprsenter les donnes par un histogramme (voir ventuellement page suivante). 4) Quel est le salaire moyen des employs de l'entreprise ?

  • http://xmaths.free.fr/ TES Statistiques page 3

    Histogramme

    Si les donnes sont regroupes en classes (intervalles), la srie peut tre reprsente par un histogramme. Dans un histogramme ce sont les aires des rectangles qui correspondent aux effectifs. (Dans un diagramme barres ou bandes, ce sont les hauteurs des barres qui correspondent aux effectifs)

    Exemple

    On considre la srie : xi 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ni 3 5 4 5 6 7 7 10 13 20 25 21 23 12 10 5 7 5 3 2 1

    Si on regroupe les valeurs dans des classes, on obtient par exemple :

    xi [0 ; 5,5] ]5,5 ; 8,5] ]8,5 ; 11,5] ]11,5 ; 14,5] ]14,5 ; 20] ni 30 30 66 45 23

    On peut alors faire les reprsentations graphiques correspondantes :

    Diagramme barres Histogramme

    Exercice 08 (voir rponses et correction)

    Un entomologiste a fait des relevs sur la taille de 50 courtilires adultes. 33 35 36 36 37 37 37 38 38 38 39 39 39 39 40 40 40 40 40 41 41 41 41 41 41 41 42 42 42 42 42 42 43 43 43 43 44 44 44 44 45 45 45 46 46 47 47 48 48 50 1) Organiser les relevs dans le tableau d'effectifs suivant :

    Valeur 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

    Effectif Effectif cumul

    croissant

    2) Reprsenter les donnes par un diagramme barres. Un diagramme circulaire serait-il intressant ? 3) Calculer la moyenne de la srie. Dterminer sa mdiane. 4) Dterminer le 1er et le 3me quartile puis le 1er et le 9me dcile. 5) Construire le diagramme en bote correspondant la srie (voir ventuellement page suivante). 6) On regroupe les donnes en classes, c'est--dire en intervalles. Complter le tableau des effectifs suivants :

    Valeur [33 ; 37[ [37;40[ [40 ; 42[ [42 ; 44[ [44 ; 47[ [47 ; 51[ Effectif

    Dessiner l'histogramme correspondant.

  • http://xmaths.free.fr/ TES Statistiques page 4

    Construction d'un diagramme en bote

    Ce type de diagramme est aussi appel diagramme de Tuckey, bote moustaches ou bote pattes. Il utilise la mdiane, le 1er et le 3me quartile, le 1er et le 9me dcile ou les valeurs extrmes d'une srie.

    La construction ci-contre est faite pour une srie caractrise par :

    mdiane : 113 1er quartile : 110 3me quartile : 117 1er dcile : 108 9me dcile : 119

    On choisit une graduation verticale permettant de reprsenter les diffrentes valeurs de la srie. On pourra par exemple graduer entre 90 et 130.

    Le "corps" du diagramme, c'est--dire la "bote" est forme d'un rectangle ayant pour extrmit infrieure le 1er quartile et pour extrmit suprieure le 3me quartile. A l'intrieur de ce rectangle on tracera un segment reprsentant la mdiane.

    La largeur du rectangle n'est pas fixe, elle sera choisie de faon obtenir un graphique "harmonieux". Ce rectangle reprsente les donnes contenues dans l'intervalle interquartile. On repre ensuite les hauteurs correspondant au 1er et au 9me dcile, et on trace deux pattes reprsentant les donnes contenues dans l'intervalle interdcile. (la largeur des pattes n'a pas d'importance). Facultatif On peut ensuite terminer le graphique, en faisant figurer par des points les donnes qui sont en dehors de l'intervalle interdcile. Si certaines donnes, sont manifestement trs loignes, on ne les reprsentera pas, mais on pourra crire leurs valeurs au dessous du diagramme.

    Remarques

    Le graphique est parfois fait en dessinant des pattes correspondant non pas au 1er et au 9me dcile, mais aux valeurs extrmes (ou au 1er et au 99me centile).

    Une bote et des "pattes" courtes indiquent que la srie est assez concentre autour de sa mdiane.

    Au contraire une bote et des "pattes" longues indiquent que la srie est assez disperse.

    Un des avantages de cette reprsentation, est qu'elle ncessite trs peu de calculs.

    La reprsentation peut aussi se faire horizontalement, d'o l'appellation de "bote moustaches". La graduation se trouve alors sur l'axe horizontal,

    3me quartile

    1er quartile

    mdiane

    1er dcile

    9me dcile

  • http://xmaths.free.fr/ TES Statistiques page 5

    Exercice 09 (voir rponses et correction)

    On a relev les taux de cholestrol de 200 employs des hpitaux de Los Angeles victimes de maladie cardiaque. 270 320 310 250 250 300 250 270 270 190 200 260 260 330 280 280 250 240 330 250 250 230 270 230 240 200 210 240 210 270 210 130 220 290 220 200 220 330 270 260 300 150 350 230 210 250 230 250 220 310 180 280 300 290 190 220 250 230 220 220 200 230 230 220 360 290 270 240 170 190 280 250 270 280 300 240 210 260 190 250 260 240 290 230 270 250 360 190 180 260 350 180 250 280 270 240 220 230 220 220 240 300 280 220 240 230 300 280 220 240 190 170 320 150 320 200 210 270 230 270 270 250 230 290 220 220 310 260 260 230 250 300 200 160 230 270 280 180 300 270 270 270 250 250 240 250 280 210 350 200 230 210 240 200 210 330 200 260 310 160 290 300 320 340 350 170 290 200 140 310 260 260 240 220 180 320 220 300 310 250 240 300 330 240 300 330 200 190 300 240 210 240 200 260 170 270 250 250 270 190

    1) Organiser ces donnes dans un tableau faisant apparatre les effectifs.

    2) Dterminer la mdiane, le 1er quartile, le 3me quartile, le 1er dcile et le 9me dcile de la srie.

    3) Construire un diagramme en bote pour reprsenter la srie.

    Exercice 10 (voir rponses et correction)

    Le tableau ci-dessous indique les rsultats aux diffrentes sries du baccalaurat dans l'acadmie de Bordeaux en 1999. (Source : Direction de la programmation et du dveloppement, MENRT)

    Bac Gnral Bac Technologique Bac Pro Total Admis 12 133 6 133 4 038 Refuss 3 516 1 439 1 119

    Total

    1) Reproduire et complter ce tableau d'effectifs en remplissant la dernire ligne et la dernire colonne qui sont appeles distributions marginales (marges).

    2) Prsenter un tableau similaire dans lequel seront indiques les frquences (en pourcentage avec une dcimale) calcules par rapport l'effectif total.

    Que reprsente la valeur se trouvant l'intersection de la colonne "Bac Gnral" et de la ligne "Total" ? Cette valeur s'appelle frquence marginale de la catgorie "Bac Gnral". Que reprsente la valeur se trouvant l'intersection de la ligne "Admis" et de la colonne "Total" ? Cette valeur s'appelle frquence marginale de la catgorie "Admis".

    3) Prsenter un tableau similaire dans lequel seront indiques les frquences (en pourcentage avec une dcimale) calcules par rapport au total de chaque colonne.

    Que reprsente la valeur se trouvant l'intersection de la colonne "Bac Gnral" et de la ligne "Admis" ? Cette valeur s'appelle frquence conditionnelle de la catgorie "Admis" dans la catgorie "Bac Gnral".

    4) Prsenter un tableau similaire dans lequel seront indiques les frquences (en pourcentage avec une dcimale) calcules par rapport au total de chaque ligne.

    Que reprsente la valeur se trouvant l'intersection de la colonne "Bac Gnral" et de la ligne "Admis" ? Cette valeur s'appelle frquence conditionnelle de la catgorie "Bac Gnral" dans la catgorie "Admis".

    5) A partir des tableaux prcdents, rpondre aux questions suivantes : Quelle est la frquence des admis au baccalaurat ? Quelle est la frquence des "Bac Pro" ? Quelle est la frquence des lves refuss sachant qu'ils prsentaient un Bac Technologique ? Quelle est la frquence des "Bac Pro" parmi les admis ?

  • http://xmaths.free.fr/ TES Statistiques page 6

    15 16 17 18 19 20 21 22 23 24

    Poids en kg100101102103104105106107108109110111112113114115116 taille en cm

    G

    II Statistiques deux variables

    Dfinition

    On considre deux variables statistiques numriques observes sur une mme population de n individus On note x1 ; x2 ; ... xn les valeurs releves pour la premire variable et y1 ; y2 ; ... yn les valeurs releves pour la deuxime variable. Les couples (x1 ; y1) ; (x2 ; y2) ; ... ; (xn ; yn) forment une srie statistique deux variables. Dans le plan rapport un repre orthogonal, on appelle nuage de points associ cette srie statistique deux variables, l'ensemble des points M1(x1 ; y1) ; M2(x2 ; y2) ; ... ; Mn(xn ; yn) . On appelle point moyen de cette srie le point G de coordonnes ( x ; y ) o x et y sont les moyennes respectives des sries x1 ; x2 ; ... xn et y1 ; y2 ; ... yn .

    Exemple

    On considre la srie statistique deux variables, donnant le poids en kg et la taille en cm d'enfants de 60 mois et de sexe masculin.

    Poids 20 18 17 20 20 17 20 18 21 19 20 23 18 20 Taille 112 106 105 110 111 106 112 108 112 106 108 114 107 110

    On peut reprsenter le nuage de points correspondant et placer le point moyen G dont les coordonnes sont donnes par : x 19,4 y = 109,1 NB : Il est possible que deux points du nuage soient confondus

    Remarque

    Lorsque le nuage de points a un aspect rectiligne, on pourra procder un ajustement affine, c'est--dire que l'on assimilera le nuage une droite assez proche de tous ses points. Cet ajustement affine pourra tre utilis pour prodder des interpolations ou des extrapolations.

    Le problme se posera de savoir quelle droite sera la plus proche du nuage et donnera les meilleurs rsultats.

  • http://xmaths.free.fr/ TES Statistiques page 7

    1 980 1 985 1 990 1 995 2 000 2 005 2 010

    Anne1

    1,5

    2

    Chiffre d'affaires

    Exemple

    Le nuage de points ci-contre reprsente le chiffre d'affaires en millions d'euros d'une entreprise pendant la priode allant de 1980 2000. Le nuage ayant un aspect rectiligne, on admet que l'on peut faire un ajustement affine par la droite d'quation y = 0,05x - 98 que l'on reprsente sur le dessin. Cette droite permet de trouver par exemple par interpolation le chiffre d'affaires

    approch de l'entreprise en 1996 : y(1996) = 0,05 x 1996 - 98 = 1,8 par extrapolation le chiffre d'affaires

    prvisible de l'entreprise en 2010 : y(2010) = 0,05 x 2010 - 98 = 2,5 On parle d'interpolation pour des valeurs l'intrieur de la plage des valeurs observes et d'extrapolation pour des valeurs l'extrieur de cette plage. Bien entendu, les rsultats obtenus par interpolation et par extrapolation sont exploiter avec prudence.

    Remarque

    Lorsque le nuage de points n'a pas un aspect rectiligne, on peut parfois faire un ajustement par une courbe qui n'est pas une droite. Certains exemples ncessitant des connaissances supplmentaires (fonction logarithme nprien, fonction exponentielle, fonctions puissances) seront donns ultrieurement.

    Exercice 11 (voir rponses et correction)

    Le tableau suivant prsente l'volution du taux de chmage, en pourcentage de la population active, au Japon, entre 1950 et 1996.

    Anne 1950 1960 1965 1970 1975 1980 1985 1990 1995 1996 Rang de l'anne

    xi 0 10 15 20 25 30 35 40 45 46

    Taux yi (en %)

    1,2 1,6 1,6 1,2 1,1 2,0 2,6 2,1 3,1 3,4

    1) Reprsenter le nuage de points correspondant la srie (xi ; yi). On choisira un repre orthogonal pour lequel : 1cm reprsente 5 annes sur l'axe des abscisses, 1cm reprsente un taux de chmage de 0,5% sur l'axe des ordonnes. 2) Dterminer les coordonnes du point moyen A de ce nuage. Le placer sur le graphique. 3) On prend pour droite d'ajustement de ce nuage la droite D passant par A et de coefficient directeur 0,04. a) Dterminer une quation de D. b) Reprsenter D sur le graphique. 4) Rpondre aux questions suivantes en utilisant l'ajustement prcdent. a) Quel est le taux de chmage prvisible pour 2005 ? b) partir de quelle anne le taux prvisible dpassera-t-il nouveau 3,2% ?

  • http://xmaths.free.fr/ TES Statistiques page 8

    Exercice 12 (voir rponses et correction)

    Le tableau suivant donne la consommation franaise en tonnes d'une certaine matire premire M pour la priode de 1996 2003.

    Anne 1996 1997 1998 1999 2000 2001 2002 2003

    Consommation en tonnes

    7740 7800 7880 7900 7920 8000 8020 8060

    On appelle xi le rang de l'anne exprim partir de 1995 et yi la consommation franaise en tonnes de la matire M. 1) Reprsenter le nuage de points de coordonnes (xi ; yi) On choisira un repre orthogonal avec 2cm pour 1 unit en abscisses et 1cm pour 20 units en

    ordonnes. 2) Dans le but de prvoir la consommation de la matire M pour les annes suivantes, on dcide de

    procder un ajustement affine de la srie statistique (xi ; yi). On appelle G1 le point moyen du sous-nuage form par les points d'abscisses 1 , 2 , 3 et 4 . et G2 le point moyen du sous-nuage form par les autres points. a) Calculer les coordonnes de G1 et de G2 .

    b) Donner une quation de la droite (G1G2) sous la forme y = mx + p . c) Tracer la droite (G1G2) sur le dessin prcdent. On admettra que cette droite (appele droite de Mayer)

    reprsente un ajustement affine de la srie. d) Calculer, en utilisant cet ajustement, une valeur approche, une tonne prs, de la consommation

    franaise de matire M prvisible pour 2010.

    Remarque

    On considre un nuage de points M1(x1 ; y1) ; M2(x2 ; y2) ; ... ; Mn(xn ; yn) de forme rectiligne. Soit d d'quation y = ax + b une droite d'ajustement. Considrons les points P1 ; P2 ; ... ; Pn d'abscisses

    respectives x1 ; x2 ; ... ; xn sur la droite d. Ces points ont pour ordonnes respectives ax1+b ; ax2+b ; ... ; axn+b La somme (M1P1)

    2 + (M2P2)2 + ... + (MnPn)

    2 est appele somme des carrs des rsidus. On appelle droite des moindre carrs la droite d pour laquelle la somme des carrs des rsidus est minimale.

    Proprit

    On considre un nuage de points M1(x1 ; y1) ; M2(x2 ; y2) ; ... ; Mn(xn ; yn) de forme rectiligne. La droite d'ajustement d obtenue par la mthode des moindres carrs est la droite passant par le point moyen G et ayant pour coefficient directeur :

    a = (x1 -

    x)(y1 - y) + (x2 -

    x)(y2 - y) + ... + (xn -

    x)(yn - y)

    (x1 - x)(x1 -

    x) + (x2 - x)(x2 -

    x) + ... + (xn - x)(xn -

    x) = i = 1i = n

    (xi - x)(yi -

    y)

    i = 1i = n

    (xi - x)2

    Cette droite a pour quation : y = a(x - x) + y La droite d est aussi appele droite de rgression de y en x .

    M1 d

    M2

    Mn

    P2

    Pn

    P1

    M1

    M2

    Mn

    d

  • http://xmaths.free.fr/ TES Statistiques page 9

    Exemple

    On considre la srie xi 10 11 13 15 17 18 yi 105 107 110 111 112 115

    On a x = i = 1i = n

    xi

    6 = 14 et y = i = 1

    i = n

    yi

    6 = 110. Le point moyen G a pour coordonnes (14 ; 110)

    On peut calculer dans un tableau :

    xi 10 11 13 15 17 18 yi 105 107 110 111 112 115

    (xi - x) -4 -3 -1 1 3 4

    (yi - y) -5 -3 0 1 2 5

    (xi - x)(yi -

    y) 20 9 0 1 6 20 (xi -

    x)2 16 9 1 1 9 16

    On en dduit le coefficient directeur de la droite d'ajustement

    a = 20 + 9 + 0 + 1 + 6 + 2016 + 9 +1 + 1 +9 + 16

    = 5652 1,077

    La droite d'ajustement par la mthode des moindres carrs est donc la droite d'quation :

    y = 5652 (x - 14) + 110

    On pourra donner l'quation en utilisant une valeur approche du coefficient a y = 1,077(x - 14) + 110 ou y = 1,077 x + 94,922

    On peut en dduire par interpolation : La valeur de y correspondant x = 12 : y = 1,077 x 12 + 94,922 donc y 107,8 La valeur de x correspondant y = 114 : 114 = 1,077 x + 94,922 donc x 17,7 et par extrapolation : La valeur de y correspondant x = 20 : y = 1,077 x 20 + 94,922 donc y 116,5 La valeur de x correspondant y = 120 : 120 = 1,077 x + 94,922 donc x 23,3

    Remarque

    Les calculs donnant la droite d'ajustement par la mthode des moindres carrs peuvent tre faits avec une calculatrice ou un ordinateur. Le principe, avec une calculatrice, est d'entrer les valeurs de xi dans une premire liste, les valeurs de yi dans une deuxime liste puis de demander les calculs statistiques concernant les statistiques 2 variables. On peut aussi obtenir le trac du nuage des points et de la droite d'ajustement par la mthode des moindres carrs. Avec une calculatrice TI 82 :

  • http://xmaths.free.fr/ TES Statistiques page 10

    -20 20 40 60 80 100 120O

    50

    100

    150

    200

    Exercice 13 (voir rponses et correction)

    Le tableau suivant reprsente l'volution du chiffre d'affaires en milliers d'euros d'une entreprise pendant dix annes, entre 1995 et 2004.

    Anne 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 rang de l'anne xi 0 1 2 3 4 5 6 7 8 9 chiffre d'affaires yi 110 130 154 180 190 210 240 245 270 295

    1) Reprsenter le nuage de points Mi(xi ; yi). On choisira un repre orthogonal ayant pour units 2cm en abscisse et 1cm pour 20 milliers d'euros en

    ordonne.

    2) Quel est, en pourcentage, l'augmentation du chiffre d'affaires entre les annes 1995 et 2004 ? (on donnera le rsultat 1% prs par excs)

    3) Soit G le point moyen du nuage. Calculer les coordonnes de G et placer G sur le dessin.

    4) Justifier qu'il est judicieux de procder pour cette srie un ajustement affine. Donner, en utilisant la calculatrice, l'quation de la droite d'ajustement D obtenue par la mthode des

    moindres carrs.

    5) Vrifier que G appartient la droite D et tracer D sur le dessin.

    6) En admettant que l'volution continue au mme rythme et en utilisant l'ajustement affine, quel chiffre d'affaires peut-on attendre pour l'anne 2010 ?

    7) On suppose qu' partir de l'anne 2004, le chiffre d'affaires progresse de 8% par an. Quel est alors le chiffre d'affaire prvisible en 2010 ?

    Exercice 14 (voir rponses et correction)

    Le tableau suivant donne la distance de freinage ncessaire une automobile circulant sur une route humide pour s'arrter.

    Vitesse xi en

    km.h-1 30 40 50 60 70 80 90 100 110 120

    Distance de freinage di en

    mtres 18 26 40 58 76 98 120 148 180 212

    yi = di Cette srie statistique est reprsente par le nuage de points ci-contre

    On pose yi = di et on considre la srie statistique (xi ; yi). 1) Reproduire et complter la dernire ligne du tableau. Les valeurs yi seront arrondies 0,01 prs

    2) Reprsenter le nuage de points Mi(xi ; yi). On choisira un repre orthogonal ayant pour units 1cm

    pour 20 km.h-1 en abscisse et 0,5 cm en ordonne.

    3) Donner, en utilisant la calculatrice, la droite de rgression de y en x.

    Les coefficients seront arrondis 0,001 prs.

    4) En dduire une expression de la distance de freinage d en fonction de la vitesse x.

    5) En utilisant cette expression dterminer la distance de freinage correspondant une vitesse de 160 km.h-1 et dterminer la vitesse correspondant une distance de freinage de 300 mtres.

  • http://xmaths.free.fr/ TES Statistiques page 11

    III Adquation une loi quirpartie

    Exemple

    On considre deux ds cubiques dont les faces sont numrotes de 1 6. On jette 600 fois chacun de ces ds on obtient les rsultats suivants :

    D rouge 1 2 3 4 5 6 Nombre

    d'apparitions 124 84 99 112 92 89

    D bleu 1 2 3 4 5 6 Nombre

    d'apparitions 92 91 113 96 94 114

    On se pose la question de savoir si ces ds sont quilibrs.

    Lorsqu'un d est quilibr, la probabilit d'apparition de chacune de ses faces est 16 .

    Ainsi, si les frquences d'apparition de chacune des faces sont proches de 16 , on peut penser que le d a "de

    fortes chances d'tre quilibr". Sur les 600 lancers des tableaux prcdents, les frquences d'apparition de chacune des faces sont :

    D rouge 1 2 3 4 5 6 Frquence d'apparition 0,206667 0,14 0,165 0,186667 0,153333 0,148333

    D bleu 1 2 3 4 5 6 Frquence d'apparition 0,153333 0,151667 0,188333 0,16 0,156667 0,19

    Afin de quantifier l'expression "de fortes chances d'tre quilibr", on cacule l'expression :

    d2obs = i = 1i = 6

    fi - 16

    2 =

    f1 - 16

    2 +

    f2 - 16

    2 +

    f3 - 16

    2 +

    f4 - 16

    2 +

    f5 - 16

    2 +

    f6 - 16

    2

    On obtient pour le d rouge d2obs = 0,003228 et pour le d bleu d2obs = 0,001561

    Si le d est quilibr, le nombre d2obs doit tre "petit".

    Mais les rsultats d'une srie de 600 tirages avec un mme d, mme s'il est parfaitement quilibr, ne sont jamais exactement les mmes, c'est ce que l'on appelle la fluctuation d'chantillonnage. L'tude de la fluctuation d'chantillonnage permettra de dcider si la valeur de d2obs que l'on a obtenue est "petite" ou non, c'est--dire de savoir si la variation que l'on obtient dans les rsultats pour chacune des faces est "normale" (dans ce cas le d est quilibr) ou "anormale" (dans ce cas le d n'est pas quilibr).

    Pour cela on effectue des sries de 600 tirages au hasard d'un nombre compris entre 1 et 6 (on peut faire ce tirage partir d'un ordinateur ou d'une calculatrice) et on calcule la valeur de d2 pour chacune de ces sries. On obtient les rsultats suivants, pour 1000 sries de 600 tirages :

    d2 [0 ; 0,0005[ [0,0005 ; 0,001[ [0,001 ; 0,0015[ [0,0015 ; 0,002[ [0,002 ; 0,0025[ [0,0025 ; 0,003[ [0,003 ; 0,0035[

    effectif 115 258 247 173 103 49 30

    d2 [0,0035 ; 0,004[ [0,004 ; 0,0045[ [0,0045 ; 0,005[ [0,005 ; 0,0055[ [0,0055 ; 0,006[ [0,006 ; 0,0065[ [0,0065 ; 0,007[

    effectif 16 3 3 0 2 0 1

    En utilisant les effectifs cumuls, on peut remarquer que le 9me dcile D9 de la srie des d2 se trouve dans l'intervalle [0,0025 ; 0,003[. On a donc D9 0,0025. Lorsque, pour le d observ, on obtient d2obs D9, on dclare que le d est quilibr.

    Lorsque, pour le d observ, on obtient d2obs > D9, on dclare que le d n'est pas quilibr avec un risque de 10% (c'est--dire que l'on se trompe dans 10% des cas).

    On peut donc dire que le d bleu est quilibr alors que le d rouge ne l'est pas (au risque de 10%).

    Remarques

    Plutt que de faire la comparaison sur d2, on aurait pu la faire sur 600d2 ou sur 1000d2 pour la commodit des calculs.

    Le risque de 10% (c'est--dire 0,1) dcoule de l'utilisation du 9me dcile. On pourrait travailler avec un risque plus faible. Par exemple le risque de 5% (c'est--dire 0,05) correspondrait l'utilisation du 95me centile. Plus on choisit un risque faible, plus on accepte facilement l'hypothse d'quiprobabilit.

  • http://xmaths.free.fr/ TES Statistiques page 12

    Exercice 15 (voir rponses et correction)

    1) La simulation de 1000 lancers au hasard d'une pice de monnaie, permet de calculer le nombre :

    d2 =

    f1 - 12

    2 +

    f2 - 12

    2

    o f1 dsigne la frquence de "pile" et f2 la frquence de "face".

    On rpte 500 fois cette simulation et on obtient les rsultats suivants pour la srie des valeurs de d2 :

    Minimum 1er

    dcile 1er

    quartile mdiane

    3me quartile

    9me dcile

    Maximum

    0 0,000008 0,00005 0,000242 0,000648 0,001352 0,004802

    Dessiner le diagramme en bote correspondant 2) On lance 4 pices de monnaie 1000 fois chacune et on voudrait rejeter les pices que l'on considre

    comme non quilibres. On a obtenu les rsultats suivants :

    Pice A Pice B Pice C Pice D Face 493 518 532 475 Pile 507 482 468 525

    Quelles sont les pices rejetes au risque de 10% ? au risque de 25% 3) Quelle est le nombre minimum et le nombre maximum de "pile" que l'on doit obtenir pour que la pice ne

    soit pas rejete au risque de 10%

    Exercice 16 (voir rponses et correction)

    Une roue de loterie comporte 5 secteurs angulaires de mme taille. Ces secteurs sont numrots de 1 5. Lorsqu'un joueur participe, son gain est dtermin par le secteur sur lequel s'arrte la roue. Un observateur a not les 1000 premiers rsultats de cette loterie tout au long d'une journe. Il a rassembl les rsultats dans le tableau suivant :

    Secteur 1 2 3 4 5 Nombre de tirages

    195 173 200 205 227

    On se pose la question de savoir si la roue est "quilibre", c'est--dire si les secteurs apparaissent de faon quiprobable.

    1) Calculer les frquences f1 ; f2 ; f3 ; f4 ; f5 de chacun des secteurs.

    2) Calculer le nombre d2 = i = 1i = 5

    fi - 15

    2 =

    f1 - 15

    2 +

    f2 - 15

    2 +

    f3 - 15

    2 +

    f4 - 15

    2 +

    f5 - 15

    2

    On note 1000d2obs la valeur 1000d2 obtenue.

    Donner la valeur de 1000d2obs .

    3) On simule 1000 tirages de loterie suivant la loi quirpartie et on note la valeur de 1000d2 obtenue.

    Cette simulation tant rpte 500 fois, la srie des 500 valeurs de 1000d2 est reprsente par le diagramme en bote ci-contre, o les extrmits des "pattes" correspondent respectivement au 1er et au 9me dcile.

    Lire sur ce diagramme une valeur approche du 9me dcile.

    4) Peut-on affirmer avec un risque d'erreur infrieur 10% que la roue n'est pas quilibre ?

    Justifier.