statistique inferentielle l estimation. un exemple montant quotidien des dépôts en liquide dans la...

25
STATISTIQUE INFERENTIELLE L ’ESTIMATION

Upload: violette-gon

Post on 03-Apr-2015

105 views

Category:

Documents


1 download

TRANSCRIPT

  • Page 1
  • STATISTIQUE INFERENTIELLE L ESTIMATION
  • Page 2
  • UN EXEMPLE Montant quotidien des dpts en liquide dans la banque Ibardinescroak de Saint Jean de Luz. 500 5000 10 000 8000 Comment obtenir une information sur la distribution des dpts, sur le montant du dpt moyen, etc.?
  • Page 3
  • UNE SOLUTION SIMPLE 500 5000 10 000 8000 MAIS IMPOSSIBLE A METTRE EN UVRE ... Observer tous les dpts car le nombre N dobservations est trs grand, voire infini!
  • Page 4
  • UNE AUTRE SOLUTION 500 5000 10 000 8000 On observe un chantillon, c..d. une partie de la population Statistique descriptive chantillon
  • Page 5
  • INTERET DE LA STATISTIQUE DESCRIPTIVE 500 5000 10 000 8000 Echantillo n Montant des dpts Frquence Dpt moyen = 7500 cart-type des dpts = 2500 Construction dun modle thorique
  • Page 6
  • Servir de base la construction dun modle thorique Pourquoi ? Pour faire de la prvision: Quelle quantit de monnaie acheter la Banque de France en dbut de semaine? Quelle quantit de liquide va-ton pouvoir faire transiter par la Suisse ?.. INTERET DE LA STATISTIQUE DESCRIPTIVE
  • Page 7
  • UN MODELE MATHEMATIQUE Test dajustement : On verra plus tard... Estimation 3 affirmations vrifier X = Montant quotidien des dpts est une variable alatoire de loi Normale de moyenne E(X) = de variance V(X) =
  • Page 8
  • ESTIMATION DE LA MOYENNE Comment avoir une ide sur la valeur de la moyenne ? 1) Prendre rendez-vous avec Irma la voyante Problmes: a va me coter cher. Puis-je lui faire confiance ? Problme: je nai rien compris aux probas Avantage: je pourrai prciser la confiance apporter mon rsultat Cest pas grave car on ne va plus samuser jeter des ds ou tirer des cartes... 2) Utiliser lintuition et quelques notions de probabilits
  • Page 9
  • UNE METHODE INTUITIVE DESTIMATION DE LA MOYENNE Pour estimer la moyenne inconnue de la population on utilise la moyenne x de lchantillon. Est-on sr de faire mieux quIrma ?
  • Page 10
  • On observe n dpts x 1,.,x n sur un chantillon et on en fait la moyenne va-t-elle tre proche de inconnue? Pas mal mais que se serait-il pass si javais pris un autre chantillon ? Moins bien. Et un autre ? Et si jinsiste lourdement ? Loi de Pourquoi les observations de sont-elles concentres autour de la moyenne inconnue ? Thorme fondamental: Si X est une v.a. de moyenne et dcart-type, alors la v.a. moyenne, note, obtenue sur un chantillon de taille n tend vers une UNE METHODE INTUITIVE DESTIMATION DE LA MOYENNE
  • Page 11
  • Prcision Fiabilit Probabilit Prendre une dcision partir dun chantillon, est-ce vraiment fiable ? Quelle est la probabilit que la moyenne inconnue se trouve pas trop loin de observe ? Il y a 1- = 95 chances sur 100 que lintervalle contienne
  • Page 12
  • Il y a 1- chances que la moyenne inconnue appartienne lintervalle alatoire P[ +u > -u ] = 1- P[ - u < +u ] = 1- suit une loi, UN PEU.. DE PROBAS. donc suit une N(0,1) P[-u < < u] = 1- = 0,95 Table u = environ 2 (1,96) P[-u < - < u ] = 1- P[- -u < - < -X+u ] = 1-
  • Page 13
  • UN PEU.. DE PROBAS. FIN . et donc un autre intervalle . qui ne contient pas forcment Si on peut prendre une infinit dchantillons, 95% des intervalles contiennent Il y a 95 chances sur 100 que la moyenne inconnue appartienne lintervalle alatoire Une autre observation nous aurait donn une autre valeur, On dira (pour simplifier) que la moyenne inconnue a 95 chances sur 100 dappartenir lintervalle numrique Une observation alatoire nous donne la valeur de.
  • Page 14
  • Fiabilit et prcision lintervalle a 1- chances de contenir fiabilit prcision P[-u < N(0,1) < u] = 1- P[-u < < u] = 1- 1- et u sont lis par la relation 1 - -u u Fiablit augmente u augmente Prcision diminue
  • Page 15
  • 1) Pour des raisons intuitives 2) Pour des raisons thoriques est un estimateur sans biais est un estimateur convergent Plus la taille de lchantillon grandit plus la variance diminue. Pour n infini, lobservation tombe forcment sur. Pour quelles raisons utiliser la moyenne de lchantillon pour estimer la moyenne de la population ? On a une forte probabilit que lobservation soit dans cette zone pour Pour T
  • Page 16
  • RESUME SUR LESTIMATION DUNE MOYENNE prcisionCoefficient de confiance Pour estimer la moyenne dune population, on utilise la moyenne de lchantillon Dtermination de la taille dchantillon pour une prcision et un coefficient de confiance donns On veut que lintervalle soit de la forme, donc et Estimation ponctuelle Estimation par intervalle de confiance Pour avoir une ide de la fiabilit et de la prcision du rsultat on utilise un intervalle de confiance avec u dfini par P[-u < N(0,1) < u] = 1- RESUME SUR LESTIMATION DUNE MOYENNE dune population Normale de variance connue
  • Page 17
  • ESTIMATION PONCTUELLE DE LA VARIANCE 1) Pour des raisons intuitives 2) Pour des raisons thoriques Il est naturel destimer la variance dune population, par la variance de lchantillon On estime la variance dune population par la variance corrige de lchantillon, note aussi s. Pourquoi ? est un estimateur sans biais de est un estimateur convergent de
  • Page 18
  • ESTIMATION PAR INTERVALLE DE CONFIANCE DE LA VARIANCE DUNE POPULATION NORMALE (n-1) S suit une loi de (n-1) d.d.l. Table a et b (> 0) pour 1- donn Do un intervalle de confiance
  • Page 19
  • Pour estimer la variance dune population, on utilise la variance corrige s de lchantillon Estimation ponctuelle RESUME SUR LESTIMATION DUNE VARIANCE Estimation par intervalle de confiance Pour avoir une ide de la fiabilit et de la prcision du rsultat on utilise un intervalle de confiance avec a et b dfinis par
  • Page 20
  • ESTIMATION PONCTUELLE DUNE PROPORTION Dans la population il y a une proportion p dindividus possdant un certain caractre. 1) Pour des raisons intuitives Il est naturel destimer la proportion p dune population par la proportion f de lchantillon 2) Pour des raisons thoriques F, proportion dchantillon, est une v.a. qui tend vers une loi F est un estimateur sans biais de p F est un estimateur convergent de p
  • Page 21
  • est peu prs une N(0,1) ds que n > 100 et 0,1 < p < 0,9 INTERVALLE DE CONFIANCE DUNE PROPORTION Table u pour 1- donn p (dans les bornes de lintervalle alatoire) tant inconnu, il est approch par une estimation f, do un intervalle de confiance F tend vers une, ou encore
  • Page 22
  • Dtermination de la taille dchantillon pour une prcision et un coefficient de confiance donns Pour estimer la proportion p dune population, on utilise la proportion f de lchantillon Estimation ponctuelle On veut que lintervalle soit de la forme, donc et RESUME SUR LESTIMATION DUNE PROPORTION Estimation par intervalle de confiance Pour avoir une ide de la fiabilit et de la prcision du rsultat on utilise un intervalle de confiance avec u dfini par P[-u < N(0,1) < u] = 1- pour n > 100 et 0,1 < f < 0,9 (sinon utiliser un abaque)
  • Page 23
  • ESTIMATION PONCTUELLE : UNE CONCLUSION X de loi quelconque de moyenne E(X) =, de variance V(X) = La variance corrige s de lchantillon est une bonne estimation de la variance de la population La moyenne de lchantillon est une bonne estimation de la moyenne de la population La proportion f de lchantillon est une bonne estimation de la proportion p de la population s Proportion p dun caractre f
  • Page 24
  • INTERVALLE DE CONFIANCE DUNE MOYENNE: EXTENSIONS La taille dchantillon est grande La variance est connue ( ce qui en pratique est trs rare ) Que peut-on faire si ces conditions ne sont pas respectes ? Le taux de sondage n/N est faible (
  • INTERVALLE DE CONFIANCE DUNE MOYENNE EXTENSIONS Loi de Student (n-1) d.d.l.qui est approximativement N(0,1) pour n > 30 Dans ce tableau, on suppose que lchantillon est prlev avec remise, ou que lchantillon est prlev sans remise et le taux de sondage n/N 10 %, on multiplie ou s par le facteur dexhaustivit Ce correctif doit aussi tre apport pour un intervalle de confiance dune proportion