probabilités nouveau programme rentrée 2012. en terminale s. statistiques 6 février 2013
TRANSCRIPT
Probabilités
Nouveau programme rentrée 2012.
en terminale S.
Statistiques
6 février 2013
Un premier retour de l’enseignement en première.
Pas mal de questions,
Mais beaucoup de réponses,
Et une vraie compréhension de la probabilité d’obtenir k succès.
* Un exemple d’activité
* Représentation
de la loi binomiale
* D’autres questions...
Un point (délicat) en T.S :
L’introduction de la loi normale centrée réduite.
Extrait du programme. Un tiers du temps...
Intervalles de fluctuation et intervalles de confiance
Problème : Comment justifier l’apparition de l’expression pour l’introduction de la loi normale centrée réduite ?
)1( pnp
npXZ nn
• Il semble plus aisé d’utiliser l’expression
( )(1 )
nn
XnZ p
np p
cv vers p avec n.
soit que la moyenne des iX
Il s’agit d’une convergence en loi mais il n’est pas question d’en donner une définition générale,
seulement d’en donner une observation graphique.
• On peut proposer le modèle suivant, qui utilise les trois niveaux d’expérimentation, simulation et modélisation :
• On utilise une machine de Galton. En premier lieu avec peu de rangées, puis en augmentant n on montre que « l’enveloppe » « tend » vers une courbe caractéristique de la courbe de
Gauss. (par translation de la loi N.C.R.)
Vers un déroulement logique ?
Un exemple d’utilisation de l’approximation de la loi binomiale par la loi normale:
Surréservation aérienne
Il arrive assez souvent que le nombre de réservations pour
une liaison aérienne soit supérieur au nombre de passagers se présentant effectivement le jour du vol.
• Exemple : Pour compenser le manque à gagner, une compagnie aérienne exploitant un avion de 300 places décide de faire de la surréservation en prenant pour chaque vol un nombre n > 300 de réservations.
• S’il se présente plus de 300 passagers à l’embarquement, les 300 premiers
arrivés prennent leur vol
et les autres sont
dédommagés
financièrement.
On considère que les passagers sont mutuellement indépendants (?) et on évalue statistiquement la probabilité de désistement de chacun d’eux à 10%. On note n le nombre de réservations prises par la compagnie pour un vol donné et Sn le nombre (aléatoire) de passagers se présentant à l’embarquement pour ce vol.
On se propose de chercher la valeur maximale de n telle que :
P(Sn <300) > 0,99.
(en clair, on voudrait avoir 99% de chances de ne pas avoir à payer de dédommagement à des passagers)
Le théorème de De Moivre-Laplace permet de donner une solution approchée à ce problème.
• La variable aléatoire Sn suit la loi binomiale B( n ; 0,9) , de moyenne
et d’écart type • Cette loi peut être approchée par la loi
normale . Il s’agit de trouver la plus grande valeur de n vérifiant : P(Sn <300)> 0,99 .
• La variable peut être approximée par la loi normale centrée réduite. C’est ici le cœur du théorème :
nnpm 9,0nnnpq 3,01,09,0
(0,9 ;0,3 )N n n
300nS équivaut à :n
n
n
nSn3,0
9,0300
3,0
9,0
Soit :300 0,9
0,3n
nz
n
(T.M.L).
nz t
Or une table de la loi normale centrée réduite (ou une calculatrice) donne précisément la probabilité de l’évènement
selon les valeurs de t avec un pas de 1/100. Cette probabilité dépasse 0.99 à partir de t=2,33.Il suffit donc de choisir n de façon à ce que :
.
33,23,0
9,0300
n
n
La solution positive de l’équation :0,9x² + 0,699x – 300 = 0 est 17,87, au centième près, et son carré est : 319,45. Si on prend jusqu’à 319 réservations, sous les hypothèses de notre modélisation, le Nombre de passagers se présentant à l’embarquement ne dépassera pas 300 au risque maximum de 1%.
Le mot « au risque » n’est pas clair pour un non initié aux tests
d’hypothèse : peut être parler de probabilité ?
Pour aller plus loin :On cherche, appelant p la probabilité q’un passager ne se désiste pas, quel nombre de réservation accepter pour que l’on ait 99% de chances de ne pas avoir à payer de dédommagement à des passagers)
• En remplaçant 0,9 par p, on obtient une formule compliquée, mais qu’un tableur permet d’utiliser sans difficulté :
L’équation trouvée plus haut s’écrit :
et en posant de discriminant
ce qui équivaut à :
. 2,33 (1 ). 300 0p n p p n
nx
ppp 1200)1(33,2 2
p
ppn
2
1200)1(33,2)1(33,2 2
Auto-critique…
• On voit que le résultat varie beaucoup en fonction de la valeur donnée à p ! Selon qu’on évalue p à 0,90 ou à 0,85, le nombre de surréservation acceptable passe de 19 à 35 !
• On conçoit que la validité de ce type de calcul soit sujette à discussion ! en tous cas on voit bien qu’avec une probabilité de désistement de 50% , on peut surbooker de presque 90%...
Convergence en loi• Soient F1, F2, ... la suite des fonctions de
répartition associées aux variables aléatoires réelles X1, X2, ..., et F la fonction de répartition de la variable aléatoire réelle X. Autrement dit, Fn est définie par Fn(x)=P(Xn ≤ x), et F par F(x)=P(X ≤ x).
• La suite Xn converge vers X en loi, ou en distribution, si
pour tout réel a où F est continue :
lim
lim ( ( )) ( ))nn
F a F a
Visualisation 1
VisualisationTLC
Retour
Beaucoup de questions :
1. Quel niveau de formalisation ? 2. Définition explicite ou pas des
concepts :Proba, variable aléatoire, indépendance…
3. Approche fréquentiste et probabilités.
Exemples :
On fait un test sur une personne puis un deuxième de façon indépendante.
Quelle frontière :entre les statistique et les
probabilités ?
On lance 500 fois un dé pipé.
n° Face 1 2 3 4 5 6
nb d’apparitions 75 80 90 85 78 92
Quelle est la probabilité d'obtenir 4?Quelle est la probabilité d'obtenir un nombre impair?Quelle est la probabilité d'obtenir un nombre pair ?
Exercice : extrait du manuel Maths Bréal 3ème n°56 page 102
Comment évaluer les connaissances acquises :
• Alors qu’on a appris à étudier un problème avec du temps devant soi,
• A étudier sa mise en œuvre par expérimentation,
• A recueillir les données,• A travailler en équipe,• A simuler sur ordinateur,
Retour
Intervalle de fluctuation ou de confiance ?
En seconde, l’intervalle de fluctuation au seuil de 95% est :
1 1p ; p
n n
Soit :
1 1nXp pnn n
1 1nX np
n
Soit :
nn
X npY
n
a pour variance :
1p( p )
a pour espérance 0 et variance 1 qui ne dépend ni de n ni de p.
qui ne dépend pas de n et
1n
n
X npZ
np( p )
• A- Définition• Soit X une variable suivant une loi
B (n, p).• On appelle intervalle de fluctuation de
X au seuil 1-α tout intervalle [a,b] tel que :
( [ ,b])=1-X a
Un intervalle de confiance pour une proportion p à un niveau de confiance 1 – α est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 1 - α. Cet intervalle aléatoire est déterminé à partir de la variable aléatoire
nn
XF
n qui, à tout échantillon de taille n, associe la fréquence.
Exemple
Supposons que p soit inconnu . On peut approximer p par la proportion f obtenue par les données de l’échantillon (estimation ponctuelle) et déterminer l’intervalle de confiance de p au risque 0,95.
1 10,95nXp p
nn n
1 1 1 1n n np F p F p F
n n n n
1 10 95n nP F p F ,
n n
L’intervalle aléatoire a une probabilité supérieure à 0,95 de contenir p. Il est appelé intervalle de confiance de p au seuil de 95%.
A justifier