statistiques et probabilité : au collège :. continuité dans les apprentissages. apprentissage...

24
Statistiques et probabilité : Au collège :

Upload: sacha-vallee

Post on 03-Apr-2015

110 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Statistiques et probabilité :

Au collège :

Page 2: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

• Continuité dans les apprentissages.

• Apprentissage progressif des arbres pondérés de la troisième à la première. (Cette notion est essentielle à la bonne compréhension des probabilités.)

Page 3: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

En seconde

Page 4: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Notion d’échantillon

Dans le sens commun des sondages, un échantillon est un sous ensemble obtenu par prélèvement aléatoire dans un population.

Page 5: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Intervalle de fluctuation d’une fréquence au seuil de 95 %

Page 6: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Propriété : Connaissant la proportion p (0,2≤p≤0,8)

d’individus dans une population, la fréquence d’un certain caractère dans un échantillon de taille n, n25 appartient à l’intervalle

[p-1/rac(n) ; p+1/rac(n)] avec une probabilité d’au moins 95%

Cas où la proportion est connue :

Page 7: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Exemple : « La parité, c’est quoi ? » Deux entreprises A et B recrutent dans une

région où il y a autant d’hommes que de femmes. Dans l’entreprise A, il y a 100 employées dont 43 femmes. Dans l’entreprise B, il y a 2500 employés dont 1150 femmes.

Quelle entreprise respecte le mieux la parité ?

Page 8: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Dans l’entreprise A, l’intervalle de fluctuation est [0,4 ; 0,6] et 43% appartient à cet intervalle.

Dans l’entreprise B, l’intervalle de fluctuation est [0,48 ; 0,52] et 46% n’appartient pas à cet intervalle.

Dans l’entreprise B la proportion 46% s’observe dans moins de 5% des échantillons, donc on peut rejeter l’hypothèse qu’elle respecte mieux la parité que l’entreprise A, contrairement aux apparences

Page 9: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Cas où la proportion n’est pas connue :

Propriété : Dans une population, on désire estimer la

proportion inconnue p d’un caractère donné. On étudie, pour cela, un échantillon de taille n, n25. Le caractère étudié apparait avec la fréquence f (0,2≤f≤0,8). On peut estimer, que la proportion p est dans l’intervalle

[f-1/rac(n) ; f+1/rac(n)] avec une probabilité d’au moins 95%

Page 10: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Explication de l’intervalle de fluctuation de la classe de seconde

Page 11: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Nouveau programme en 1ère S Statistiques et probabilité :

Les points majeurs :

La loi géométrique tronquée

La loi binomiale

Échantillonnage et prise de decision

Page 12: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

CONTENUS CAPACITES ATTENDUES COMMENTAIRESModèle de la répétition d’expériences identiques et indépendantes à deux ou trois issues.

• Représenter la répétition d’expériences identiques et indépendantes par un arbre pondéré.• Utiliser cette représentation pour déterminer la loi d’une variable aléatoire associée à une telle situation.

Pour la répétition d’expériences identiques et indépendantes, la probabilité d’une liste de résultats est le produit des probabilités de chaque résultats.La notion de probabilité conditionnelle est hors programme.On peut aussi traiter quelques situations autour de la loi géométrique tronquée. On peut simuler la loi géométrique tronquée avec un algorithme.

Page 13: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

1. Loi géométrique tronquée

Les situations de répétitions d'une expérience aléatoire, dans des conditions d'indépendance constituent un élément fort du programme de première.L'introduction de la loi géométrique tronquée présente de nombreux avantages : – travailler sur des répétitions d'une expérience de Bernoulli ; – envisager ces répétitions sous l'angle algorithmique ; – présenter une situation d'arbre pour lequel tous les chemins n'ont pas la même longueur ; – exploiter dans un autre cadre les propriétés des suites géométriques ; – exploiter dans un autre cadre des résultats sur la dérivation.

Page 14: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Exemple pour n=4

Déterminons la loi de X. X = 0 si aucun succès n'a été obtenu donc avec l'outil arbre: P(X = 0) = (1-p)Pour 1≤ k ≤ n, avec l'arbre, le premier succès est obtenu à l'étape k pour le chemin qui présente dans l'ordre (k – 1) échecs et un succès d'où :

P(X = k) = (1 – p) p

s

es

ese

se

1-p

pp

1-p p

1-p p

1-p

n

k-1

DéfinitionSoit p un réel de l'intervalle ]0, 1[ et n un entier naturel non nul. On considère l'expérience aléatoire qui consiste à répéter dans des conditions identiques une expérience de Bernoulli de paramètre p avec au maximum n répétitions et arrêt du processus au premier succès.On appelle loi géométrique tronquée de paramètres n et p la loi de la variable aléatoire X définie par :

X = 0 si aucun succès n'a été obtenu ; pour 1≤ k ≤ n, X = k si le premier succès est obtenu à l'étape k.

Page 15: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

CONTENUS CAPACITES ATTENDUES COMMENTAIRES

Epreuve de Bernoulli, loi de Bernoulli.Schéma de Bernoulli, loi binomiale (loi du nombre de succès)Coefficients binomiaux, triangle de Pascal.

Reconnaître des situations relevant de la loi binomiale.Calculer une probabilité dans le cadre de la loi binomiale.

Démontrer que : ( ) + ( ) = ( )

Représenter graphiquement la loi binomiale.

La représentation à l’aide d’un arbre est privilégiée : il s’agit ici d’installer une représentation mentale efficace. On peut ainsi :- Faciliter la découverte de la loi binomiale pour des petites valeurs de n (n≤4);- Introduire le coefficient binomial ( ) comme nombre de chemins de l’arbre réalisant k succès pour n répétitions;- Etablir enfin la formule générale de la loi binomiale.

Cette égalité est établie en raisonnant sur le nombre de chemin réalisant k+1 succès pour n+1 répétitions.On établit également la propriété de symétrie des coefficients binomiaux.L’utilisation des coefficients binomiaux dans des problèmes de dénombrement et leur écriture à l’aide des factorielles ne sont pas des attendus du programme. En pratique, on utilise une calculatrice ou un logiciel pour obtenir les valeurs des coefficients binomiaux, calculer directement des probabilités et représenter graphiquement la loi binomiale.

nk

nk

nk+1

n+1k+1

Page 16: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Loi binomiale1 – Découverte de la loi binomiale et introduction des coefficients binomiaux Répétition d'une épreuve de Bernoulli de paramètre p quelconque On répète 4 fois cette épreuve. Nous représentons cette répétition par un arbre pondéré à 4 niveaux.

41

41

On note ( ) et on lit « 1 parmi 4 » le nombre de chemins qui conduisent à 1 succès

exactement. Ici ( ) = 4

On décide cette fois de répéter 5 fois cette épreuve de Bernoulli et on note toujours X la variable aléatoire correspondant au nombre de succès obtenus à l’issue des 5 répétitions.La répétition de l’arbre devient fastidieuse.Nous allons déterminer le nombre ( ) « 2 parmi 5 » le nombre de chemins qui conduisent à 2 succès.Déterminons ce nombre en utilisant l’arbre déjà réalisé pour 4 répétitions.

52

Page 17: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Il y a 2 façons d’obtenir 2 succès suivant qu’à la dernière étape on obtient un succès ou un échec. Si la dernière étape donne un échec, il faut compter les chemins qui au

niveau précédent conduisaient déjà à 2 succès. Avec l’arbre déjà réalisé, on sait que 6 chemins sont dans ce cas.

Si la dernière étape donne un succès, il faut compter les chemins qui au niveau précédent conduisaient à un seul succès. Avec l’arbre déjà réalisé, on sait que 4 chemins sont dans ce cas.

En conclusion, 6+4=10 chemins de l’arbre des 5 répétitions conduisent à 2 succès, soit avec les notations introduites : ( ) = ( ) + ( )5

242

41

Page 18: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

1

n

k

chemins

n

k

chemins n premières étapes (n + 1)-ième étape

Succès

Échec

k succès

k + 1 succès

Deux façons d’obtenir k + 1 succès en n + 1 étapes

Page 19: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

2. Formule générale de la loi binomialeLa probabilité de chacun des chemins qui réalisent exactement k succès est p (1 – p) .

On obtient donc :soient un entier naturel n et un réel p de l'intervalle [0, 1]. La variable aléatoire X correspondant au nombre de succès dans la répétition de n épreuves de Bernoulli de paramètre p suit la loi binomiale B(n, p) avec pour tout entier k compris entre 0 et n :p(X=k) = ( )p (1-p)k n-k

k n-k

nk

Page 20: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

CONTENUS CAPACITES ATTENDUES COMMENTAIRES

Échantillonnage Utilisation de la loi binomiale pour une prise de décision à partir d’une fréquence.

Exploiter l’intervalle de fluctuation à un seuil donné, déterminé à l’aide de la loi binomiale, pour rejeter ou non une hypothèse sur une proportion

L’objectif est d’amener les élèves à expérimenter la notion de « différence significative » par rapport à une valeur attendue et à remarquer que, pour une taille de l’échantillon importante, on conforte les résultats vus en classe de seconde.

L’intervalle de fluctuation peut être déterminé à l’aide d’un tableur ou d’un algorithme.

Le vocabulaire des tests (test d’hypothèse, hypothèse nulle, risque de première espèce) est hors programme.

Page 21: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

Fluctuation d’échantillonnage1. Positionnement du problème à l’aide d’un exemple.

Un médecin de santé publique veut savoir si, dans sa région, le pourcentage d’habitants atteints d’hypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion d’hypertendus dans la population de sa région, le médecin formule l’hypothèse p = 0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n = 100 habitants de la région, dont il détermine la fréquence f d’hypertendus (l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise).Lorsque la proportion dans la population vaut p = 0,16, la variable aléatoire X correspondant au nombre d’hypertendus observé dans un échantillon aléatoire de taille n = 100, suit la loi binomiale de paramètres n = 100 et p = 0,16.

Page 22: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

On cherche à partager l’intervalle [0, 100], où X prend ses valeurs, en trois intervalles [0, a – 1], [a, b] et [b + 1, 100] de sorte que X prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 0,025, sans dépasser cette valeur.En tabulant les probabilités cumulées P(X <= k), pour k allant de 0 à 100, il suffit de déterminer le plus petit entier a tel que P(X <= a) > 0,025 et le plus petit entier b tel que P(X<=b)>0,975.On lit a = 9 et b = 23.

Page 23: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

La règle de décision est la suivante : si la fréquence observée f appartient à l’intervalle de fluctuation à (au moins) 95 % [a/n , b/n]= [0,09 ; 0,23], on considère que l’hypothèse selon laquelle la proportion d’hypertendus dans la population est p = 0,16 n’est pas remise en question et on l’accepte ; sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p = 0,16.

X suit la loi b (100 ; 0,16)

0

0,02

0,04

0,06

0,08

0,1

0,12

0 5 10 15 20 25 30 35 40

Zone de rejet à gauche : au plus

2,5 %

Zone de rejet à droite : au plus 2,5 %

Intervalle de fluctuation : au moins

95 %

a b

Page 24: Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première

2. Définition de l’intervalle de fluctuation à 95 % déterminé dans une situation bilatérale à l’aide de la loi binomiale

Définition : l’intervalle de fluctuation à 95 % d’une fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille n, d’une variable aléatoire X de loibinomiale, est l’intervalle [a/n , b/n] défini par :• a est le plus petit entier tel que P(X <= a) >0,025 ;• b est le plus petit entier tel que P(X <= b) >0,975.

3. Comparaison de l’intervalle de fluctuation de première avec l’intervalle de fluctuation exploité en classe de seconde

Le programme des classes de premières S, ES et STI2D-STL, demande de comparer, pourune taille de l’échantillon importante, cet intervalle avec l’intervalle de fluctuation exploité en classe de seconde.On pourra le faire lors d’exemples (sur des tailles d’échantillon importantes) pour conforter les résultats vus en seconde