6tq art aph statistiques
DESCRIPTION
ÂTRANSCRIPT
Statistiques
1
Statistiques
A. Introduction
La statistique est la science qui collecte, analyse et interprète des observations
relatives à un même phénomène ; elle étudie méthodiquement un ensemble de
données numériques, ce qui permet de faire un état de la situation présente et passée,
de présenter ces données d'une manière intelligible et surtout de servir de base à la
prévision.
L’étude statistique d’un ensemble de données procède en 4 étapes aux objectifs bien
définis :
PHASE 1 : collecte des informations (enquête, sondage, référendum…)
PHASE 2 : présentation des résultats : création de tableaux et diagrammes.
PHASE 3 : analyse des tableaux : recherche de valeurs caractéristiques.
PHASE 4 : interprétation des paramètres : cette phase n’est plus du ressort du
mathématicien, mais bien du sociologue, du politologue, etc.
B. Données statistiques
1. Individus - Caractères - Modalités
Vocabulaire
Une population est un ensemble soumis à une étude statistique.
Les individus sont les éléments de la population.
L’effectif (total) de la population est le nombre d’individus de cette population.
On le note souvent n.
Une série statistique est un ensemble de valeurs collectées portées sur une liste
comme, par exemple, la taille des élèves d'une classe, le nombre de voix obtenues par
l'ensemble des personnes sur une liste,...
Statistiques
2
Un caractère statistique est une propriété étudiée sur la population.
Il peut être qualitatif ou quantitatif.
- Un caractère est qualitatif s'il est non mesurable comme, par exemple, la
marque d'une voiture, l'activité professionnelle, la nationalité, la profession...
- Un caractère est quantitatif s'il peut se mesurer, c'est-à-dire si on peut lui
attribuer une valeur numérique comme, par exemple, l'âge, le poids, le revenu
annuel, le nombre d’enfants...
Les modalités d’un caractère sont les différentes formes qu’il peut prendre.
Un caractère quantitatif peut être discret ou continu.
- Il est discret si le caractère ne peut prendre qu’un nombre limité de valeurs
comme, par exemple, le nombre d'enfants d'une famille, le nombre de voitures
que possède une famille,...
- Il est continu si le caractère peut prendre toutes les valeurs dans un
intervalle étendu, où le nombre théorique de possibilités est énorme, voire
infini, comme par exemple, la taille d’un être humain,…
Exemples
1) Lors d’une étude statistique sur l’âge du personnel d’une entreprise, la popul ation sera
composée de l’ensemble des membres du personnel, les individus seront les per s onnes et
le caractère sera l’âge . Ce caractère est q uantitatif .
2) Si on étudie la répartition par marque du parc automobile belge, la population sera
composée d e l’ensemble de toutes les voitures immatriculées en Belgique et les individus
de la série seront l es voitures. Le caractère est l a marque.
Les modalités du caractère sont : A udi, Citroën, Mercedes. Ce caractère est q ualit atif.
3) Si on demande à chaque élève d’une classe combien d’animaux domestiques il possède, la
population sera composée e st l’ensemble des élasse, les individus sont l es é lève s,
le caractère étudié est e st le nombre d’animaux par élève.
Les modalités sont 0 , 1, 2, ….. . C’est un caractère q uantitatif.
Statistiques
3
Exercice : Les variables suivantes sont-elles qualitatives ou quantitatives ?
Dans le cas quantitatif, précise si la variable est discrète ou continue
1) Couleur de 10000 voitures passant à un carrefour un jour donné.
2) Poids de 500 singes
3) Destinations proposées dans une brochure de vacances
4) Nombre d’enfants dans une famille.
5) Statut marital d’une personne.
6) Nombre de fleurs produites par une plante.
7) Professions exercées par 1500 personnes interrogées dans la rue.
2. Echantillons
Vocabulaire
Pour diverses raisons pratiques (population trop étendue, coût de l’opération), on
réduit la collecte des données à un groupe restreint, l’échantillon, sélectionné avec
soin pour pouvoir extrapoler à l’ensemble de la population les conclusions tirées de
la seule étude de ce groupe ; il est donc crucial que l’échantillon soit représentatif de
la population, et c’est là une phase bien délicate.
Un échantillon est donc une partie représentative de la population totale.
Exemple
Lors de l’étude du revenu moyen des Belges, on sélectionne « au hasard » 1000
personnes qui participeront à un sondage et qui sont censés représenter la
population.
Remarque
Une tâche difficile consiste à choisir correctement l’échantillon de la population.
En effet, si on étudie la capacité respiratoire de la population belge, il est important
de ne pas choisir uniquement des personnes âgées, ou uniquement des sportifs de
haut niveau.
Statistiques
4
3. Tri des données
Vocabulaire
Commençons par un exemple qui permettra de connaître le vocabulaire.
Dans le tableau brut ci-dessous, on a indiqué les résultats des élèves de sixième
année d’une école, sur 10, à une interrogation de maths.
8 1 3 7 6 5 6 7 9 10 1 0
8 1 5 8 7 6 3 5 2 10 9 9
7 6 4 4 8 7 8 9 7 6 1 3
5 4 6 6 7 9 10 7 5 2 9 10
8 1 5 9 4 6 8 6 7 9 10 1
0 2 6 6 7 4 5 6 8 7 6 2
4 9 8 9 7 6 7 5 4 10 1 9
8 4 9 6 6 3 4 7 8 1 10 6
4 5 7 1 3 5 9 4 10 8 6 1
3 9 8 8 1 5 2 6 7 5 6 4
La population est l ’ensemble des élèves de sixième.
Les individus sont l es élèves des classes de sixième.
Le caractère étudié est l e résu ltat obtenu à une interrogation en maths.
C’est un caractère q ualitatif.
L’effectif de la population est 1 20.
Ce tableau n’étant pas très parlant, nous allons construire un nouveau tableau qui
sera recensé et ordonné.
Remplis le tableau ci-dessous (page 7) à l’aide des informations données pour
chacune des colonnes.
a) Dans la première colonne, on indique, par ordre croissant, les modalités xk,
c’est-à-dire les différentes notes dans l’échelle des notations.
La modalité n’est pas toujours un nombre, elle peut aussi être un intervalle
(on parle alors de classes) ou un symbole (F ou M pour le sexe…) lorsque le
caractère étudié est qualitatif.
Statistiques
5
b) La deuxième colonne contient, pour chacune des lignes, le nombre d’élèves
ayant obtenu la note reprise dans la première colonne.
Ces nombres sont les effectifs correspondant à chacune des modalités.
Ils se notent ek ou nk.
L’effectif d’une modalité est le nombre de fois que cette modalité apparaît dans le
tableau brut.
Cette colonne te permet de répondre à la question :
Combien d’élèves ont obtenu 6/10?
Réponds aux questions suivantes :
Combien d’élèves ont obtenu moins de 6 /10 (6 compris)?
Combien d’élèves ont obtenu moins de 8 /10 (8 compris)?
Combien d’élèves ont obtenu plus de 7 /10 (7 non compris)?
L’effectif total est la somme des effectifs des différentes modalités du caractère
statistique étudié. Il est noté n.
On indique l’effectif total dans la dernière case de la deuxième colonne.
Quel est l’effectif total de cette série ?
c) Dans le cas d’un caractère statistique quantitatif et si les modalités figurent
dans un tableau ordonné,
L’effectif cumulé d’une modalité (ou d’une classe) est la somme des effectifs de cette
modalité (ou classes) et de celles qui la précèdent.
On indique les effectifs cumulés dans la troisième colonne.
La dernière case de cette colonne contient l’effectif total.
Les effectifs cumulés se notent k , qui se lit nu.
À l’aide des informations de cette colonne, réponds aux questions suivantes :
Combien d’élèves ont-ils eu moins de 7 /10 (7 compris)?
Combien d’élèves ont-ils eu moins de 5 /10 (5 non compris)?
Combien d’élèves ont-ils eu plus de 6 /10 (6 compris)?
Statistiques
6
d) La quatrième colonne reprend la fréquence de chaque modalité.
La fréquence d’une modalité est le quotient de l’effectif de cette modalité et de
l’effectif total n.
La fréquence de la modalité xk d’effectif nk se note fk et vaut kk
nf
n .
Ce nombre est généralement exprimé en pourcentage.
Réponds aux questions suivantes :
Quel pourcentage d’élèves a obtenu un résultat de 3/10 ?
Quel pourcentage d’élèves a obtenu le maximum ?
e) La cinquième colonne reprend les fréquences cumulées de chaque modalité.
La fréquence cumulée d’une modalité (ou d’une classe) est le quotient de l’effectif
cumulé de cette modalité et de l’effectif total.
La fréquence cumulée de la modalité xk se note Fk et vaut kkF
n
.
Réponds aux questions suivantes :
Quel pourcentage d’élèves a obtenu un résultat inférieur ou égal 3/10 ?
Quel pourcentage d’élèves a obtenu un résultat strictement inférieur à 5 ?
Quel pourcentage d’élèves a obtenu un résultat non strictement inférieur à 7 ?
Quel pourcentage d’élèves a obtenu un résultat supérieur ou égal à 8 ?
Statistiques
7
Tableau recensé et ordonné (à remplir)
Remarques
- On peut également définir la fréquence cumulée d’une modalité (ou d’une classe)
comme la somme des fréquences de cette modalité (ou de cette classe) et de celles
qui la précèdent. Cependant, dans ce cas, des erreurs d’arrondis sont fréquentes et
rendent les résultats souvent approximatifs.
- Lorsque les résultats d’un caractère statistique quantitatif sont trop nombreux, il
est souvent avantageux de les regrouper par classes d’individus.
Ces classes ont généralement la même largeur.
On parle de manière analogue de l’effectif et de la fréquence d’une classe.
- Lorsque l’on étudie un caractère qualitatif, les effectifs cumulés et fréquences
cumulées n’ont aucun sens.
- Quand l’effectif correspondant à une modalité est nul, il n’est pas obligatoire de
l’indiquer dans le tableau.
Statistiques
8
Exemples
Dans chacun des exemples proposés, complète les cases manquantes
1) Caractère ……………………………
Population : 30 élèves d’une classe
Caractère : sexe
Modalités : masculin – féminin
Tableau brut :
M M F M M F
M F M F M F
F M M F M M
F M F M M F
M M M F F F
Tableau ordonné :
………….
kx …………….
kn
…………………
kk
nf
n
M 17 1730
0,567 ou 56,7 %
F 13 1330
0,433 ou 43,3 %
Total : …………….. 1 ou 100 %
2) Caractère ……………………………
Population : 25 élèves d’une classe
Caractère : cotes obtenues (sur 20) à un contrôle de géographie
Modalités : …………………………
Tableau brut :
12 03 13 15 17
11 15 13 13 18
11 13 20 12 ….
08 12 05 08 ….
10 17 05 15 ….
Statistiques
9
Tableau ordonné :
Modalités
………….
Effectifs
…………
Fréquences k
k
nf
n
………….
…………..
k
……………
……………
Fk
03 1 1
0,04 ou 4%25
1 0,04
05 2 2
0,08 ou 8%25
3 0,12
08 2 2
0,08 ou 8%25
5 0,20
10 1 1
0,04 ou 4%25
6 0,24
11 3 3
0,12 ou 12%25
9 0,36
12 3 3
0,12 ou 12%25
12 0,48
13 4 4
0,16 ou 16%25
16 0,64
15 3 3
0,12 ou 12%25
19 0,76
17 2 2
0,08 ou 8%25
21 0,84
18 1 1
0,04 ou 4%25
22 0,88
19 1 1
0,04 ou 4%25
23 0,92
……. 2 2
0,08 ou 8%25
25 1
Total : n = 25 1 ou 100 %
3) Caractère quantitatif à grouper en classes
Population : 80 virements inférieurs à 120 €
Caractère : montants des virements
Tableau brut :
5 20 80 35 8 44 80 28 114 60
60 101 45 102 67 116 48 79 14 57
61 39 7 40 105 30 42 119 90 90
100 48 49 50 67 119 78 65 60 118
17 114 72 107 10 77 84 54 36 45
117 39 82 40 60 24 59 100 113 79
76 74 5 110 99 97 86 19 62 58
21 32 87 54 32 54 92 93 36 60
Statistiques
10
0
1
2
3
4
5
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
On regroupe les virements par tranches de 20 € : [0 ;20[ ; [20 ;40[, …..
[100 ;120[.
Tableau ordonné :
Modalités
kx Effectifs
kn Fréquences
…………….
Effectifs
cumulés
…….
Fréquences
Cumulées
…….
[0,20[
[20,40[
[40,60[
[60,80[
[80,100[
[100,120[
Total :
4. Graphiques
Après avoir collecté des données et les avoir ordonnées dans des tableaux structurés, il est
intéressant de pouvoir les représenter graphiquement. Il existe différents types de
graphiques : à bâtonnets, en rectangles, circulaires, figuratifs, en pyramides, …. Des logiciels
informatiques, de type Excel, sont d’une aide précieuse et efficace dans la confection de
graphiques liés à des données statistiques.
1) Diagramme en bâtonnets
Dans un tel diagramme, la longueur d’un « bâtonnet » représente
l’effectif de la modalité correspondante.
En reprenant la situation des différentes cotes obtenues par les 25
élèves au contrôle de géographie, on a
Statistiques
11
2) Histogramme
Une représentation graphique au moyen de rectangles s’appelle un
histogramme. La base de chaque rectangle correspond à l’intervalle de la
classe et l’aire de chaque rectangle est proportionnelle à la fréquence de la
classe correspondante.
En reprenant l’exemple des montants des virements dans lequel l’intervalle de
la classe est 20 €.
[0;20[
[20;40[
[40,60[[60;80[
[80;100[
[100;120[
0
5
10
15
20
3) Diagramme circulaire
En reprenant l’exemple du nombre de filles et de garçons dans une classe de
30 élèves, on a
filles
43%garçons
57%
L’amplitude de l’angle au centre du secteur circulaire représentant la modalité
« garçon » vaut 17
360 20430
.
Cette représentation est souvent utilisée lors des élections.
Statistiques
12
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0
1
2
3
4
5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
4) Polygone des effectifs et des fréquences
La construction du polygone des effectifs ou des fréquences est analogue à
celle du diagramme en bâtonnets mais, plutôt que de tracer des segments
verticaux, on relie les points de coordonnées ( , )k kx n dans le cas des effectifs et
( , )k kx f dans le cas des fréquences par des segments de droites pour tracer
finalement une ligne brisée.
En reprenant l’exemple des cotes obtenues lors d’un contrôle de géographie
par 25 élèves d’une classe, on a
1) Polygone des effectifs :
2) Polygone des fréquences
Statistiques
13
0
0,2
0,4
0,6
0,8
1
1,2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5) Diagramme des effectifs cumulés et des fréquences cumulées
On porte en abscisses les différentes modalités (xk) et en ordonnées k (pour
les effectifs cumulés) ou Fk (pour les fréquences cumulées)
En reprenant l’exemple des cotes obtenues lors d’un contrôle de géographie
par 25 élèves d’une classe, on a
1) Diagramme des effectifs cumulés
2) Diagramme des fréquences cumulées
Statistiques
14
C. Exercices
1. Dans une classe de 25 élèves, on a demandé à chaque étudiant de donner le
nombre d’animaux domestiques qu’il possède. Voici un diagramme en bâtonnets
représentant les données :
Identifie, en justifiant, le diagramme circulaire qui représente cette situation
A B C
2. Dans une université belge, on a relevé les nationalités d’un certain nombre
d’étudiants. Voici les résultats récoltés :
Nationalité Nombre d’étudiants
Belge 551
Française 356
Luxembourgeoise 267
Espagnole 68
Allemande 45
Non européens 213
a) Quel est l’effectif total de la série ?
b) Complète le tableau afin d’obtenir les fréquences de chacune des modalités.
Les effectifs et fréquences cumulés ont-ils un sens ?
d) Représente graphiquement ces données
sous la forme d’un diagramme à bâtonnets (l’axe horizontal
représente les nationalités et l’axe vertical les effectifs
correspondants).
sous la forme d’un diagramme circulaire (l’amplitude d’un angle au
centre est proportionnelle à l’effectif de la série statistique).
2 32%
1 24%
3 28%
4 16%
2 32%
1 24%
3 28%
4 16%
0
2
4
6
8
10
1 2 3 4
Nombre d'animaux domestiques
No
mb
re d
'étu
dia
nts
Statistiques
15
3. Une enquête de police relative au nombre de procès-verbaux dressés à des
automobilistes en Belgique en 2003 a fourni les résultats suivants :
Nombre de procès-
verbaux (xk) 0 1 2 3 4 5 6 7 + de 7
Nombre
d’automobilistes (nk) 468 330 120 54 13 8 4 2 1
a) Combien d’automobilistes ont été sanctionnés ?
b) Complète le tableau suivant de la manière indiquée :
Modalités
xi
Effectifs
ni
Effectifs cumulés
i
Fréquences
ii
nf
n
Fréquences cumulées
iiF
n
0 468 468
1 330 468 + 330 = 798
2 120 798 + 120 = 918
…… ….. …..
c) Que représente dans la 3e colonne le nombre 798 ?
d) Combien d’automobilistes ont reçu moins de trois contraventions ?
e) Combien d’automobilistes ont reçu au moins trois contraventions ?
f) Représente le polygone des effectifs cumulés.
g) Représente le polygone des fréquences cumulées.
h) Compare les deux graphiques réalisés.
Statistiques
16
4. De la truie aux porcelets
Dans le tableau suivant sont répertoriés le nombre de porcelets produits par une
truie au cours d’une année pour un élevages de 62 truies.
17 12 18 16 16 10 18 21 16 21 17
14 19 18 19 18 19 14 18 18 15 16
15 16 17 19 14 16 16 21 16 20
16 16 14 17 10 16 16 17 17 16
17 18 18 11 19 15 19 17 11 15
14 13 18 20 20 18 16 21 18 17
Ce tableau de 62 nombres n’est pas très parlant et, de plus, il n’est pas facile à
manipuler. Aussi, pour que ces résultats soient plus simples d’utilisation, nous
allons grouper certains résultats.
a) Forme des classes de longueur 2 : [10 ;12[ ; [12 ;14[ ;…. ;[20 ;22[ et
détermines-en le centre. Dresse ensuite un tableau de la forme :
Modalités Nombre de porcelets
par truie
Effectifs Nombre de
truies
Effectifs
cumulés
Centre de
la classe Fréquences
Fréquences
cumulées
[10 ;12[
…..
b) Construis un histogramme représentatif de cette série (la longueur de la base
de ces rectangles est la longueur des classes et la hauteur est l’effectif de
cette classe).
c) À l’aide du tableau ci-dessus, détermine :
le pourcentage de truies produisant moins de 16 porcelets
le pourcentage de truies produisant au moins 14 porcelets.
d) Détermine le nombre moyen de porcelets produits par truie au cours de
l’année (Lorsqu’il s’agit d’une enquête dont les résultats ont été répartis en
classes, il convient de prendre comme représentant le centre de celle-ci).
5. Voici un ensemble de nombres représentant les cotes attribuées, sur un maximum
égal à 20, à 50 élèves lors d’un examen de mathématique
10, 13, 7, 12, 16, 8, 10, 13, 18, 12, 12, 11, 11, 15, 13, 4, 8, 10, 14, 12, 9, 14, 12, 10, 18, 7, 12,
13, 16, 10, 15, 9, 12, 16, 13, 11, 12, 8, 14, 11, 15, 10, 13, 12, 13, 10, 16, 14, 11, 12
a) Dresse un tableau recensé et ordonné complet (modalités, effectifs, effectifs
cumulés, fréquences, fréquences cumulées)
b) Dessine le polygone des effectifs et le polygone des fréquences cumulées
Statistiques
17
D. Symbole sommatoire
Le symbole sommatoire signifie qu’il faut faire la somme de toutes les
expressions obtenues en donnant à i toutes les valeurs entières entre la première
valeur indiquée sous le symbole et la dernière qui est indiquée au-dessus du symbole.
Exemples
5 7
2 2 2 2 2 2
i 1 i 3
i 1 2 3 4 5 15 , i 1 3 1 4 1 5 1 6 1 7 1
Ce symbole permet de simplifier de nombreuses formules mathématiques.
Exercices
1) Écris les expressions suivantes sans le symbole sommatoire et calcule-les quand
c’est possible :
a) 5
i 2
i²
b) 7
i 0
2i 3
c) 100
i 1
i
d) 10
1k
k
e) 3
i 1
2
i
f) 2
3
i 0
i 1
g) n
i 1
2i 1
h) 5
0
3k
k
i) 3
i 1
3 0i
j) 7
i 2
3
k) 100
i 1
0
l) 9
3
0k
k
2) Écris les expressions suivantes à l’aide du symbole sommatoire :
a. 2 + 4 + 6 + 8 + ….+ 64
b. 2 + 22 + 23 + …. + 218
c. 1 + 4 + 9 + … + 225
d. 0+3+6+9+12+15
e. 1 1 11 ...
4 9 100
f. 5 5 5...
8 27 512
3) Voici deux formules. À quoi correspondent-elles ? 1
p
i
i
n
1
k
i
i
f
4) Écris les expressions suivantes en détaillant chacun des termes :
a) 6
1
j
j
x
b) 5
1j
m
c) 5
2
0
1k
k
y
d) 10
1
k k
k
f x
5) Écris les expressions suivantes en utilisant le symbole de sommation
a) 2 2 2
1 2 99....x x x b) 1 1 2 2 17 17....x z x z x z
c) 4 4 4
1 1 2 2 17 17....x y x y x y d) 2 181 3 3 .... 3
Statistiques
18
E. Paramètres de position ou valeurs centrales
Dans le cas des caractères quantitatifs, on pourrait essayer de tirer davantage d’informations
à propos de la population observée. Une idée est de regarder la tendance centrale. Il existe
trois paramètres de position ou valeurs centrales.
1. Moyenne arithmétique
Définition
La moyenne arithmétique, notée x , des n nombres x1, x2, ..., xn est le nombre
1 2
1
... 1 nn
i
i
x x xx x
n n
On utilise parfois une autre formulation pour la moyenne arithmétique :
Si n1 est l’effectif de la modalité x1, n2 celui de la modalité x2 , ..., np celui de la
modalité xp et n l’effectif total (n = n1 + n2 + ... + np),
alors
1 1 2 2
1
..... 1 pp p
i i
i
x n x n x nx n x
n n
Exemples
1) Six élèves ont présenté un examen oral de mathématiques ; les résultats sont les
suivants : 8 – 10 – 10 – 13 – 14 – 14 .
La moyenne arithmétique est alors x
En consignant les notes obtenues par les élèves dans un tableau groupé, on obtient :
Modalités (notes : xk)
Effectifs (nk)
La moyenne arithmétique des notes peut alors se calculer de la manière suivante :
x
Statistiques
19
2) Lorsqu’il s’agit d’un caractère quantitatif dont les résultats ont été répartis en
classes, il convient de prendre comme représentant le centre de celle-ci.
En reprenant l’exemple des 80 virements de moins de 120 €, on dresse le tableau
Modalités
kx Centres Effectifs
kn
[0,20[ 10 8
[20,40[ 30 12
[40,60[ 50 16
[60,80[ 70 17
[80,100[ 90 12
[100,120[ 110 15
Dans ce cas,
x
Remarque
Calculer la moyenne arithmétique d’un caractère qualitatif n’a aucun sens.
2. Médiane
La moyenne arithmétique ne suffit pas toujours pour décrire une population d’un point de
vue statistique car elle peut être fortement influencée par ses valeurs extrêmes.
Définition
La médiane, notée M, d’une série statistique à caractère quantitatif est la valeur du
caractère telle que la moitié de l’effectif total lui est inférieure ou égale et l’autre
moitié lui est supérieure ou égale.
Exemples
Cas où l’effectif total est impair :
Cinq élèves ont présenté un examen oral de mathématiques ; les résultats
sont les suivants : 8 – 9 – 10 – 13 – 14. La médiane est 10 car deux cotes lui
sont inférieures et deux lui sont supérieures.
Cas où l’effectif total est pair :
Six élèves ont présenté un examen oral de mathématiques ; les résultats
sont les suivants : 8 – 9 – 10 – 13 – 14 - 15 .
La médiane est la moyenne arithmétique de 10 et de 13, à savoir 11,5 car
deux cotes leur sont inférieures et deux leur sont supérieures. Il est à noter
ici que la médiane et la moyenne coïncident.
Statistiques
20
3. Quartiles
Définition
Les quartiles partagent la population en quatre groupes de même effectif.
Exemples
1) Dans la série 2 - 8 - 8 - 9 - 10 - 12 - 13 - 13 - 13 - 15 - 16 - 18 - 20, nous avons
Q1 =
Q2 = (le 2ème quantile correspond toujours à la médiane)
Q3 =
2) Dans la série 2 - 4 - 5 - 6 - 6 - 7 - 8 - 8 - 9 - 10 - 10, nous avons
Q1 =
Q2 =
Q3 =
4. Mode
Définition
Le mode est la valeur du caractère auquel correspond l’effectif le plus élevé.
On parle de classe modale dans le cas d’un caractère quantitatif dont les modalités
ont été regroupées en classes.
Exemples
1) Cinq élèves ont présenté un examen oral de mathématiques ; les résultats sont les
suivants : 8 – 10 – 10 – 13 – 14. Le mode est 10, c’est la cote la plus fréquente.
2) Dans l’exemple des montants des 80 virements, la classe modale est [60;80[.
Remarques
1) Le mode (ou la classe modale) d’une population peut ne pas être unique.
Par exemple, la série 8 – 10 – 10 – 13 – 14 - 14 n’a pas de mode unique.
(les cotes 10 et 14 apparaissent un même nombre de fois).
2) En statistiques, le mot « mode » est masculin. Il a cependant pour origine le mot
« mode » au féminin qui correspond à une « tendance dominante ».
Statistiques
21
5. Exercices
1. Voici les cotes obtenues par 25 élèves d’une classe lors d’un contrôle de géographie
( il s’agit de l’exercice 2 page 8)
12 03 13 15 17 11 15 13 13 18 11 13 20 12 11
08 12 05 08 19 10 17 05 15 20
a) Détermine la moyenne de cette série
b) Détermine la médiane et les quartiles
c) Détermine le mode
2. Une enquête de police relative au nombre de procès-verbaux dressés à des
automobilistes en Belgique en 2003 a fourni les résultats suivants :
( il s’agit de l’exercice 3 page 15)
Nombre de procès-
verbaux (xk) 0 1 2 3 4 5 6 7 + de 7
Nombre
d’automobilistes (nk) 468 330 120 54 13 8 4 2 1
a) Détermine la moyenne de cette série
b) Détermine la médiane et les quartiles
c) Détermine le mode
Statistiques
22
F. Paramètres de dispersion d’une série statistique
Voici les cotes obtenues (sur 20) à trois contrôles par Marie et Pierre :
Marie : 09 – 10 – 11
Pierre : 00 – 10 – 20
Ces deux séries ont la même moyenne arithmétique (à savoir …....)
et la même médiane ( à savoir …..…).
Cependant, elles diffèrent radicalement ; la seconde série paraît plus dispersée que la
première qui semble plus groupée autour des valeurs centrales.
Nous allons déterminer de nouveaux paramètres qui vont caractériser cette dispersion.
1. Etendue
Définition
L’étendue d’une série statistique est la différence entre la plus grande et la plus petite
valeur de la série.
Exemples
Série 1 : 312 – 314 – 317 – 320 – 322 Série 2 : 267 – 292 – 317 – 342 – 367
L’étendue de la 1re série est
et celle de la 2e série est
Bien que le calcul de l’étendue d’une série statistique soit particulièrement simple,
ce paramètre a pour gros désavantage de ne tenir compte que des deux valeurs
extrêmes.
L’étendue pour Marie est et pour Pierre est
2. Ecart moyen
Une idée parmi d’autres serait de calculer comment les résultats s’écartent par rapport à
la moyenne, c’est-à-dire de calculer ix x où xi désigne n’importe quelle modalité et x
la moyenne arithmétique.
Définition
L’écart moyen d’une série statistique est 1
1 p
i i
i
n x xn
.
Statistiques
23
Exemples
Reprenons l’exemple ci-dessus et calculons la moyenne des écarts:
xi ni ix x xi ni ix x
312 1 267 1
314 1 292 1
317 1 317 1
320 1 342 1
322 1 367 1
La moyenne des écarts (l’écart moyen) pour chacun des exemples vaut
Que vaut la moyenne des écarts pour Pierre et Marie ?
Cette caractéristique n’est donc d’aucune utilité puisque les écarts négatifs
sont compensés par les écarts positifs.
3. Ecart moyen absolu
Afin d’éviter les désagréments dus aux signes, on introduit des valeurs absolues pour
le calcul des écarts.
Définition
L’écart moyen absolu d’une série statistique, noté e, est la moyenne des valeurs
absolues des écarts de chaque valeur par rapport à la moyenne.
1 1 2 2
1
1 1...
p
p p i i
i
e n x x n x x n x x n x xn n
Exemples
Reprenons la série 1 ci-dessus : 312 – 314 – 317 – 320 – 322
xi ni ix x
312 1
314 1
317 1
320 1
322 1
La moyenne des écarts moyens absolus est donc égale à
Cette valeur signifie qu’en moyenne, les valeurs s’écartent de 3,2 autour de la
moyenne arithmétique.
Statistiques
24
Reprenons à présent la série 2 : 267 – 292 – 317 – 342 – 367
xi ni ix x
267 1
292 1
317 1
342 1
367 1
La moyenne des écarts moyens absolus est donc égale à
.
Cette valeur signifie qu’en moyenne, les valeurs s’écartent de 30 autour de la
moyenne arithmétique.
La deuxième série est donc beaucoup plus dispersée que la première.
Quel est l’écart moyen absolu pour Pierre et pour Marie ?
Pour qui les résultats sont-ils les plus dispersés ?
4. Variance - Ecart-type
Afin de mettre davantage en évidence les différences entre les variables très écartées de la
moyenne et la moyenne, on remplace les écarts par leur carré.
Définitions - Notations
La variance, notée V, d’une série statistique est la moyenne arithmétique des
carrés des écarts par rapport à la moyenne de toutes les valeurs de la série.
2 2 2
21 1 2 2
1
... 1 pp p
i i
i
n x x n x x n x xV n x x
n n
L’écart-type, noté , est la racine carrée positive de la variance.
2
1
1 p
i i
i
V n x xn
.
Remarques
1) L’importance en statistiques de l’écart-type réside dans le fait que, généralement,
- l’intervalle 2 ; 2m m contient 95% de la population autour de la moyenne ;
- l’intervalle 3 ; 3m m contient 99% de la population autour de la moyenne.
2) Dans le cas d’un caractère quantitatif dont les modalités sont regroupées par
classes, les xi doivent être remplacés par les centres des classes.
Statistiques
25
Exemples
Série 1 : 312 – 314 – 317 – 320 – 322 317x
xi ni 2
i in x x
312 1
314 1
317 1
320 1
322 1
La variance est donc égale à et l’écart-type vaut environ
Série 2 : 267 – 292 – 317 – 342 – 367 317x
xi ni 2
i in x x
267 1
292 1
317 1
342 1
367 1
La variance est donc égale à et l’écart-type vaut environ
5. Intervalle interquartile
Définition
L’intervalle interquartile d’une série statistique est l’intervalle dont les
extrémités sont Q1 et Q3 , lorsque Q1 est le 1er quartile et Q3 le 3e quartile.
Dans un tableau groupé, cet intervalle contient généralement la moitié de la
population.
Exemple
En reprenant l’exemple des cotes obtenues par les 25 élèves d’une classe au contrôle
de géographie (exemple 2 page 8), le 1er quartile Q1 étant ……. et le 3e quartile Q3
étant ……., l’intervalle interquartile est […….,…….] et contient …….% de la
population.
Statistiques
26
Paramètres de position et de dispersion : Résumé
A. PARAMETRES DE POSITION
1) Moyenne arithmétique : x = somme de toutes les valeurs de la série
effectif total
2) Médiane : Nombre qui partage la série en deux parties d’effectifs égaux.
On la note M.
3) Quartiles : Nombres qui partagent la série en quatre parties d’effectifs
égaux.
On les note Q1, Q2 et Q3 et on a toujours Q2 = M.
Attention ! Avant de rechercher la médiane et les quartiles, il faut
commencer par ordonner les valeurs.
4) Mode : Modalité dont l’effectif est le plus élevé (=modalité qui apparaît le
plus grand nombre de fois dans la série)
Remarque : Lorsqu’il n’y a aucune modalité qui domine, on dit qu’il n’y a pas
de mode.
B. PARAMETRES DE DISPERSION
1) Etendue = Différence entre la plus grande et la plus petite valeur de la série.
2) Ecart moyen = Moyenne des écarts par rapport à la moyenne.
Ce paramètre est inutile car il vaut toujours 0.
3) Ecart moyen absolu = Moyenne des valeurs absolues des écarts par rapport
à la moyenne. On le note e.
4) Variance = Moyenne des carrés des écarts par rapport à la moyenne.
On la note V.
5) Ecart-type = racine carrée positive de la variance. On le note .
6) Intervalle inter-quartile = [Q1 ;Q3]
Remarque : - l’intervalle 2 ; 2m m contient 95% de la population
- l’intervalle 3 ; 3m m contient 99% de la population
Statistiques
27
C. EXEMPLE
Considérons la série : 4 - 9 - 3 - 6 - 10 - 15 - 2 - 18 - 3 - 3
1) Moyenne : 4 9 3 6 10 15 2 18 3 3
7,310
x
2) Médiane : On commence par ordonner la série : 2 - 3 - 3 - 3 - 4 - 6 - 9 - 10 - 15- 18
La médiane est 5 (c’est la moyenne entre 4 et 6). Il y a exactement 5
valeurs inférieures à 5 et 5 valeurs supérieures à 5.
3) Quartiles : On a Q1 = 3, Q2 = M = 5 et Q3 = 10
4) Mode : Le mode est 3 car c’est cette valeur qui apparaît le plus grand nombre de
fois dans la série.
5) Etendue : L’étendue est 16 : c’est la différence entre 18 et 2
6) Ecart moyen : Il vaut toujours 0
7) Ecart moyen absolu / Variance / Ecart-type
ix | |ix x 2( )ix x
2 5,3 28,09
3 4,3 18,49
3 4,3 18,49
3 4,3 18,49
4 3,3 10,89
6 1,3 1,69
9 1,7 2,89
10 2,7 7,29
15 7,7 59,29
18 10,7 114,49
On a 5,3 4,3 4,3 4,3 3,3 1,3 1,7 2,7 7,7 10,7
4,5610
e
On a 28,09 18,49 18,49 18,49 10,89 1,69 2,89 7,29 59, 29 114,49
28,0110
M
On a 28,01 5,29M
Ici, l’intervalle 3 ; 3 [7,3 3 . 5,29 ; 7,3 3 . 5,29] [ 8,57;23,17]m m contient bien toute
la population
Statistiques
28
G. Exercices
1. Après avoir calculé le mode (ou la classe modale) ainsi que la moyenne des séries
suivantes, représente ces données par un diagramme en bâtons ou un histogramme :
1e situation : nombre de téléviseurs par famille d’une classe
Modalités Effectif
0 2
1 13
2 7
3 3
4 1
5 1
2e situation : âge des arbres d’une forêt
Classes Effectif
[0,15[ 997
[15,30[ 1617
[30,45[ 3114
[45,60[ 1514
[60,75[ 1865
[75,90[ 213
2. Une classe de 4e année est composée de 30 élèves dont 10 filles et 20 garçons. Le
relevé des tailles exprimées en cm de chaque élève a donné les résultats suivants :
Pour les filles : 170 ;174 ;180 ;185 ;176 ;180 ;180 ;171 ;181 ;172
Pour les garçons : 175 ;170 ;174 ;173 ;170 ;180 ;172 ;170 ;179 ;
168 ;174 ;174 ;175 ;182 ;170 ;170 ;172 ;168 ;173 ;185
a. 1) Calcule la taille moyenne des filles.
2) Calcule la taille moyenne des garçons.
3) Déduis-en la taille moyenne d’un élève de cette classe.
3. Arthur a obtenu aux cours de mathématiques les cotes (sur 20) suivantes :
17 ;13 ;x ;12 ;08 ;13.
Détermine la valeur de x si on t’informe que sa moyenne est de 13 sur 20.
Statistiques
29
4 Une entreprise dispose de 60 camions et désire étudier le taux de panne. Pour cela,
le chef mécanicien note, jour après jour, pendant le mois d’avril, le nombre de
camions en panne. Ses observations ont été les suivantes.
5 4 6 3 6 5
7 0 2 2 2 4
3 5 1 1 0 1
2 5 5 7 6 7
5 4 3 5 6 5
a. Détermine la moyenne, le mode et la médiane de cette série statistique.
b. Calcule la variance puis l’écart-type de cette série.
5. Dans un petit potager, on a récolté 140 gousses de haricots et on a dénombré le
nombre de grains de chaque gousse. On a obtenu les résultats suivants :
Nombre
de grains
(xi)
1 2 3 4 5 6 7 8 9 10
Nombre
de
gousses
(ni)
3 5 9 18 32 38 20 7 6 2
a) Calcule la moyenne x de cette série.
b) Que vaut l’écart-moyen de cette série ?
c) Calcule l’écart-moyen absolu de cette série ?
d) Construis les lignes te permettant de calculer la variance et l’écart-type.
6. On a interrogé 40 personnes quant au nombre de livres qu’elles ont lus l’an dernier.
Les résultats sont les suivants :
15 24 31 30 25 7 4 1
2 8 13 21 17 2 32 34
34 25 21 13 17 20 18 14
5 18 0 24 3 14 1 2
11 27 33 19 7 2 4 25
a. Ordonne les résultats obtenus.
b. Calcule la médiane, le mode, les quartiles et la moyenne arithmétique.
c. Calcule l’étendue, la variance et l’écart-type.
Statistiques
30
7. On étudie les précipitations dans les villes de Bruxelles et de Paris. Cette étude a
été réalisée sur une période d’un an. Les mesures sont exprimées en mm.
Mois Bruxelles Paris
Janvier 71,3 60,4
Février 62,3 54,7
Mars 57,3 67,2
Avril 63,5 54,2
Mai 49,6 43,2
Juin 34,3 23,2
Juillet 25,2 18,6
Août 13,9 18,2
Septembre 33,5 29,6
Octobre 49,8 54,2
Novembre 52,3 53,2
Décembre 64,5 65,7
a. Dans quelle ville pleut-il le plus en moyenne ?
b. Quelle est la ville dans laquelle les précipitations sont les plus régulières ?
8. Un organisme a interrogé 300 familles de 8 enfants. On leur a demandé combien de
garçons figuraient parmi ces 8 enfants. On a obtenu les résultats suivants :
Nombre de
garçons xi
Effectif
ni
0 17
1 28
2 54
3 68
4 58
5 38
6 27
7 8
8 2
a. Quel est le caractère étudié ? Est-il quantitatif ou qualitatif ?
b. Quelle est la valeur du caractère qui a le plus grand effectif ?
c. Quelle est la moyenne, la médiane, la variance et l’écart-type de cette série ?
d. Représente graphiquement cette situation.
Statistiques
31
9. Lors d’un recensement, on a relevé le nombre d’enfants dans 100 familles
Nombre de d’enfants Effectifs
0 9
1 23
2 26
3 16
4 13
5 7
6 3
7 2
8 1
a) Calcule la moyenne de cette série
b) Calcule la médiane, les quartiles et le mode
c) Calcule l’écart moyen absolu de cette série
d) Calcule la variance et l’écart-type