présentation des données résumé et description numérique
TRANSCRIPT
![Page 1: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/1.jpg)
Présentation des données
Résumé et description numérique
![Page 2: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/2.jpg)
Résumé numérique
Fré
qu
en
ce
Dispersion
Position
Étendue(intervalle de variation)interquartileVarianceÉcart typeCoefficient de variation
ModeMédianeMoyennequartiles
forme
asymétrie
aplatissement
![Page 3: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/3.jpg)
Paramètres de position(valeurs centrales autour desquelles se groupent les valeurs observées)
désigne la moyenne arithmétique de n éléments (n = effectif) tirés d’un échantillon. Mêmes unités que x.
μx = E(x) = moyenne de la distribution théorique des éléments x d’une population
Moyenne arithmétique (mean)
Statistiques descriptives – Paramètres d’une distribution
![Page 4: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/4.jpg)
Statistiques: mesures de la tendance centrale moyenne: facile à calculer
mais peut être influencée par des valeurs extrêmes
X
Fré
qu
en
ce
x
n
xx
n
ii
![Page 5: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/5.jpg)
Médiane (median) Mex
La médiane est la valeur de la variable qui se situe au centre de la série statistique, classée en ordre croissant. La médiane sépare la série en deux groupes d’égale importance.
• S’il y a un nombre impair d’observations, Me est une observation de lasérie. Exemple: pour la série [1, 32, 128, 129, 1000235]
•S’il y a un nombre pair d’observations, la médiane est située entre lesdeux observations centrales de la série. Par convention, on utilise lamoyenne de ces deux valeurs.Exemple: pour la série [1, 32, 128, 129, 532, 1000235]
médiane (M): est la valeur de la variable mesurée pour laquelle le nombre d’observations supérieures et inférieures est égal. Elle est moins influencée par les valeurs extrêmes que la moyenne.
Me = 128,5
Me = 128
![Page 6: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/6.jpg)
Stabilité de la médiane:exemple1
on a reporté le temps mis par 20 nouveaux diplômés pour décrocher un premier emploi( en mois):
0; 0; 0; 0;0;1;1;1;2;2;2;3;3;3;4;4;6;6;8;20 Avec les 20 valeurs:MOY=3,3Me=2 En éliminant la valeur 20 mois:moy=2,42Me=2Conclusion: la moy est bcp plus stable que la moy vis-à-vis des
valeurs extrêmes
![Page 7: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/7.jpg)
Stabilité de la médiane pour des données
quantitatives discrètes:exemple 2
Tab. Nombre de frères et sœurs de tous les étudiants d’une section
0 1 2 3 4 TOTAL38 94 75 48 5 260
nombre de frères et sœurseffectif
Moy=1,57Me=1(130e et 131e =1)
![Page 8: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/8.jpg)
Stabilité de me pour des données quantitatives discrètes:exemple 2 fin. Six étudiants absents lors du recueil des données
annoncent qu’ils ont respectivement:2;3;2;0;4 et 2 frères et sœurs
Pour cette série complétée :Moy=1,58 me=2On remarque que la médiane change beaucoup avec
l’ajout de seulement 6 données sur 260 alors que la moy reste stable. C’est l’inconvénient de la médiane sur des données quantitatives discrètes
![Page 9: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/9.jpg)
Mode Mo
• Le mode est l’indice de la classe comportant le plus de valeurs. Dans une distribution continue c’est la "bosse" de la distribution. • Il peut y avoir plusieurs modes dans une distribution.
•Dans le cas des classes à amplitudes inégales, le mode ne correspond pas toujours à la valeur de la classe la plus fréquente(td)
![Page 10: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/10.jpg)
éChaque pic correspond à un stade larvaire différent
Le mode: exemple
![Page 11: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/11.jpg)
Forme d’une distribution en fonction de ses paramètres de position
![Page 12: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/12.jpg)
Intérêt de chaque paramètre de position
![Page 13: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/13.jpg)
Variance (variance)
Population statistique d'effectif N:
Échantillon aléatoire d'effectif n:
Attention
Paramètres de dispersion(ils renseignent sur l’étalement des valeurs observées)
![Page 14: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/14.jpg)
L’écart type (standard deviation)
σx pour une population ou une distribution théoriquesx pour un échantillon
Coefficient de variation (coefficient of variation)
Symbole: C.V., CV ou V
Le coefficient de variation permet donc de comparer la variation de variables exprimées originellement dans des unités physiques différentes.
Lorsque les échantillons sont de petite taille (n<20), on applique une correction à la formule du coefficient de variation:
![Page 15: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/15.jpg)
Exemple
Soit une série de 5 valeurs:
28, 42, 48, 59, 63
1 48
n
ii
xx
n
x (x-x) (x-x)2
28 -20 440
42 -6 36
48 0 0
59 11 121
63 15 225
2
1
2
2
( ) 782
156,40 12,51
195,50 13,98
26,06%
n
ii
x x
s s
CV
![Page 16: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/16.jpg)
Intervalle interquartile:
regroupe 50% des valeurs de l’échantillon IQ=Q3-Q1= longueur de la boite du box plot
Étendue de variation (range)=max-min
Exemple: notes
Étudiant A:8;9;10;11;12
Étudiant B:5; 5;6; ;15;19
Étendue A=12-8=4
Étendue B=19-5=14
SENSIBLE AUX VALEURS EXTREMES
![Page 17: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/17.jpg)
Paramètres de dispersion: l’étendue de la variation L’étendue de la variation
est définie par la valeur la plus grande et la valeur la plus petite de l’échantillon
C’est une statistique simple mais qui est biaisée parce qu’elle sous-estime la valeur de la population.
Fré
qu
en
ce
L’étendue de la variation de la population
L’étendue de la variation de l’échantillon
![Page 18: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/18.jpg)
Paramètres de forme
![Page 19: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/19.jpg)
Coefficient d’asymétrie (skewness)
Mesure l'asymétrie d'une distribution, c'est-à-dire si elle "penche" d'un côté ou de l'autre.
Où est le cube de l'écart type de la distribution
distribution symétrique distribution tend vers la droitedistribution tend vers la gauche
![Page 20: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/20.jpg)
Coefficient d’aplatissement (kurtosis)
Mesure l'aplatissement d'une distribution
Où est la quatrième puissance de l'écart type de la distribution
normale
![Page 21: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/21.jpg)
Paramètre de dispersion d'une série statistique double
Covariance sxy
• La covariance est une généralisation à deux dimensions du concept de variance. Ce paramètre mesure la dispersion conjointe de deux variables. • La covariance renseigne sur la forme et l'orientation du nuage de points d'un diagramme de dispersion.
![Page 22: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/22.jpg)
Présentation des données dans un listage logiciel
![Page 23: Présentation des données Résumé et description numérique](https://reader035.vdocuments.fr/reader035/viewer/2022081518/551d9d7f497959293b8b8174/html5/thumbnails/23.jpg)
PH
3,48
3,51
3,55
3,57
3,59
3,6
3,72
3,79
3,82
3,83
3,85
3,86
3,89
3,91
3,92
3,92
3,93
3,96
4,06
4,12
PH
Moyenne 3,794Erreur-type 0,041696901Médiane 3,84Mode 3,92Écart-type 0,186474212Variance de l'échantillon 0,034772632Kurstosis (Coefficient d'applatissement)-0,930133301Coefficient d'assymétrie -0,255208244Plage 0,64Minimum 3,48Maximum 4,12Somme 75,88Nombre d'échantillons 20Niveau de confiance(95,0%) 0,087272617
Listage Excel