1 chapitre 8: la gestion des données consulte les pages 366 et 367 pour les concepts et vocabulaire...

42
1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

Upload: violette-lucas

Post on 04-Apr-2015

105 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

1

Chapitre 8: La gestion des donnéesConsulte les pages 366 et 367 pour

les concepts et vocabulaire clés

Page 2: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

2

Chapitre 8: Prépare-toi Avant de commencer le chapitre 8, il faut

réviser ces concepts:

1. Représenter des données

2. Les diagrammes à boîte et à moustaches

3. Les mesures de tendance centrale

4. Interpoler et Extrapoler des valeurs

Page 3: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

3

8.1: Les diagrammes de dispersion Statistique Canada collectionne et organise

des données pour aider les Canadiens à mieux comprendre leur pays: sa population, ses ressources, son économie, sa société et sa culture.

Page 4: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

4

Les diagrammes de dispersion Un diagramme de dispersion est un

diagramme qui permet de représenter graphiquement des couples de données numériques.

Il sert à voir des relations entre deux variables.

Page 5: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

5

La droite la mieux ajustée La droite la mieux ajustée est la droite qui

passe par les points représentés dans un diagramme de dispersion ou qui passe le plus près possible de ces points.

Page 6: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

6

Une valeur aberrante Une valeur aberrante est une donnée qui

ne suit pas la régularité qui se dégage des autres données.

Cette donnée semble très à l’écart de la plupart des données.

Page 7: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

7

Interpoler des valeurs Interpoler des valeurs veut dire

l’estimer des valeurs qui se trouvent entre des données connues.

Page 8: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

8

Extrapoler des valeurs Extrapoler des valeurs veut dire

l’estimer des valeurs qui se trouvent à l’extérieur des données connues.

Page 9: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

9

Les variables indépendantes Dans une relation, la variable indépendante est

la variable qui détermine la valeur de la variable dépendante.

Par exemple, avec la vitesse, distance/temps, le temps est la variable indépendante parce que la distance le dépend.

D’habitude, la variable indépendante est x

Page 10: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

10

Les variables dépendantes Dans une relation, la variable dépendante est la

variable dont la valeur est déterminée par la variable indépendante

Par exemple, avec la vitesse, distance/temps, la distance est la variable dépendante parce que la distance dépend sur le temps pour sa valeur.

D’habitude, la variable dépendante est y

Page 11: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

11

Les types des données Il y a deux types: 1. des données

continus

2. des données discrètes

Page 12: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

12

Des données continues Si une variable peut représenter n’importe

quel nombre réel, les données sont des données continus.

Quand les données sont rattachées ensemble pour former une droite, cela représente des données continues.

Un exemple des données continus est la température.

Page 13: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

13

Des données discrètes Si la variable ne peut pas être n’importe

quel nombre réel (i.e. un nombre décimal), les données sont des données discrètes.

Quand les données ne sont pas rattachées ensemble, cela représente des données discrètes.

Un exemple des données discrètes sont comme le nombre des pages dans un livre.

Page 14: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

14

Une corrélation #1 Pour mieux comprendre et mieux organiser

les données, Statistique Canada trace des diagrammes de dispersion pour déterminer une corrélation entre deux variables.

Page 15: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

15

Une corrélation #2 Une corrélation est la mesure de la

dispersion des points autour d’une droite dans un diagramme de dispersion (le degré de relation entre deux variables)

Page 16: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

16

Les adjectifs d’une corrélation La corrélation entre 2

variables peuvent être:

Forte Faible Positive Négative N’est pas apparente

Page 17: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

17

Une corrélation forte Si la plupart des points sont groupés

autour d’une droite, la corrélation est forte.

Page 18: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

18

Une corrélation faible Si les points sont dispersés, mais

montrent une tendance générale, la corrélation est faible.

Page 19: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

19

La corrélation positive

Une corrélation positive veut dire que la relation entre les variables est positive.

Par exemple, quand la variable indépendante augmente, la variable dépendante augmente alors la pente est positive (elle monte de gauche à droite)

Page 20: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

20

La corrélation négative Une corrélation négative veut dire que

la relation entre les variables est négative.

Par exemple, quand la variable indépendante augmente, la variable dépendante diminue alors la pente est négative (elle descend de gauche à droite)

Page 21: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

21

Une corrélation n’est pas apparente Si les points sont dispersés et ils ne

montrent pas de tendance générale, il n’y a pas de corrélation ou la corrélation n’est pas apparente.

Page 22: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

22

Une relation

Une relation est une régularité entre deux ensembles de nombres.

Une relation = « a relationship »

Page 23: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

23

Les types des relations Avec la gestion des

données, il y a 2 types de relations:

Une relation linéaire (elle forme une ligne droite)

Une relation non linéaire (elle ne forme pas de ligne droite)

Page 24: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

24

8.2: Analyser des données et faire des prévisions

Pour analyser les données, il est utile à représenter les données à l’aide d’un diagramme de dispersion.

Puis, trace, à vue, la droite la mieux ajustée.

Page 25: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

25

La qualité de l’ajustement de la droite

Une grille de corrélation est un guide pour indiquer de la qualité de l’ajustement de ta droite.

Page 26: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

26

Une grille de corrélation Corrélation La qualité de l’ajustement

+1 L’ajustement parfait sur une droite de pente positive.

Forte et positive La plupart des points sont groupés autour d’une droite de pente positive.

Faible et positive Les points sont dispersés, mais montrent une tendance générale positive.

0 Aucune relation apparente.

Faible et négative Les points sont dispersés, mais montrent une tendance générale négative.

Forte et négative La plupart des points sont groupés autour d’une droite de pente négative.

-1 L’ajustement parfait sur une droite de pente négative.

Page 27: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

27

8.3: Représenter des données Voici 6 types de

représenter des données: (9ième année)

1. Un diagramme de dispersion

2. Un histogramme3. Un diagramme circulaire4. Un diagramme à tiges et

à feuilles5. Un diagramme à boîte et

à moustaches6. Un diagrammes à

bandes

Page 28: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

28

Un diagramme à bandes Un diagramme à bandes est un

diagramme qui représente des données à l’aide de bandes horizontales ou verticales.

Il sert à comparer des catégories.

Page 29: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

29

Un diagramme circulaire Un diagramme circulaire est un

diagramme qui représente un ensemble de données par un cercle divisé en secteurs.

Il sert à comparer des catégories entre elles et à comparer chaque catégorie à l’ensemble complet.

Page 30: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

30

Un diagramme à tiges et à feuilles Un diagramme à tiges et à feuilles

est une façon d’organiser des données numériques qui représente une partie de chaque nombre par une tige et l’autre partie par une feuille.

Page 31: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

31

Un histogramme Un histogramme est un diagramme à

bandes juxtaposés qui représente des données groupées par intervalles.

Page 32: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

32

Un diagramme à boîte et à moustaches

Un diagramme à boîte et à moustaches est un diagramme qui indique la médiane et l’étendue d’un ensemble de données numériques.

Page 33: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

33

Le fonction des diagrammes à boîte et à moustaches

Un diagramme à boîte et à moustaches illustre la dispersion des données autour de la médiane d’un ensemble de données.

Page 34: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

34

Le vocabulaire des diagrammes à boîtes et à moustaches La boîte contient ou représente au moins

50% des données. La plus petite valeur et la plus grande se

nomment la valeur minimum et la valeur maximum respectivement.

Le quartile inférieur est la médiane de la moitié inférieure des données.

Le quartile supérieur est la médiane de la moitié supérieure des données.

Page 35: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

35

Comment choisir la représentation la plus appropriée

Le diagramme le plus approprié dépend du type de données que tu veux communiquer.

Page 36: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

36

Les indices pour choisir la représentation correcte #1

1. Les diagrammes à ligne brisée et les diagrammes de dispersion servent à analyser des tendances.

2. Les histogrammes, les diagrammes à boîte et à moustaches et les diagrammes à tiges et à feuilles servent à analyser l’étendue des données.

Page 37: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

37

Les indices pour choisir la représentation correcte #2

3. Les diagrammes à bandes et les diagrammes circulaire servent à comparer des catégories.

Page 38: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

38

Les mesures de tendance centrale

Le mesure de tendance centrale est la valeur qui représente le centre d’un ensemble de données.

Page 39: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

39

Les types de mesure de tendance centrale

Il y a trois types de mesure de tendance centrale:

1. La moyenne

2. La médiane

3. Le mode

Page 40: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

40

La moyenne La moyenne est la somme des valeurs d’un

ensemble divisé par le nombre de valeurs dans l’ensemble.

L’avantage de la moyenne: elle donne des renseignements sur la somme des valeurs.

Le désavantage de la moyenne: les valeur aberrantes ont une incidence sur elle.

Page 41: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

41

Le médiane La médiane est la valeur du milieu quand

les données d’un ensemble sont placées par ordre croissant.

L’avantage de la médiane: les valeurs aberrantes ont peu d’incidence sur elle.

Le désavantage de la médiane: elle ne fournit aucun renseignements sur la somme des valeurs.

Page 42: 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

42

Le mode Le mode est la valeur la plus courante dans

un ensemble de données. L’avantage du mode: il est facile à trouver

dans des tableaux de fréquence, des diagrammes, des diagrammes à bandes ou des histogrammes.

Le désavantage du mode: il peut changer énormément quand il y a ajout de nouvelles données.