Transcript
Page 1: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères

⇓Pour chaque individu :

un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles

valeurs inconnues

Etude

⇓Série de données :

2 variables 12

?

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 2: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction 1.2 Mises en forme

� Séries « listes »

quantité d'engrais

production recueillie

parcelle n°

X (kg.ha-1) Y (q.ha-1)

1 150 462 80 373 120 464 220 515 100 43

X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118

Série chronologique

� Tableaux de contingence

X : âge

20 40 50 60

Y : acuité

3/10 1 5 10 20

6/10 8 12 25 18

9/10 55 26 14 6

Page 3: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

� Séries

« listes »

X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118

Série de données xi et yi

Ensemble de points Mi(xi ; yi)

« nuage de points »

1. Introduction 1.3 Nuage de points

Page 4: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction 1.3 Nuage de points

� Tableaux de contingence

X : âge

20 40 50 60

Y : acuité

3/10 1 5 10 20

6/10 8 12 25 18

9/10 55 26 14 6

Page 5: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

2. Test d’indépendance du Khi-deux

Exemple d’approche

1. Résultats d’un échantillon

de 8 hommes et 12 femmes :

Evaluer la différence entre observation et théorie par un paramètre global : χ²calc

Ce paramètre est le χ²calc de

l’expérience.Calculer un χ² : (obs – th)² / th

Deux variables sont croisées.

Ex : Hypothèse à tester, H0 : « genre et QI sont indépendants (dans la population) »

<100 >100

F 3 9 12

H 6 2 8

9 11 20

2. Résultats théoriquement

attendus (sous H0) :

<100 >100

F 12

H 8

9 11 20

5,4 6,6

3,6 4,4

3. Différences :

χ² partiels et χ² total

<100 >100

F

H

1,067 0,873

1,6 1,309

L’hypothèse à tester est celle de leur indépendance.

4,85

Page 6: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

Quelle que soit l’expérience et sous l’hypothèse nulle « H0 » (ex : « sexe et QI indépendants »),

on sait donner la probabilité que telle valeur du χ² soit (ou ne soit pas) dépassée.

densité de

probabilité

valeurs possibles

du χ² d’un

échantillon en cas

d’indépendance

0 4,85

97,23 %

2,77 %

notre exemple

La loi du χ²

la réalité

densité de

probabilité

valeurs

possibles

du χ²0 4,85

? %

? %

notre

exemple

vos possibilités

6,6

4

1%

5,4

1

2%

3,8

4

5%

2,7

1

10%

2. Test d’indépendance du Khi-deux

Page 7: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. On teste l’hypothèse nulle d’indépendance « H0 » (ex : « sexe et QI indépendants »).

densité de

probabilité

0 χ²calc

2. Le χ² de l’expérience décrite est calculé : χ²calc.

3. On situe notre χ²calc en probabilité grâce au formulaire.

Objectif : peut-on se permettre de la rejeter ?

Objectif : évaluer son importance, dans l’hypothèse H0

Objectif : le comparer aux χ² donnés par le formulaire

Test d’indépendance à r lignes et k colonnes :

ddl = (r – 1)(k – 1)

4. Selon le seuil de risque α choisi, une

décision est prise (rejet ou non-rejet de H0).

Méthodologie

2. Test d’indépendance du Khi-deux

Page 8: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

5,3

χ²calc

TC – Mathématiques – S2

1. Hypothèse nulle « H0 » : sexe et rapport au tabac sont indépendants.

densité de probabilité

0

??

2. χ²calc =

3. nombre de ddl : (3-1)(2-1) = 2

valeurs du formulaire

9,2

1

1%

7,8

2

2%

5,9

9 5%

4,6

1

10%

4. Au seuil de 10% , on peut rejeter H0.

seuil de risque : α = 10%

χ²lim = 4,61

5,3

Sh Sf

Tj 12 23Tf 31 26Ta 8 17

35

57

25

11751 66

Sh Sf

Tj 35

Tf 57

Ta 25

51 66 117

distribution observée distribution théorique sous H0

15,26

10,9032,1514,10

24,8519,74

Sh Sf

Tj

Tf

Ta

valeurs des χ²

0,695071,524170,77038

0,537101,177770,59529

5,300

4,6

1

10%

Exercice 1

2. Test d’indépendance du Khi-deux

Page 9: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.1 Moyennes mobiles

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 6

x : 1 à 16

Page 10: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3. Ajustement, Mayer

3.2 Problématique de l’ajustement linéaire

Une infinité de formes possibles pour un nuage de points.

Parfois, une droite le représente correctement. « ajustement linéaire »

Dans d’autres cas, c’est une courbe. « ajustement non linéaire »

TC – Mathématiques – S2

Page 11: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.2 Problématique de l’ajustement linéaire

Une fois une droite tracée :

Dans le nuage de points :

Par définition du point Mi,

xi et yi sont associés.

xi

yi

y’i

A xi est associé y’i = axi + b

Définition : on appelle résidu le nombre ei = yi – y’i

ei

ei > 0 : Mi au-dessus de la droite ei < 0 : Mi en-dessous de la droite

(D) : droite de régression (ou d’ajustement) ; déterminer (D) : faire un ajustement linéaire.

TC – Mathématiques – S2

3. Ajustement, Mayer

Page 12: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

1. Partager équitablement le nuage (de gauche à

droite)

2. Déterminer G1 et G2, points moyens des demi-

nuages

3. (D) = (G1G2)

3.3 Méthode de Mayer

Principe de Mayer :1

0n

i

i=

=∑e

Equivalent à : G ∈ (D)

Méthode de Mayer (trouver une droite cohérente) :

G1

G2

GG

A noter :

Dans tous les

cas, G ∈ (G1G2).

Ainsi, (D) est une

droite de Mayer.

(D)

TC – Mathématiques – S2

3. Ajustement, Mayer

Page 13: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.3 Méthode de Mayer

1

1

80 100 120100

3

37 43 4642

3

x

y

+ += =

+ += =

G

G

engrais récolte

(kg.ha-1) (q.ha-1)

1 150 46

2 80 37

3 120 46

4 220 51

5 100 43

80

100

120

x : engrais

(kg/ha)

y : récolte

(q/ha)

40

80 150

60

50

30220120

×

×

×

×

××

G1

×

G2

DM

2

2

150 220185

2

46 5148,5

2

x

y

+= =

+= =

G

G

;1 1

48,5 420,07647 34,35

185 100y x

−= ≈ = − ≈− G G

a b a

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 7

Page 14: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

3.3 Méthode de Mayer

Droite de Mayer

...

...

1

1

1 2 84,5

8

28 45 4040

8

x

y

+ + += =

+ + += =

G

G

...

...

2

2

9 10 1612,5

8

28 46 3941,125

8

x

y

+ + += =

+ + += =

G

G

TC – Mathématiques – S2

3. Ajustement, Mayer

Exercice 8

×

G1

×

G2

N N+1 N+2 N+3

tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4

(M€) 28 45 49 36 30 44 48 40 28 46 52 37 31 42 54 39

Page 15: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.1 Paramètres des séries à deux variables

TC – Mathématiques – S2

Moyennesn

i

i

x

xn

==∑

1

n

i

i

y

yn

==∑

1

Variances

( )

r

i

i

x

X xn

== −∑

2

21V

( )2

1 2V

k

j

j

y

Y yn

== −∑

Covariance

( ), 1

n

i i

i

x y

Cov X Y x yn

== −∑

Ecarts types

( ) ( )VX Xσ =

( ) ( )VY Yσ =

Sur calculatrice

X : List 1

Y : List 2

(nij : List 3)

Saisir CALC >

SET

CALC >

2Var

CALC >

Stat2Var L1,L2(,L3)

Résultats

, , , ,

, , , ,

2

2

X

Y

x x x

y y y n

xy

σ

σ∑ ∑

∑ ∑

4. Ajustement, moindres carrés

Page 16: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.1 Paramètres des séries à deux variables

Cov(X,Y) = 203,6

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Exercice 9

engrais récolte

(kg.ha-1) (q.ha-1)

1 150 46

2 80 37

3 120 46

4 220 51

5 100 43

YX [15 ; 25[ [25 ; 50[ 50 et plus

aucune 4 6 13

1 à 11 10 16 15

12 à 23 13 8 4

≥ 24 6 3 2

E(X) = 134

Σx = 670

Σx² = 101700

σX = 48,826

V(X) = 2384

E(Y) = 44,6

Σy = 223

Σy² = 10051

σY = 4,5869

V(Y) = 21,04

Σxy = 30900

E(X) = 39,375

Σx = 3937,5

Σx² = 182006,25

σX = 16,422

V(X) = 269,67

E(Y) = 10,795

Σy = 1079,5

Σy² = 23388,25

σY = 10,833

V(Y) = 117,35

Cov(X,Y) = -56,15

Σxy = 36890

Page 17: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

A. La droite de régression est unique

B. Dans tous les cas, G ∈ (D)

C.

4.2 Méthode des moindres carrés

Principe :

n

i

i=∑

2

1

e Equivalent à : formules de a et b

Résultats :

G

est minimale

( )( )

,Cov X Y

X=

Va y x= −b a

(D)

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 18: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.2 Méthode des moindres carrés

V(X) =

1 2 3 4 5 6 7 8 9 10 11 12année (1 : 2006)

dépense

(k€)

120

100

80

60

40 +

++

+

+

+

++

+

++

+

CALC >

REG > X

CALC >

LinReg L1,L2

11,91667 V(Y) = 701,3889

Cov(X,Y) = 84,1667

( )( )

,Cov X Y

X= ≈ 7,0629

Va ≈ 37,42b

(D) : y = 7,0629x + 37,42

(D)

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Exercice 10

Page 19: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.3 Coefficient de corrélation linéaire

0.75 < r < 1

( )( ) ( )

,X Y

X Yρ

σ σ= = =

Covr R

0 < r < 0.5 -0.75 < r < -0.5 -0.5 < r < 0

-1 < r < -0.75 -0.5 < r < 0.5 0.5 < r < 0.75 0 < r < 0.5

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 20: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

4.3 Coefficient de corrélation linéaire

TC – Mathématiques – S2

4. Ajustement, moindres carrés

Page 21: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

5. Ajustement non linéaire

1. remplacement

de X ou Y par une

autre variable

(T ou U)

Etude ⇒ X, Y

2. corrélation linéaire

après remplacement

3. modèle final de la

relation entre X et Y

Méthodologie

3.

(DY/T) : y = 1.02526 t + 3.856

y = 1.02526 x² + 3.856

X 2 3 5 8Y 9 13 28 70

1. On propose le changement de variable T = X².

Exemple

T 4 9 25 64Y 9 13 28 70

2. Ici, il s’agit de déterminer une équation de droite de type y = at + b.

Ex avec la méthode des moindres carrés, calculatrice en mode Stat :

Page 22: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

5. Ajustement non linéaire

1. remplacement

de X ou Y par une

autre variable

(T ou U)

Etude ⇒ X, Y

2. corrélation linéaire

après remplacement

3. modèle final de la

relation entre X et Y

Méthodologie

X 10 20 30 40 50 60 70 80 90

T

Y 15.2 11.6 9.3 7.8 7 6.6 6.9 8 9.6

2500 1600 900 400 100 0 100 400 9001.

2.

3.

(DY/T) : y = 0.00336 t + 6.535

y = 0.00336 (x – 60)² + 6.535

Exercice 15

Page 23: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères

⇓Pour chaque individu :

un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles

valeurs inconnues

Etude

⇓Série de données :

2 variables 12

?

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 24: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

1. Trouver l’équation d’une droite (ou courbe) de régres-sion : y’ = ax + b (ou y’ = f(x))

Etude ⇒ X, Y

2. Lire la nouvelle donnéex0 (ou y0)

3. Avec l’équation, calculer sa valeur associée

y’0 (ou x’0)

Méthodologie

1.

2.

3.

6.1 Estimation ponctuelle

Exercice 10

y’ = 7.0629x + 37.42

x0 = 14

y’0 = 136.3 k€

1.

2.

3.

Exercice 7

y’ = 0.07647x + 34.35

y’0 = 60 q/ha

x’0 = 335.4 kg/ha

1.

2.

3.

Exercice 15

y’ = 0.00336 (x – 60)² + 6.535

x0 = 100 km/h

y’0 = 11.91 L/100km

Exercice 19

Page 25: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

1. Introduction

3 5 10

Y : recette (k€)

150

120

100

80

1.1 Objectifs

2 caractères⇓

Pour chaque individu :un couple (x, y)

de valeurs

� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles valeurs inconnues

Etude

⇓Série de données :

2 variables 12

y’0

« corrélation »

« prévision »

« ajustement »,

« régression »

X : dépense (k€)

Page 26: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

Droite

R > 0

y’0

2d

eam

plif

.

Amplification : il faut calculer un écart type RELATIF

À l’aide des rapports z = y / y’

2de amplification : l’intervalle bleu donne une estimation à un degré de confiance trop moyen (68,3%). On doit l’amplifier par un facteur u relié à un niveau de confiance plus élevé (ex : 95%)

Page 27: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

6. Estimation

1. a. Calculer les valeurs y’iassociées aux xi du tableau

b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z

c. Obtenir la moyenne et l’écart type de Z

Méthodologie 1. a.

6.2 Intervalle de confiance

Exercice 10

4. Intervalle : par la formule

3. Avec le niveau de confiance, donner le coefficient u

2. Calculer l’estimation

ponctuelle y’0

b.

1. c. z = 1.000971

σZ = 0.125286

2. y’0 = 136.3 k€

3. niveau de confiance : 95% u = 1.96

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

4.

[136.3(1.000971 – 1.96×0.125286) ;

136.3(1.000971 + 1.96 × 0.125286)]

= [102,8 ; 169,8]

TC – Mathématiques – S2

Exercice 20

Page 28: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

6. Estimation

1. a.

6.2 Intervalle de confiance

Exercice 7

b.1. c. z = 0,9991106

σZ = 0,0472554

2. y’0 = 0,07647x + 34,35= 57,29

3. niveau de confiance : 99% u = 2.58

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

4.

[57,29(0,9991 – 2,58×0,047255) ;

57,29(0,9991 + 2,58×0,047255)]

= [50,25 ; 64,22]

TC – Mathématiques – S2

1. a. Calculer les valeurs y’iassociées aux xi du tableau

b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z

c. Obtenir la moyenne et l’écart type de Z

Méthodologie

4. Intervalle : par la formule

3. Avec le niveau de confiance, donner le coefficient u

2. Calculer l’estimation

ponctuelle y’0

Exercice 21

Page 29: S2 - Stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle final de la relation entre Xet Y Méthodologie 3. (D Y/T) : y= 1.02526 t+ 3.856

TC – Mathématiques – S2

6. Estimation

204050602040506020405060

0.30.30.30.30.60.60.60.60.90.90.90.9

xiyj nij

15

10208

1225185530146

y’ = -0.008430x + 1.0424List5List1 List2 List3 List4

y’i zi z = y/y’

z = 0.9989 σZ = 0.2962

y’0 = -0.008430x + 1.0424 = 0.368

niveau de confiance : 99% u = 2.58

( ) ( );z z

y z u y z uα ασ σ′ ′− + 0 0

= [0.0864 ; 0.6488]

x0 = 80

[0.368(0.9989 – 2.58×0.2962) ;

0.368(0.9989 + 2.58×0.2962)]

Exercice 226.2 Intervalle de confiance

0,8738

0,7052

0,6209

0,5366

0,8738

0,7052

0,6209

0,5366

0,8738

0,7052

0,6209

0,5366

0,3433

0,4254

0,4832

0,5591

0,6867

0,8508

0,9664

1,1182

1,03

1,2763

1,4495

1,6772


Top Related