box jenkins

109
La Méthodologie de Box-Jenkins Michel Tenenhaus

Upload: marina-mouni

Post on 24-Oct-2015

69 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Box Jenkins

La Méthodologie de Box-Jenkins

Michel Tenenhaus

Page 2: Box Jenkins

2

1. Les données

• Une série chronologique assez longue

(n 50).

• Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982.

• Objectif : Prévoir les ventes d’août à décembre 1982.

1( ,..., ,..., )t nz z z

Page 3: Box Jenkins

3

date ventes date ventes date ventes

JAN 1978 3 741 JAN 1980 4 687 JAN 1982 4 764 FEB 1978 3 608 FEB 1980 4 704 FEB 1982 4 726 MAR 1978 3 735 MAR 1980 4 579 MAR 1982 5 080 APR 1978 3 695 APR 1980 4 800 APR 1982 4 952 MAY 1978 3 810 MAY 1980 4 485 MAY 1982 4 633 JUN 1978 3 819 JUN 1980 4 617 JUN 1982 4 830 JUL 1978 3 291 JUL 1980 4 491 JUL 1982 4 460 AUG 1978 3 053 AUG 1980 3 832 SEP 1978 3 908 SEP 1980 4 669 OCT 1978 4 035 OCT 1980 5 193 NOV 1978 3 933 NOV 1980 4 544 DEC 1978 4 004 DEC 1980 4 676 JAN 1979 3 961 JAN 1981 4 709 FEB 1979 4 025 FEB 1981 4 705 MAR 1979 4 336 MAR 1981 4 677 APR 1979 4 335 APR 1981 4 627 MAY 1979 4 412 MAY 1981 4 555 JUN 1979 4 268 JUN 1981 4 570 JUL 1979 3 968 JUL 1981 4 457 AUG 1979 3 505 AUG 1981 3 589 SEP 1979 4 434 SEP 1981 4 636 OCT 1979 4 854 OCT 1981 5 077 NOV 1979 4 592 NOV 1981 4 623 DEC 1979 4 264 DEC 1981 4 591

Marché totaldes anti-inflammatoires

Page 4: Box Jenkins

4

Marché total des anti-inflammatoires

Page 5: Box Jenkins

5

2. Stabiliser la série

Il faut TRANSFORMER la série observée de manière à

- enlever la tendance,

- enlever la saisonnalité,

- stabiliser la variance.

Page 6: Box Jenkins

6

Pour enlever la tendance

Faire des différences régulières d’ordre d :

1 (1 )t t tz z B z 1où t tBz z

d = 22

1(1 ) (1 ) (1 )t t tB z B z B z

d = 1

Différence régulière d’ordre d :

(1 )dt tw B z Dans la pratique

d = 0,1, rarement 2

Page 7: Box Jenkins

7

Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1

Page 8: Box Jenkins

8

Dans la pratique D = 0,1,très très rarement 2

Pour enlever la saisonnalité

Faire des différences saisonnières d’ordre D :

(1 )st t s tz z B z

D = 22(1 ) (1 ) (1 )s s s

t t s tB z B z B z

D = 1

Différence saisonnière d’ordre D :

(1 )s Dt tw B z

Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre)

Page 9: Box Jenkins

9

Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1

Page 10: Box Jenkins

10

Pour enlever tendance et saisonnalité

Formule générale :

(1 ) (1 )d s Dt tw B B z

On peut choisir d et D minimisant l’écart-type de wt.

Application Marché total : s = 12, d = 1, D = 1

1212 1 13(1 )(1 ) ( ) ( )t t t t t tw B B z z z z z

Page 11: Box Jenkins

11

Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)

Page 12: Box Jenkins

12

Calcul des séries différenciéesDonnées (20 premiers mois)

JAN 1978 3741 . . .

FEB 1978 3608 -133 . .

MAR 1978 3735 127 . .

APR 1978 3695 -40 . .

MAY 1978 3810 115 . .

JUN 1978 3819 9 . .

JUL 1978 3291 -528 . .

AUG 1978 3053 -238 . .

SEP 1978 3908 855 . .

OCT 1978 4035 127 . .

NOV 1978 3933 -102 . .

DEC 1978 4004 71 . .

JAN 1979 3961 -43 220 .

FEB 1979 4025 64 417 197

MAR 1979 4336 311 601 184

APR 1979 4335 -1 640 39

MAY 1979 4412 77 602 -38

JUN 1979 4268 -144 449 -153

JUL 1979 3968 -300 677 228

AUG 1979 3505 -463 452 -225

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

DATE ventes DIFF(ventes,1) SDIFF(ventes,1,12) DIFF(ventes_2,1)

Page 13: Box Jenkins

13

Calcul des écarts-typesDescriptive Statistics

55 3053 4347.71 478.613

54 -868 13.31 382.030

43 -243 263.47 279.368

42 -436 -5.17 242.719

ventes

DIFF(ventes,1)

SDIFF(ventes,1,12)

DIFF(SDIFF(ventes,1,12),1)

N Minimum Mean Std. Deviation

s = 12, d = 1, D = 1

Page 14: Box Jenkins

14

Développement de zt

12 1 13( ) ( )t t t t tw z z z z De

On déduit

12 1 13 ( ) t t t t tz z z z w

valeur1 an avant

évaluationde la tendance

1 an avant

termealéatoire

On va modéliser la série « stationnaire » wt.

Page 15: Box Jenkins

15

Pour stabiliser la variance

On utilise souvent les transformations ( ) ou t tLog z z

Page 16: Box Jenkins

16

3. Le modèle statistique

On suppose que la série stabilisée (w1,…,wN)provient d’un processus stationnaire (wt) :

2

( )

( )

( , )

t

t w

k t t k

E w

Var w

Cor w w

Indépendantde la période t

Dans des conditions assez générales tout processusstationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).

Page 17: Box Jenkins

17

AR(p) : Auto-régressif d’ordre p

2

( ) 0

( )

( , ) 0 pour tout 1,2,...

t

t

t t k

E a

Var a

Cor a a k

1 1 ...t t p t p tw w w a

où at est un bruit blanc :

Remarque : 1(1 ... )p

Page 18: Box Jenkins

18

MA(q) : Moyenne Mobile d’ordre q

1 1 ...t t t q t qw a a a

Remarque :

Page 19: Box Jenkins

19

ARMA(p,q)

1 1 1 1... ...t t p t p t t q t qw w w a a a

Remarque : 1(1 ... )p

Page 20: Box Jenkins

20

Question

Comment choisir le modèlecorrespondant le mieux aux donnéesétudiées ?

Réponse

On utilise les autocorrélations k et les autocorrélations partielles kk.

Page 21: Box Jenkins

21

4. Autocorrélation

1

2

1

( , )

( )( ) = estimation de

( )

k t t k

N

t t kt k

k kN

tt

Cor w w

w w w wr

w w

Page 22: Box Jenkins

22

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélationscalculées

Autocorrelations

Series: ventes

-.515 .154 11.937 1 .001

.016 .191 11.948 2 .003

.189 .191 13.635 3 .003

-.200 .195 15.581 4 .004

.062 .200 15.770 5 .008

.174 .201 17.326 6 .008

-.243 .204 20.449 7 .005

.076 .211 20.759 8 .008

.081 .212 21.127 9 .012

-.210 .212 23.686 10 .008

.344 .217 30.755 11 .001

-.312 .230 36.747 12 .000

.114 .240 37.574 13 .000

-.139 .241 38.842 14 .000

.140 .243 40.184 15 .000

-.072 .245 40.549 16 .001

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Autocorrelation Std. Error

aValue df Sig.

bBox-Ljung Statistic

The underlying process assumed is MA with the order equal tothe lag number minus one. The Bartlett approximation is used.

a.

Based on the asymptotic chi-square approximation.b.

Page 23: Box Jenkins

23

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Corrélogrammeobservé

Formulede Bartlett

Page 24: Box Jenkins

24

Variance des autocorrélations rk

Formule de Bartlett

(Hypothèse : h = 0 pour h k)

2 2 21 1

1( ) (1 2 ... 2 ) estimation de ( )k k ks r r r Var r

N

Formule de Box-Jenkins pour un bruit blanc

(Hypothèse : h = 0 pour h 1)

2 1( ) estimation de ( )

2k k

N ks r Var r

N N

Page 25: Box Jenkins

25

Test : H0 : k = 0

On rejette H0 : k = 0 au risque = 0.05 si

2 ( )k kr s r

Application Marché total :

1 = 0, k = 0 pour k > 1

Corrélogrammethéorique

0

k

1 k

Page 26: Box Jenkins

26

5. Autocorrélation partielle

Régression de wt sur wt-1,…,wt-k :

0 1 1 ...t k k t kk t k tw w w

Autocorrélation partielle d’ordre k : kk

C’est une corrélation partielle :

1 1( , | ,..., )kk t t k t t kCor w w w w

Page 27: Box Jenkins

27

Calcul pratique de estimation de kk

1 2 1

1 3 2

1 2 1

1 2 1

1 3 2

1 2 1

1

1

1

1

1

k

k

k k kkk

k k

k k

k k

Soit :

111 11

1

21 2 2 1

22 21 1

1

1

1 1

1

Etc…

On obtient les estimations des kk en remplaçant les k par rk. ˆkk

ˆkk

Page 28: Box Jenkins

28

Partial Autocorrelations

Series: ventes

-.515 .154

-.339 .154

.039 .154

-.073 .154

-.073 .154

.186 .154

-.012 .154

-.097 .154

.001 .154

-.139 .154

.238 .154

-.116 .154

.029 .154

-.343 .154

.022 .154

-.053 .154

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

PartialAutocorrelation Std. Error

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélations partielles calculées

Rejet deH0 : kk = 0si:

ˆ 2 /kk N

Page 29: Box Jenkins

29

Corrélogramme partiel observé

Corrélogrammepartiel théorique

0

kk

1 k

142

Page 30: Box Jenkins

30

6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q)

Corrélogramme Corrélogramme partiel

(a)

(a)

(b)

(b)

10.5t t tw w a (a) :

10.5t t tw w a (b) :

AR(1)

Page 31: Box Jenkins

31

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

AR(2)

1 2.8 .15t t t tw w w a (a) :

(b) :

1 2.5t t t tw w w a

Le dernier pic significatif du corrélogramme partiel donnel’ordre p du modèle AR(p).

Page 32: Box Jenkins

32

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

MA(1)

1.7t t tw a a (a) :

(b) :

1.7t t tw a a

Page 33: Box Jenkins

33

MA(q)

1 2.5 .3t t t tw a a a (a) : q = 2

(b) : q = 5

5.7t t tw a a

Corrélogramme de différents processus MA(q)

(a)

(b)

(c)

(c) : q = 6

1 6.3 .6t t t tw a a a

Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).

Page 34: Box Jenkins

34

7. Étude de la série Marché Total

• Les autocorrélations suggèrent un modèle MA(1).

• Les autocorrélations partielles suggèrent un modèle AR(14).

Page 35: Box Jenkins

35

7.1 Étude de la voie moyenne mobile

On suppose que wt suit un modèle MA(1) :

1

2( )

t t t

t

w a a

Var a

et on a = E(wt) = .

On choisit les paramètres , et 2 à l’aidede la méthode du maximum de vraisemblance.

Page 36: Box Jenkins

36

Maximum de vraisemblance

• On suppose que le vecteur aléatoire w = (w1,…,wN) suit une loi multinormale. • Densité de probabilité de w :

21

2 1 '

/ 2 2

( ,..., | , , )

1 1 exp ( ) ( , ) ( )

2(2 ) ( , )

N

N

p w w

w - μ Σ w - μ

Σ

• On recherche maximisant la vraisemblance

2ˆˆ ˆ, et

21

ˆˆ ˆ( ,..., | , , )Np w w

Page 37: Box Jenkins

37

Qualité de l’ajustement dans ARIMA

2 ( ) 2

2 ( ) ( )

AIC Log r

SBC Log rLog N

On recherche le modèle minimisant SBC.

où r est le nombre de paramètres (hors 2).

Page 38: Box Jenkins

38

Modèle MA(1) avec constante

1t t tw a a

Residual Diagnostics

42

1

40

1585179

1591466

39100.764

197.739

-280.918

565.835

569.311

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.657 -7.772

.123 10.990

5.326 -.707

.000 .484

Estimates

Std Error

t

Approx Sig

MA1

Non-Seasonal

Lags

Constant

Melard's algorithm was used for estimation.

Page 39: Box Jenkins

39

Modèle MA(1) sans constante

1t t tw a a

Residual Diagnostics

42

1

41

1603132

1620350

38625.634

196.534

-281.143

564.285

566.023

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.634

.125

5.066

.000

Estimates

Std Error

t

Approx Sig

MA1

Non-Seasonal Lags

Melard's algorithm was used for estimation.

Page 40: Box Jenkins

40

Modélisation de zt

12 1 13 1( ) ( )t t t t t t tw z z z z a a De

On déduit

12 1 13 1 ( ) t t t t t tz z z z a a

marché1 an avant

évaluationde la tendance

1 an avant

chocaléatoire

en t

chocaléatoire

en t-1

Page 41: Box Jenkins

41

Calcul des prévisions et des erreurs

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de zt réalisée en t-1 :

12 1 13 1ˆt t t t tz z z z a

Erreur de prévision à l’horizon 1 :

ˆt t ta z z

Calcul pratique des prévisions et des erreurs sur l’historique:

12 1 13 1ˆ ˆˆ ˆ ˆˆ ˆ et t t t t t t t tz z z z a a z z

Page 42: Box Jenkins

42

Résultats

Page 43: Box Jenkins

43

Résultats (suite)

Page 44: Box Jenkins

44

Résultats (fin)

Vérifier les calculs pour 55 55ˆ ˆˆ et z a

Page 45: Box Jenkins

45

Graphique des ventes observées et prédites

Page 46: Box Jenkins

46

Graphique des résidus

ˆLimite à 2

Page 47: Box Jenkins

47

Qualité de l’ajustement dans Time Series Modeler

2ˆ ( )Normalized BIC 2 ( )ta Log N

Log rN r N

2 2

2 2

ˆ ˆˆ ˆStationary R-Squared 1 1

t t t tt t

t tt t

w w z z

w w w w

Page 48: Box Jenkins

48

Validation du modèle Étude des ˆ( )k tr a

Autocorrelations

Series: Error for ventes from ARIMA, MOD_2, NOCON

-.087 .149 .342 1 .558

.072 .147 .581 2 .748

.188 .145 2.253 3 .522

-.079 .143 2.556 4 .635

.128 .141 3.379 5 .642

.164 .140 4.768 6 .574

-.168 .138 6.265 7 .509

.031 .136 6.316 8 .612

.063 .134 6.535 9 .685

-.115 .132 7.304 10 .696

.208 .130 9.894 11 .540

-.281 .127 14.747 12 .256

-.076 .125 15.119 13 .300

-.157 .123 16.750 14 .270

.062 .121 17.017 15 .318

-.054 .119 17.222 16 .371

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Autocorrelation Std. Error

aValue df Sig.

bBox-Ljung Statistic

The underlying process assumed is independence (whitenoise).

a.

Based on the asymptotic chi-square approximation.b.

Page 49: Box Jenkins

49

Validation du modèleCorrélogramme des ˆ( )k tr a

Formule deBox-Jenkins

Corrélogrammethéorique des erreurs bt

0

k(bt)

12 k

Page 50: Box Jenkins

50

Validation du modèle : Utilisation de la statistique de Ljung-Box

La statistique de Ljung-Box

22

1

ˆ( )( 2)

mk t

mk

r aN N

N k

suit une loi du khi-deux à m-r ddl lorsque les résidusforment un bruit blanc.On accepte le modèle étudié si les niveaux de signification

2 2Prob( ( ) )mm r

sont > .05 pour différentes valeurs de m.

Page 51: Box Jenkins

51

Utilisation du modèle estimé en prévision

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de z55+h réalisée en t = 55 :

56 44 55 43 55ˆ ˆz z z z a h = 1

57 45 56 44ˆ ˆz z z z h = 2

Et ainsi de suite…

Page 52: Box Jenkins

52

Application

AUG 1982 3716.13 3319.22 4113.04 196.53

SEP 1982 4763.13 4340.43 5185.82 209.30

OCT 1982 5204.13 4757.13 5651.12 221.34

NOV 1982 4750.13 4280.09 5220.17 232.75

DEC 1982 4718.13 4226.12 5210.14 243.62

1

2

3

4

5

DATE. Fit for ventes 95% LCL 95% UCL SE of Fit

Page 53: Box Jenkins

53

Intervalle de prévision à 95% de z55+h

Chaque modèle a sa propre formule de constructionde l’intervalle de prévision.

255 .975

ˆˆˆ ( ) 1 ( 1)(1 )hz t N r h

Modèle MA(1) :

Page 54: Box Jenkins

54

Page 55: Box Jenkins

55

Amélioration du modèle MA(1)

• On suppose maintenant le modèle

• est significatif.12 ˆ( ) .281tr a

1

12 , où bruit blanct t t

t t t t

w b b

b a a a

• De 12(1 ) et (1 )t t t tw B b b B a

on déduit :12(1 )(1 )t tw B B a

Page 56: Box Jenkins

56

Demande SPSS

Page 57: Box Jenkins

57

Résultats

Parameter Estimates

.715 .765 -11.468

.107 .399 5.219

6.693 1.918 -2.197

.000 .062 .034

Estimates

Std Error

t

Approx Sig

MA1

Non-SeasonalLags

Seasonal MA1

SeasonalLags

Constant

Melard's algorithm was used for estimation.

Residual Diagnostics

42

2

39

1268226.611

1336414.106

25544.245

159.826

-276.531

559.062

564.275

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum of Squares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

12(1 )(1 )t tw B B a

Page 58: Box Jenkins

58

7.2 Étude de la voie autorégressive

On suppose que wt suit un modèle AR(14) :

1 1 14 14

2

...

( )

t t t t

t

w w w a

Var a

et on a = (1 - 1 -…- 14).

On choisit les paramètres , 1,…,14 et 2 à l’aidede la méthode du maximum de vraisemblance.

est appeléConstant dansSPSS

Page 59: Box Jenkins

59

Résultats

1 1 14 14...t t t tw w w a

Residual Diagnostics

42

14

27

949178.0

1041062

28699.741

169.410

-270.689

571.379

597.444

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.680 .156 -4.367 .000

-.441 .169 -2.614 .014

.059 .188 .311 .758

.034 .184 .185 .855

.107 .191 .560 .580

.138 .214 .644 .525

-.051 .254 -.200 .843

-.016 .240 -.067 .947

-.006 .232 -.026 .980

-.054 .237 -.228 .821

.185 .234 .791 .436

-.307 .227 -1.355 .187

-.428 .208 -2.059 .049

-.572 .156 -3.668 .001

-10.788 9.983 -1.081 .289

AR1

AR2

AR3

AR4

AR5

AR6

AR7

AR8

AR9

AR10

AR11

AR12

AR13

AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 60: Box Jenkins

60

Modèle AR : p = (1,2,12,13,14) avec cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

Page 61: Box Jenkins

61

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Parameter Estimates

-.775 .127 -6.083 .000

-.490 .122 -4.006 .000

-.512 .138 -3.711 .001

-.594 .159 -3.733 .001

-.526 .145 -3.619 .001

-12.797 7.487 -1.709 .096

AR1

AR2

AR12

AR13

AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Residual Diagnostics

42

5

36

1093774.600

1192109.813

25711.840

160.349

-273.114

558.228

568.654

Number of Residuals

Number ofParameters

Residual df

Adjusted Residual Sum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Page 62: Box Jenkins

62

Modèle AR : p = (1,2,12,13,14) sans cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

Page 63: Box Jenkins

63

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Residual Diagnostics

42

5

37

1172013

1233379

27877.941

166.967

-274.563

559.127

567.815

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.747 .134 -5.591 .000

-.460 .129 -3.568 .001

-.454 .148 -3.066 .004

-.508 .171 -2.975 .005

-.467 .154 -3.041 .004

AR1

AR2

AR12

AR13

AR14

Non-SeasonalLags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 64: Box Jenkins

64

Modèle AR : p = 2, P = 1 avec cste

2 121 2(1 )(1 ) t tB B B w a

Demande SPSS

Page 65: Box Jenkins

65

Résultats

2 121 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

38

1196121

1286077

27725.190

166.509

-274.998

557.997

564.948

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.759 .139 -5.445 .000

-.523 .132 -3.970 .000

-.557 .146 -3.812 .000

-12.289 8.308 -1.479 .147

AR1

AR2

Non-SeasonalLags

Seasonal AR1Seasonal Lags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 66: Box Jenkins

66

Modèle AR : p = 2, P = 1 sans cste

2 121 2(1 )(1 ) t tB B B w a

Demande SPSS

Page 67: Box Jenkins

67

Résultats

2 121 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

39

1256636

1315334

29246.908

171.017

-276.033

558.066

563.279

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.731 .143 -5.101 .000

-.481 .135 -3.562 .001

-.489 .154 -3.186 .003

AR1

AR2

Non-SeasonalLags

Seasonal AR1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 68: Box Jenkins

68

Résultats

2 121 2(1 )(1 ) t tB B B w a

Page 69: Box Jenkins

69

Résultats avec Time Series Modeler

2 121 2(1 )(1 ) t tB B B w a

Forecast

3818 4792 5192 4688 4742

4163 5150 5567 5123 5197

3472 4434 4817 4253 4288

Forecast

UCL

LCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

Page 70: Box Jenkins

70

Résultats avec Time Series Modeler2 12

1 2(1 )(1 ) t tB B B w a

Page 71: Box Jenkins

71

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle avec

constante

Page 72: Box Jenkins

72

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

42

3

38

1112464

1256550

19325.966

139.018

-274.630

557.261

564.211

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.765 .123 -6.228 .000

-.558 .114 -4.911 .000

.965 2.964 .326 .747

-11.009 6.504 -1.693 .099

AR1

AR2

Non-SeasonalLags

Seasonal MA1Seasonal Lags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Warnings

Our tests have determined that the estimated model lies close to the boundary of theinvertibility region. Although the moving average parameters are probably correctlyestimated, their standard errors and covariances should be considered suspect.

Page 73: Box Jenkins

73

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle sans

constante

Page 74: Box Jenkins

74

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

42

3

39

1190270

1287295

24282.930

155.830

-275.152

556.304

561.517

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.736 .134 -5.488 .000

-.506 .124 -4.074 .000

.745 .360 2.071 .045

AR1

AR2

Non-SeasonalLags

Seasonal MA1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 75: Box Jenkins

75

Résultats2 12

1 2(1 ) (1 )t tB B w B a

Page 76: Box Jenkins

76

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

Forecast

3861 4854 5206 4810 4798

4184 5187 5553 5215 5220

3539 4521 4858 4405 4375

Forecast

UCL

LCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

Page 77: Box Jenkins

77

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

Page 78: Box Jenkins

78

8. Le modèle multiplicatif usuelARIMA(p,d,q)*(P,D,Q)s

( ) (1 ) (1 ) ( )s d s D st w tB B B B z B B a

1

1

1

1

( ) 1 ...

( ) 1 ...

( ) 1 ...

( ) 1 ...

pp

s s sPP

qq

s s sQQ

B B B

B B B

B B B

B B B

où :

Tous ces polynômes doivent être inversibles.

wtbruitblanc

Page 79: Box Jenkins

79

9. Prévision

(1 ) (1 )d s Dt tB B B z B a

Le modèle général

peut s’écrire :

1 1 1 1... ...t t p t p t t q t qz z z a a a

Page 80: Box Jenkins

80

Prévision à l’horizon h

Modèle

1 1 1 1... ...t h t h p t h p t h t h q t h qz z z a a a

Prévision

1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ ˆ( ) ... ...t t h p t h p t h q t h qz h z z a a

avec : si 0

ˆˆ ( ) si 0

t h jt h j

t

z h jz

z h j h j

Page 81: Box Jenkins

81

10. Calcul de l’intervalle de prévision

( )(1 ) (1 ) ( )s d s D st tB B B B z B B a

De

on déduit (formellement) :

1 1

1 1 2 2

' ( )(1 ) (1 ) ( )

' ...

s d s D st t

t t t

z B B B B B B a

a a a

Page 82: Box Jenkins

82

Prévision de zt+h à l’instant t

• On a

1 1 2 2 1 1

1 1

' ...

...

t h t h t h t h h t

h t h t

z a a a a

a a

Futur

Passé

1 1ˆ ( ) ' ...t h t h tz h a a

• D’où la prévision de zt+h à l’instant t

Page 83: Box Jenkins

83

Erreur de prévision à l’horizon h

1 1 2 2 1 1

ˆ( ) ( )

...

t t h t

t h t h t h h t

e h z z h

a a a a

D’où :

2 2 21 1[ ( )] 1 ...t hVar e h

[ ( )] 0tE e h

Page 84: Box Jenkins

84

Intervalle de prévision à 95%de zt+h réalisé à l’instant t

2 2.975 1 1ˆˆ ( ) ( ) 1 ...t hz h t N r

Page 85: Box Jenkins

85

Exemple « Marché Total »

12(1 )(1 ) (1 )t tB B z B a Modèle :

On déduit :

1 12 1

2 12 24

2 11

1 2 11

(1 ) (1 ) (1 )

(1 ...)(1 ...)(1 )

(1 (1 ) (1 ) ... (1 ) ...)

t t

t

t

z B B B a

B B B B B a

B B B a

Remarque : (1 ) pour 11h h

Page 86: Box Jenkins

86

Marché Total : Intervalle de prévision à l’horizon h 12

2 2.975 1 1

2.975

ˆ ˆˆˆ ( ) ( ) 1 ...

ˆˆˆ ( ) ( ) 1 ( 1)(1 )

t h

t

z h t N r

z h t N r h

Page 87: Box Jenkins

87

11. Le modèle général de TS ModelerLe modèle à fonction de transfert

1

série dépendante

,..., séries prédicteurs

( )

, ou

t

t kt

t t

i

Y

X X

Z f Y

f f Log

, (1 ) (1 )

( ) ( )

( ) ( )

d s Di

si i i

si i i

B B

Num B B

Den B B

1

( ) ( ) ( ) ( ) ( )k

s sit i i it t

i i

NumB B Z f X B B a

Den

Nt = « Noise »

Page 88: Box Jenkins

88

Application à la série IPI

Année Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 46364656667686970...

82

68777681848995100

137

74797984857799104

136

6465677172788287

111

787983879099103110

140

Indice de la Production Industrielle de la France (1963 - 1982)

Page 89: Box Jenkins

89

Visualisation de la série IPI

Date

IPI

160

140

120

100

80

60

40

Cette sérieprésente unetendance etune saisonnalité

Page 90: Box Jenkins

90

Visualisation de la saisonnalité

Année

198519801975197019651960

IPI

160

140

120

100

80

60

Trimestre

4

3

2

1

Page 91: Box Jenkins

91

Date

160

140

120

100

80

60

40

IPI

MA(IPI,4,4)

Visualisation de la tendance

Moyenne mobile centréed’ordre 4 :

4

X5.0XXXX5.0

Z

2t1tt1t2t

t

Tendance Zt

Page 92: Box Jenkins

92

7773696561575349454137332925211713951

Trimestre

150

125

100

75

ipi

(a) Indice de la production industrielle (23.85)

(c) Différence régulière/saisonnière de IPI ( ˆ 4.76 )

Page 93: Box Jenkins

93

Modèle avec intervention

468.2( ) ( ) (1 )(1 )( ) ( ) ( )s s

t tB B B B z I B B a Effetmai 68

Nt = « Noise » = Série corrigée stationnarisée

Étapes

1. Construction de la série « Noise »2. Modélisation de la série « Noise »3. Estimation du modèle complet

Page 94: Box Jenkins

94

Etape 1 : Construction de la série « Noise »

468.2(1 )(1 )( )t tNoise B B z I a

Parameter Estimates

-15.250 1.626 -9.380 .000

-.160 .375 -.426 .671

i22Regression Coefficients

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 95: Box Jenkins

95

Étape 2 : Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Noise suit un AR(8)

Page 96: Box Jenkins

96

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

75

8

66

493.364

494.199

7.294

2.701

-177.255

372.509

393.367

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.095 .118 .803 .425

.016 .121 .135 .893

-.215 .119 -1.800 .076

-.520 .125 -4.175 .000

-.081 .121 -.668 .506

-.085 .119 -.714 .478

-.116 .124 -.934 .354

-.259 .127 -2.042 .045

.066 .150 .437 .663

AR1

AR2

AR3

AR4

AR5

AR6

AR7

AR8

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Noise ~ ARIMA(8,1,0)*(0,1,0)4

Page 97: Box Jenkins

97

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

75

2

73

549.094

550.078

7.344

2.710

-181.075

366.150

370.785

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.628 -.292

.115 .118

-5.476 -2.474

.000 .016

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

Melard's algorithm was used for estimation.

Noise ~ ARIMA(0,1,0)*(2,1,0)4

sans constante

Page 98: Box Jenkins

98

Étape 3 : estimation du modèle complet

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

75

2

71

547.971

551.748

7.533

2.745

-181.015

370.031

379.301

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.632 -.295 -15.089 -.097

.116 .118 1.679 .170

-5.440 -2.509 -8.987 -.569

.000 .014 .000 .571

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

i22

RegressionCoefficients

Constant

Melard's algorithm was used for estimation.

Page 99: Box Jenkins

99

Étape 3 : estimation du modèle completsans constante

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

75

2

72

550.462

554.558

7.464

2.732

-181.173

368.347

375.299

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.631 -.292 -15.095

.116 .117 1.671

-5.459 -2.498 -9.033

.000 .015 .000

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

i22

RegressionCoefficients

Melard's algorithm was used for estimation.

Page 100: Box Jenkins

100

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 1

Page 101: Box Jenkins

101

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 2

Page 102: Box Jenkins

102

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 3

Page 103: Box Jenkins

103

Utilisation de Time Series Modeler pour la prévision

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Forecast LCL UCL

Q1 1983 136.1 130.7 141.6 Q2 1983 133.4 125.7 141.1 Q3 1983 110.3 100.9 119.8 Q4 1983 138.1 127.2 149.0

Model Statistics

1 .678 18.846 16 .277 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)

Number ofOutliers

Page 104: Box Jenkins

104

Utilisation de Time Series Modeler pour la prévisionLa syntaxe SPSS

PREDICT THRU END.

* Time Series Modeler.

TSMODEL

/MODELSUMMARY PRINT=[ MODELFIT]

/MODELSTATISTICS DISPLAY=YES MODELFIT=[ SRSQUARE]

/MODELDETAILS PRINT=[ PARAMETERS FORECASTS]

/SERIESPLOT OBSERVED FORECAST FIT FORECASTCI

/OUTPUTFILTER DISPLAY=ALLMODELS

/SAVE NRESIDUAL(NResidual)

/AUXILIARY CILEVEL=95 MAXACFLAGS=24

/MISSING USERMISSING=EXCLUDE

/MODEL DEPENDENT=ipi INDEPENDENT=i22

PREFIX='Model'

/ARIMA AR=[0] DIFF=1 MA=[0] ARSEASONAL=[1,2]

DIFFSEASONAL=1

MASEASONAL=[0]

TRANSFORM=NONE CONSTANT=NO

/TRANSFERFUNCTION VARIABLES=i22

DIFF=1

DIFFSEASONAL=1

/AUTOOUTLIER DETECT=OFF.

Page 105: Box Jenkins

105

Utilisation de Expert Modeler

Page 106: Box Jenkins

106

Utilisation de Expert Modeler

Model Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type

Model Statistics

1 .660 27.437 17 .052 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)

Number ofOutliers

ARIMA Model Parameters

1

1

.507 .109 4.657 .000

-15.315 1.728 -8.863 .000

1

1

Difference

Seasonal Difference

Lag 1MA, Seasonal

No TransformationIPI

Lag 0Numerator

Difference

Seasonal Difference

No Transformationi22

IPI-Model_1Estimate SE t Sig.

4 468.2 1(1 )(1 )( ) (1 )t tB B z I B a

Réponse :

Page 107: Box Jenkins

107

Utilisation de Expert Modeler

Page 108: Box Jenkins

108

Utilisation de Expert Modeler

Forecast

136 134 111 139

141 142 121 150

130 126 101 128

Forecast

UCL

LCL

ModelIPI-Model_1

Q1 1983 Q2 1983 Q3 1983 Q4 1983

For each model, forecasts start after the last non-missing in the range of therequested estimation period, and end at the last period for whichnon-missing values of all the predictors are available or at the end date of therequested forecast period, whichever is earlier.

Page 109: Box Jenkins

109

Utilisation de Expert Modelerpour « All models »

Réponse :

Model Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type