box jenkins

Post on 24-Oct-2015

69 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

La Méthodologie de Box-Jenkins

Michel Tenenhaus

2

1. Les données

• Une série chronologique assez longue

(n 50).

• Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982.

• Objectif : Prévoir les ventes d’août à décembre 1982.

1( ,..., ,..., )t nz z z

3

date ventes date ventes date ventes

JAN 1978 3 741 JAN 1980 4 687 JAN 1982 4 764 FEB 1978 3 608 FEB 1980 4 704 FEB 1982 4 726 MAR 1978 3 735 MAR 1980 4 579 MAR 1982 5 080 APR 1978 3 695 APR 1980 4 800 APR 1982 4 952 MAY 1978 3 810 MAY 1980 4 485 MAY 1982 4 633 JUN 1978 3 819 JUN 1980 4 617 JUN 1982 4 830 JUL 1978 3 291 JUL 1980 4 491 JUL 1982 4 460 AUG 1978 3 053 AUG 1980 3 832 SEP 1978 3 908 SEP 1980 4 669 OCT 1978 4 035 OCT 1980 5 193 NOV 1978 3 933 NOV 1980 4 544 DEC 1978 4 004 DEC 1980 4 676 JAN 1979 3 961 JAN 1981 4 709 FEB 1979 4 025 FEB 1981 4 705 MAR 1979 4 336 MAR 1981 4 677 APR 1979 4 335 APR 1981 4 627 MAY 1979 4 412 MAY 1981 4 555 JUN 1979 4 268 JUN 1981 4 570 JUL 1979 3 968 JUL 1981 4 457 AUG 1979 3 505 AUG 1981 3 589 SEP 1979 4 434 SEP 1981 4 636 OCT 1979 4 854 OCT 1981 5 077 NOV 1979 4 592 NOV 1981 4 623 DEC 1979 4 264 DEC 1981 4 591

Marché totaldes anti-inflammatoires

4

Marché total des anti-inflammatoires

5

2. Stabiliser la série

Il faut TRANSFORMER la série observée de manière à

- enlever la tendance,

- enlever la saisonnalité,

- stabiliser la variance.

6

Pour enlever la tendance

Faire des différences régulières d’ordre d :

1 (1 )t t tz z B z 1où t tBz z

d = 22

1(1 ) (1 ) (1 )t t tB z B z B z

d = 1

Différence régulière d’ordre d :

(1 )dt tw B z Dans la pratique

d = 0,1, rarement 2

7

Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1

8

Dans la pratique D = 0,1,très très rarement 2

Pour enlever la saisonnalité

Faire des différences saisonnières d’ordre D :

(1 )st t s tz z B z

D = 22(1 ) (1 ) (1 )s s s

t t s tB z B z B z

D = 1

Différence saisonnière d’ordre D :

(1 )s Dt tw B z

Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre)

9

Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1

10

Pour enlever tendance et saisonnalité

Formule générale :

(1 ) (1 )d s Dt tw B B z

On peut choisir d et D minimisant l’écart-type de wt.

Application Marché total : s = 12, d = 1, D = 1

1212 1 13(1 )(1 ) ( ) ( )t t t t t tw B B z z z z z

11

Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)

12

Calcul des séries différenciéesDonnées (20 premiers mois)

JAN 1978 3741 . . .

FEB 1978 3608 -133 . .

MAR 1978 3735 127 . .

APR 1978 3695 -40 . .

MAY 1978 3810 115 . .

JUN 1978 3819 9 . .

JUL 1978 3291 -528 . .

AUG 1978 3053 -238 . .

SEP 1978 3908 855 . .

OCT 1978 4035 127 . .

NOV 1978 3933 -102 . .

DEC 1978 4004 71 . .

JAN 1979 3961 -43 220 .

FEB 1979 4025 64 417 197

MAR 1979 4336 311 601 184

APR 1979 4335 -1 640 39

MAY 1979 4412 77 602 -38

JUN 1979 4268 -144 449 -153

JUL 1979 3968 -300 677 228

AUG 1979 3505 -463 452 -225

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

DATE ventes DIFF(ventes,1) SDIFF(ventes,1,12) DIFF(ventes_2,1)

13

Calcul des écarts-typesDescriptive Statistics

55 3053 4347.71 478.613

54 -868 13.31 382.030

43 -243 263.47 279.368

42 -436 -5.17 242.719

ventes

DIFF(ventes,1)

SDIFF(ventes,1,12)

DIFF(SDIFF(ventes,1,12),1)

N Minimum Mean Std. Deviation

s = 12, d = 1, D = 1

14

Développement de zt

12 1 13( ) ( )t t t t tw z z z z De

On déduit

12 1 13 ( ) t t t t tz z z z w

valeur1 an avant

évaluationde la tendance

1 an avant

termealéatoire

On va modéliser la série « stationnaire » wt.

15

Pour stabiliser la variance

On utilise souvent les transformations ( ) ou t tLog z z

16

3. Le modèle statistique

On suppose que la série stabilisée (w1,…,wN)provient d’un processus stationnaire (wt) :

2

( )

( )

( , )

t

t w

k t t k

E w

Var w

Cor w w

Indépendantde la période t

Dans des conditions assez générales tout processusstationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).

17

AR(p) : Auto-régressif d’ordre p

2

( ) 0

( )

( , ) 0 pour tout 1,2,...

t

t

t t k

E a

Var a

Cor a a k

1 1 ...t t p t p tw w w a

où at est un bruit blanc :

Remarque : 1(1 ... )p

18

MA(q) : Moyenne Mobile d’ordre q

1 1 ...t t t q t qw a a a

Remarque :

19

ARMA(p,q)

1 1 1 1... ...t t p t p t t q t qw w w a a a

Remarque : 1(1 ... )p

20

Question

Comment choisir le modèlecorrespondant le mieux aux donnéesétudiées ?

Réponse

On utilise les autocorrélations k et les autocorrélations partielles kk.

21

4. Autocorrélation

1

2

1

( , )

( )( ) = estimation de

( )

k t t k

N

t t kt k

k kN

tt

Cor w w

w w w wr

w w

22

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélationscalculées

Autocorrelations

Series: ventes

-.515 .154 11.937 1 .001

.016 .191 11.948 2 .003

.189 .191 13.635 3 .003

-.200 .195 15.581 4 .004

.062 .200 15.770 5 .008

.174 .201 17.326 6 .008

-.243 .204 20.449 7 .005

.076 .211 20.759 8 .008

.081 .212 21.127 9 .012

-.210 .212 23.686 10 .008

.344 .217 30.755 11 .001

-.312 .230 36.747 12 .000

.114 .240 37.574 13 .000

-.139 .241 38.842 14 .000

.140 .243 40.184 15 .000

-.072 .245 40.549 16 .001

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Autocorrelation Std. Error

aValue df Sig.

bBox-Ljung Statistic

The underlying process assumed is MA with the order equal tothe lag number minus one. The Bartlett approximation is used.

a.

Based on the asymptotic chi-square approximation.b.

23

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Corrélogrammeobservé

Formulede Bartlett

24

Variance des autocorrélations rk

Formule de Bartlett

(Hypothèse : h = 0 pour h k)

2 2 21 1

1( ) (1 2 ... 2 ) estimation de ( )k k ks r r r Var r

N

Formule de Box-Jenkins pour un bruit blanc

(Hypothèse : h = 0 pour h 1)

2 1( ) estimation de ( )

2k k

N ks r Var r

N N

25

Test : H0 : k = 0

On rejette H0 : k = 0 au risque = 0.05 si

2 ( )k kr s r

Application Marché total :

1 = 0, k = 0 pour k > 1

Corrélogrammethéorique

0

k

1 k

26

5. Autocorrélation partielle

Régression de wt sur wt-1,…,wt-k :

0 1 1 ...t k k t kk t k tw w w

Autocorrélation partielle d’ordre k : kk

C’est une corrélation partielle :

1 1( , | ,..., )kk t t k t t kCor w w w w

27

Calcul pratique de estimation de kk

1 2 1

1 3 2

1 2 1

1 2 1

1 3 2

1 2 1

1

1

1

1

1

k

k

k k kkk

k k

k k

k k

Soit :

111 11

1

21 2 2 1

22 21 1

1

1

1 1

1

Etc…

On obtient les estimations des kk en remplaçant les k par rk. ˆkk

ˆkk

28

Partial Autocorrelations

Series: ventes

-.515 .154

-.339 .154

.039 .154

-.073 .154

-.073 .154

.186 .154

-.012 .154

-.097 .154

.001 .154

-.139 .154

.238 .154

-.116 .154

.029 .154

-.343 .154

.022 .154

-.053 .154

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

PartialAutocorrelation Std. Error

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélations partielles calculées

Rejet deH0 : kk = 0si:

ˆ 2 /kk N

29

Corrélogramme partiel observé

Corrélogrammepartiel théorique

0

kk

1 k

142

30

6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q)

Corrélogramme Corrélogramme partiel

(a)

(a)

(b)

(b)

10.5t t tw w a (a) :

10.5t t tw w a (b) :

AR(1)

31

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

AR(2)

1 2.8 .15t t t tw w w a (a) :

(b) :

1 2.5t t t tw w w a

Le dernier pic significatif du corrélogramme partiel donnel’ordre p du modèle AR(p).

32

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

MA(1)

1.7t t tw a a (a) :

(b) :

1.7t t tw a a

33

MA(q)

1 2.5 .3t t t tw a a a (a) : q = 2

(b) : q = 5

5.7t t tw a a

Corrélogramme de différents processus MA(q)

(a)

(b)

(c)

(c) : q = 6

1 6.3 .6t t t tw a a a

Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).

34

7. Étude de la série Marché Total

• Les autocorrélations suggèrent un modèle MA(1).

• Les autocorrélations partielles suggèrent un modèle AR(14).

35

7.1 Étude de la voie moyenne mobile

On suppose que wt suit un modèle MA(1) :

1

2( )

t t t

t

w a a

Var a

et on a = E(wt) = .

On choisit les paramètres , et 2 à l’aidede la méthode du maximum de vraisemblance.

36

Maximum de vraisemblance

• On suppose que le vecteur aléatoire w = (w1,…,wN) suit une loi multinormale. • Densité de probabilité de w :

21

2 1 '

/ 2 2

( ,..., | , , )

1 1 exp ( ) ( , ) ( )

2(2 ) ( , )

N

N

p w w

w - μ Σ w - μ

Σ

• On recherche maximisant la vraisemblance

2ˆˆ ˆ, et

21

ˆˆ ˆ( ,..., | , , )Np w w

37

Qualité de l’ajustement dans ARIMA

2 ( ) 2

2 ( ) ( )

AIC Log r

SBC Log rLog N

On recherche le modèle minimisant SBC.

où r est le nombre de paramètres (hors 2).

38

Modèle MA(1) avec constante

1t t tw a a

Residual Diagnostics

42

1

40

1585179

1591466

39100.764

197.739

-280.918

565.835

569.311

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.657 -7.772

.123 10.990

5.326 -.707

.000 .484

Estimates

Std Error

t

Approx Sig

MA1

Non-Seasonal

Lags

Constant

Melard's algorithm was used for estimation.

39

Modèle MA(1) sans constante

1t t tw a a

Residual Diagnostics

42

1

41

1603132

1620350

38625.634

196.534

-281.143

564.285

566.023

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.634

.125

5.066

.000

Estimates

Std Error

t

Approx Sig

MA1

Non-Seasonal Lags

Melard's algorithm was used for estimation.

40

Modélisation de zt

12 1 13 1( ) ( )t t t t t t tw z z z z a a De

On déduit

12 1 13 1 ( ) t t t t t tz z z z a a

marché1 an avant

évaluationde la tendance

1 an avant

chocaléatoire

en t

chocaléatoire

en t-1

41

Calcul des prévisions et des erreurs

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de zt réalisée en t-1 :

12 1 13 1ˆt t t t tz z z z a

Erreur de prévision à l’horizon 1 :

ˆt t ta z z

Calcul pratique des prévisions et des erreurs sur l’historique:

12 1 13 1ˆ ˆˆ ˆ ˆˆ ˆ et t t t t t t t tz z z z a a z z

42

Résultats

43

Résultats (suite)

44

Résultats (fin)

Vérifier les calculs pour 55 55ˆ ˆˆ et z a

45

Graphique des ventes observées et prédites

46

Graphique des résidus

ˆLimite à 2

47

Qualité de l’ajustement dans Time Series Modeler

2ˆ ( )Normalized BIC 2 ( )ta Log N

Log rN r N

2 2

2 2

ˆ ˆˆ ˆStationary R-Squared 1 1

t t t tt t

t tt t

w w z z

w w w w

48

Validation du modèle Étude des ˆ( )k tr a

Autocorrelations

Series: Error for ventes from ARIMA, MOD_2, NOCON

-.087 .149 .342 1 .558

.072 .147 .581 2 .748

.188 .145 2.253 3 .522

-.079 .143 2.556 4 .635

.128 .141 3.379 5 .642

.164 .140 4.768 6 .574

-.168 .138 6.265 7 .509

.031 .136 6.316 8 .612

.063 .134 6.535 9 .685

-.115 .132 7.304 10 .696

.208 .130 9.894 11 .540

-.281 .127 14.747 12 .256

-.076 .125 15.119 13 .300

-.157 .123 16.750 14 .270

.062 .121 17.017 15 .318

-.054 .119 17.222 16 .371

Lag1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Autocorrelation Std. Error

aValue df Sig.

bBox-Ljung Statistic

The underlying process assumed is independence (whitenoise).

a.

Based on the asymptotic chi-square approximation.b.

49

Validation du modèleCorrélogramme des ˆ( )k tr a

Formule deBox-Jenkins

Corrélogrammethéorique des erreurs bt

0

k(bt)

12 k

50

Validation du modèle : Utilisation de la statistique de Ljung-Box

La statistique de Ljung-Box

22

1

ˆ( )( 2)

mk t

mk

r aN N

N k

suit une loi du khi-deux à m-r ddl lorsque les résidusforment un bruit blanc.On accepte le modèle étudié si les niveaux de signification

2 2Prob( ( ) )mm r

sont > .05 pour différentes valeurs de m.

51

Utilisation du modèle estimé en prévision

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de z55+h réalisée en t = 55 :

56 44 55 43 55ˆ ˆz z z z a h = 1

57 45 56 44ˆ ˆz z z z h = 2

Et ainsi de suite…

52

Application

AUG 1982 3716.13 3319.22 4113.04 196.53

SEP 1982 4763.13 4340.43 5185.82 209.30

OCT 1982 5204.13 4757.13 5651.12 221.34

NOV 1982 4750.13 4280.09 5220.17 232.75

DEC 1982 4718.13 4226.12 5210.14 243.62

1

2

3

4

5

DATE. Fit for ventes 95% LCL 95% UCL SE of Fit

53

Intervalle de prévision à 95% de z55+h

Chaque modèle a sa propre formule de constructionde l’intervalle de prévision.

255 .975

ˆˆˆ ( ) 1 ( 1)(1 )hz t N r h

Modèle MA(1) :

54

55

Amélioration du modèle MA(1)

• On suppose maintenant le modèle

• est significatif.12 ˆ( ) .281tr a

1

12 , où bruit blanct t t

t t t t

w b b

b a a a

• De 12(1 ) et (1 )t t t tw B b b B a

on déduit :12(1 )(1 )t tw B B a

56

Demande SPSS

57

Résultats

Parameter Estimates

.715 .765 -11.468

.107 .399 5.219

6.693 1.918 -2.197

.000 .062 .034

Estimates

Std Error

t

Approx Sig

MA1

Non-SeasonalLags

Seasonal MA1

SeasonalLags

Constant

Melard's algorithm was used for estimation.

Residual Diagnostics

42

2

39

1268226.611

1336414.106

25544.245

159.826

-276.531

559.062

564.275

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum of Squares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

12(1 )(1 )t tw B B a

58

7.2 Étude de la voie autorégressive

On suppose que wt suit un modèle AR(14) :

1 1 14 14

2

...

( )

t t t t

t

w w w a

Var a

et on a = (1 - 1 -…- 14).

On choisit les paramètres , 1,…,14 et 2 à l’aidede la méthode du maximum de vraisemblance.

est appeléConstant dansSPSS

59

Résultats

1 1 14 14...t t t tw w w a

Residual Diagnostics

42

14

27

949178.0

1041062

28699.741

169.410

-270.689

571.379

597.444

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.680 .156 -4.367 .000

-.441 .169 -2.614 .014

.059 .188 .311 .758

.034 .184 .185 .855

.107 .191 .560 .580

.138 .214 .644 .525

-.051 .254 -.200 .843

-.016 .240 -.067 .947

-.006 .232 -.026 .980

-.054 .237 -.228 .821

.185 .234 .791 .436

-.307 .227 -1.355 .187

-.428 .208 -2.059 .049

-.572 .156 -3.668 .001

-10.788 9.983 -1.081 .289

AR1

AR2

AR3

AR4

AR5

AR6

AR7

AR8

AR9

AR10

AR11

AR12

AR13

AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

60

Modèle AR : p = (1,2,12,13,14) avec cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

61

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Parameter Estimates

-.775 .127 -6.083 .000

-.490 .122 -4.006 .000

-.512 .138 -3.711 .001

-.594 .159 -3.733 .001

-.526 .145 -3.619 .001

-12.797 7.487 -1.709 .096

AR1

AR2

AR12

AR13

AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Residual Diagnostics

42

5

36

1093774.600

1192109.813

25711.840

160.349

-273.114

558.228

568.654

Number of Residuals

Number ofParameters

Residual df

Adjusted Residual Sum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

62

Modèle AR : p = (1,2,12,13,14) sans cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

63

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Residual Diagnostics

42

5

37

1172013

1233379

27877.941

166.967

-274.563

559.127

567.815

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.747 .134 -5.591 .000

-.460 .129 -3.568 .001

-.454 .148 -3.066 .004

-.508 .171 -2.975 .005

-.467 .154 -3.041 .004

AR1

AR2

AR12

AR13

AR14

Non-SeasonalLags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

64

Modèle AR : p = 2, P = 1 avec cste

2 121 2(1 )(1 ) t tB B B w a

Demande SPSS

65

Résultats

2 121 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

38

1196121

1286077

27725.190

166.509

-274.998

557.997

564.948

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.759 .139 -5.445 .000

-.523 .132 -3.970 .000

-.557 .146 -3.812 .000

-12.289 8.308 -1.479 .147

AR1

AR2

Non-SeasonalLags

Seasonal AR1Seasonal Lags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

66

Modèle AR : p = 2, P = 1 sans cste

2 121 2(1 )(1 ) t tB B B w a

Demande SPSS

67

Résultats

2 121 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

39

1256636

1315334

29246.908

171.017

-276.033

558.066

563.279

Number ofResiduals

Number ofParameters

Residual df

Adjusted ResidualSum of Squares

Residual Sum ofSquares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.731 .143 -5.101 .000

-.481 .135 -3.562 .001

-.489 .154 -3.186 .003

AR1

AR2

Non-SeasonalLags

Seasonal AR1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

68

Résultats

2 121 2(1 )(1 ) t tB B B w a

69

Résultats avec Time Series Modeler

2 121 2(1 )(1 ) t tB B B w a

Forecast

3818 4792 5192 4688 4742

4163 5150 5567 5123 5197

3472 4434 4817 4253 4288

Forecast

UCL

LCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

70

Résultats avec Time Series Modeler2 12

1 2(1 )(1 ) t tB B B w a

71

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle avec

constante

72

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

42

3

38

1112464

1256550

19325.966

139.018

-274.630

557.261

564.211

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.765 .123 -6.228 .000

-.558 .114 -4.911 .000

.965 2.964 .326 .747

-11.009 6.504 -1.693 .099

AR1

AR2

Non-SeasonalLags

Seasonal MA1Seasonal Lags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Warnings

Our tests have determined that the estimated model lies close to the boundary of theinvertibility region. Although the moving average parameters are probably correctlyestimated, their standard errors and covariances should be considered suspect.

73

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle sans

constante

74

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

42

3

39

1190270

1287295

24282.930

155.830

-275.152

556.304

561.517

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.736 .134 -5.488 .000

-.506 .124 -4.074 .000

.745 .360 2.071 .045

AR1

AR2

Non-SeasonalLags

Seasonal MA1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

75

Résultats2 12

1 2(1 ) (1 )t tB B w B a

76

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

Forecast

3861 4854 5206 4810 4798

4184 5187 5553 5215 5220

3539 4521 4858 4405 4375

Forecast

UCL

LCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

77

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

78

8. Le modèle multiplicatif usuelARIMA(p,d,q)*(P,D,Q)s

( ) (1 ) (1 ) ( )s d s D st w tB B B B z B B a

1

1

1

1

( ) 1 ...

( ) 1 ...

( ) 1 ...

( ) 1 ...

pp

s s sPP

qq

s s sQQ

B B B

B B B

B B B

B B B

où :

Tous ces polynômes doivent être inversibles.

wtbruitblanc

79

9. Prévision

(1 ) (1 )d s Dt tB B B z B a

Le modèle général

peut s’écrire :

1 1 1 1... ...t t p t p t t q t qz z z a a a

80

Prévision à l’horizon h

Modèle

1 1 1 1... ...t h t h p t h p t h t h q t h qz z z a a a

Prévision

1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ ˆ( ) ... ...t t h p t h p t h q t h qz h z z a a

avec : si 0

ˆˆ ( ) si 0

t h jt h j

t

z h jz

z h j h j

81

10. Calcul de l’intervalle de prévision

( )(1 ) (1 ) ( )s d s D st tB B B B z B B a

De

on déduit (formellement) :

1 1

1 1 2 2

' ( )(1 ) (1 ) ( )

' ...

s d s D st t

t t t

z B B B B B B a

a a a

82

Prévision de zt+h à l’instant t

• On a

1 1 2 2 1 1

1 1

' ...

...

t h t h t h t h h t

h t h t

z a a a a

a a

Futur

Passé

1 1ˆ ( ) ' ...t h t h tz h a a

• D’où la prévision de zt+h à l’instant t

83

Erreur de prévision à l’horizon h

1 1 2 2 1 1

ˆ( ) ( )

...

t t h t

t h t h t h h t

e h z z h

a a a a

D’où :

2 2 21 1[ ( )] 1 ...t hVar e h

[ ( )] 0tE e h

84

Intervalle de prévision à 95%de zt+h réalisé à l’instant t

2 2.975 1 1ˆˆ ( ) ( ) 1 ...t hz h t N r

85

Exemple « Marché Total »

12(1 )(1 ) (1 )t tB B z B a Modèle :

On déduit :

1 12 1

2 12 24

2 11

1 2 11

(1 ) (1 ) (1 )

(1 ...)(1 ...)(1 )

(1 (1 ) (1 ) ... (1 ) ...)

t t

t

t

z B B B a

B B B B B a

B B B a

Remarque : (1 ) pour 11h h

86

Marché Total : Intervalle de prévision à l’horizon h 12

2 2.975 1 1

2.975

ˆ ˆˆˆ ( ) ( ) 1 ...

ˆˆˆ ( ) ( ) 1 ( 1)(1 )

t h

t

z h t N r

z h t N r h

87

11. Le modèle général de TS ModelerLe modèle à fonction de transfert

1

série dépendante

,..., séries prédicteurs

( )

, ou

t

t kt

t t

i

Y

X X

Z f Y

f f Log

, (1 ) (1 )

( ) ( )

( ) ( )

d s Di

si i i

si i i

B B

Num B B

Den B B

1

( ) ( ) ( ) ( ) ( )k

s sit i i it t

i i

NumB B Z f X B B a

Den

Nt = « Noise »

88

Application à la série IPI

Année Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 46364656667686970...

82

68777681848995100

137

74797984857799104

136

6465677172788287

111

787983879099103110

140

Indice de la Production Industrielle de la France (1963 - 1982)

89

Visualisation de la série IPI

Date

IPI

160

140

120

100

80

60

40

Cette sérieprésente unetendance etune saisonnalité

90

Visualisation de la saisonnalité

Année

198519801975197019651960

IPI

160

140

120

100

80

60

Trimestre

4

3

2

1

91

Date

160

140

120

100

80

60

40

IPI

MA(IPI,4,4)

Visualisation de la tendance

Moyenne mobile centréed’ordre 4 :

4

X5.0XXXX5.0

Z

2t1tt1t2t

t

Tendance Zt

92

7773696561575349454137332925211713951

Trimestre

150

125

100

75

ipi

(a) Indice de la production industrielle (23.85)

(c) Différence régulière/saisonnière de IPI ( ˆ 4.76 )

93

Modèle avec intervention

468.2( ) ( ) (1 )(1 )( ) ( ) ( )s s

t tB B B B z I B B a Effetmai 68

Nt = « Noise » = Série corrigée stationnarisée

Étapes

1. Construction de la série « Noise »2. Modélisation de la série « Noise »3. Estimation du modèle complet

94

Etape 1 : Construction de la série « Noise »

468.2(1 )(1 )( )t tNoise B B z I a

Parameter Estimates

-15.250 1.626 -9.380 .000

-.160 .375 -.426 .671

i22Regression Coefficients

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

95

Étape 2 : Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Noise suit un AR(8)

96

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

75

8

66

493.364

494.199

7.294

2.701

-177.255

372.509

393.367

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.095 .118 .803 .425

.016 .121 .135 .893

-.215 .119 -1.800 .076

-.520 .125 -4.175 .000

-.081 .121 -.668 .506

-.085 .119 -.714 .478

-.116 .124 -.934 .354

-.259 .127 -2.042 .045

.066 .150 .437 .663

AR1

AR2

AR3

AR4

AR5

AR6

AR7

AR8

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Noise ~ ARIMA(8,1,0)*(0,1,0)4

97

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

75

2

73

549.094

550.078

7.344

2.710

-181.075

366.150

370.785

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.628 -.292

.115 .118

-5.476 -2.474

.000 .016

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

Melard's algorithm was used for estimation.

Noise ~ ARIMA(0,1,0)*(2,1,0)4

sans constante

98

Étape 3 : estimation du modèle complet

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

75

2

71

547.971

551.748

7.533

2.745

-181.015

370.031

379.301

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.632 -.295 -15.089 -.097

.116 .118 1.679 .170

-5.440 -2.509 -8.987 -.569

.000 .014 .000 .571

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

i22

RegressionCoefficients

Constant

Melard's algorithm was used for estimation.

99

Étape 3 : estimation du modèle completsans constante

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

75

2

72

550.462

554.558

7.464

2.732

-181.173

368.347

375.299

Number of Residuals

Number of Parameters

Residual df

Adjusted Residual Sum ofSquares

Residual Sum of Squares

Residual Variance

Model Std. Error

Log-Likelihood

Akaike's InformationCriterion (AIC)

Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.631 -.292 -15.095

.116 .117 1.671

-5.459 -2.498 -9.033

.000 .015 .000

Estimates

Std Error

t

Approx Sig

Seasonal AR1 Seasonal AR2

Seasonal Lags

i22

RegressionCoefficients

Melard's algorithm was used for estimation.

100

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 1

101

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 2

102

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 3

103

Utilisation de Time Series Modeler pour la prévision

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Forecast LCL UCL

Q1 1983 136.1 130.7 141.6 Q2 1983 133.4 125.7 141.1 Q3 1983 110.3 100.9 119.8 Q4 1983 138.1 127.2 149.0

Model Statistics

1 .678 18.846 16 .277 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)

Number ofOutliers

104

Utilisation de Time Series Modeler pour la prévisionLa syntaxe SPSS

PREDICT THRU END.

* Time Series Modeler.

TSMODEL

/MODELSUMMARY PRINT=[ MODELFIT]

/MODELSTATISTICS DISPLAY=YES MODELFIT=[ SRSQUARE]

/MODELDETAILS PRINT=[ PARAMETERS FORECASTS]

/SERIESPLOT OBSERVED FORECAST FIT FORECASTCI

/OUTPUTFILTER DISPLAY=ALLMODELS

/SAVE NRESIDUAL(NResidual)

/AUXILIARY CILEVEL=95 MAXACFLAGS=24

/MISSING USERMISSING=EXCLUDE

/MODEL DEPENDENT=ipi INDEPENDENT=i22

PREFIX='Model'

/ARIMA AR=[0] DIFF=1 MA=[0] ARSEASONAL=[1,2]

DIFFSEASONAL=1

MASEASONAL=[0]

TRANSFORM=NONE CONSTANT=NO

/TRANSFERFUNCTION VARIABLES=i22

DIFF=1

DIFFSEASONAL=1

/AUTOOUTLIER DETECT=OFF.

105

Utilisation de Expert Modeler

106

Utilisation de Expert Modeler

Model Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type

Model Statistics

1 .660 27.437 17 .052 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)

Number ofOutliers

ARIMA Model Parameters

1

1

.507 .109 4.657 .000

-15.315 1.728 -8.863 .000

1

1

Difference

Seasonal Difference

Lag 1MA, Seasonal

No TransformationIPI

Lag 0Numerator

Difference

Seasonal Difference

No Transformationi22

IPI-Model_1Estimate SE t Sig.

4 468.2 1(1 )(1 )( ) (1 )t tB B z I B a

Réponse :

107

Utilisation de Expert Modeler

108

Utilisation de Expert Modeler

Forecast

136 134 111 139

141 142 121 150

130 126 101 128

Forecast

UCL

LCL

ModelIPI-Model_1

Q1 1983 Q2 1983 Q3 1983 Q4 1983

For each model, forecasts start after the last non-missing in the range of therequested estimation period, and end at the last period for whichnon-missing values of all the predictors are available or at the end date of therequested forecast period, whichever is earlier.

109

Utilisation de Expert Modelerpour « All models »

Réponse :

Model Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type

top related