cours econometrie donnees de panel

Upload: imen-thabet

Post on 20-Jul-2015

441 views

Category:

Documents


12 download

TRANSCRIPT

Cours dconomtrie II Donnes de panelCours du 2 fvrier 2006Michel Juillard

Cours dconomtrie IIDonnes de panel p. 1/4

Donnes de panelDes donnes de panel contiennent des donnes sur plusieurs individus observs diffrentes dates. Exemples: Des donnes sur les 420 districts scolaires de Californie en 1999 et 2000, soit 840 observations en tout. Des donnes sur les 24 pays de lUnion europenne pendant trois ans, soit 72 observations. Des donnes sur 1000 individus pendant quatre mois, soit 4000 observations.

Cours dconomtrie IIDonnes de panel p. 2/4

NotationLes donnes sont indices par un double indice:i : lindividu, i = 1, . . . , n, soit n individus t : la priode, t = 1, . . . , T , soit T priodes

Pour un modle avec une variable explicatives, les donnes sont (Xit , Yit ) Avec k variables explicatives(X1it , X2it , . . . , Xkit , Yit )

Cours dconomtrie IIDonnes de panel p. 3/4

Terminologiedonnes longitudinales est synonyme de donnes de panel un panel quilibr (balanced panel en anglais) a le mme nombre dobservations pour tous les individus un panel dsquilibr est un panel o il manque des observations pour certains individus

Cours dconomtrie IIDonnes de panel p. 4/4

Utilit des panelsLes donnes en panel permettent de contrler pour des facteurs qui varient entre les individus, mais ne varient pas au cours du temps, pourraient causer un biais domission si lon en tenait pas compte, sont inobservables ou non disponibles et ne peuvent tre inclus dans la rgression. Si ces facteurs ne varient pas au cours du temps, ils ne peuvent pas inuencer la variation de Y au cours du temps.

Cours dconomtrie IIDonnes de panel p. 5/4

ExempleAccidents mortels de la circulation et impts sur lalcool aux EtatsUnis Unit dobservation: une anne dans un Etat des EtatsUnis: 48 Etats: n = 48, 7 ans (1982, . . . , 1988): T = 7, panel quilibr: 7 48 = 336 observations

Cours dconomtrie IIDonnes de panel p. 6/4

Exemple (suite)Variables: nombre de morts par accident de la circulation pour 10000 habitants impts sur un paquet de bires autres (ge minimum pour la conduite, lois contre lalcool au volant, . . . )

Cours dconomtrie IIDonnes de panel p. 7/4

Donnes pour 1982

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 8/4

Donnes pour 1988

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 9/4

Autres facteursPourquoi y auraitil davantage de morts par accident de la circulation dans les Etats qui ont des impts plus levs sur lalcool? Qualit (ge) des automobiles Qualit des routes Tolrance culturelle vis vis de boire et conduire Densit des voitures sur la route Ces facteurs peuvent causer un biais domission sils sont corrl avec les impts sur lalcool.

Cours dconomtrie IIDonnes de panel p. 10/4

Densit du trafcUne densit du trafc plus leve est associe avec davantage daccidents mortels sur la route Les Etats de lOuest, moins peupls, ont des impts plus faibles sur lalcool. Facteur peu susceptible des changer au cours du temps (en 7 ans)

Cours dconomtrie IIDonnes de panel p. 11/4

Tolrance culturelleUne tolrance culturelle envers le fait de boire et conduire peut tre associe des accidents mortels plus nombreux Il peut y avoir une corrlation entre les impts sur lalcool et lattitude culturelle Les attitudes culturelles ne changent en gnral pas dune anne lautre

Cours dconomtrie IIDonnes de panel p. 12/4

Panel sur deux priodesModleF Rit = 0 + 1 BTit + 2 Zi + uit i = 1, . . . , 48; t = 1, 2

avec F Rit le taux daccidents mortels (fatality rate), dans lEtat i, la priode t, et BTit , les impts sur la bire (beer tax), dans lEtat i, la priode t. Zi est un facteur qui ne varie pas au cours du temps. Si Z nest pas observ et que corr(BT, Z) = 0, son omission entrane un biais de lestimateur 1

Cours dconomtrie IIDonnes de panel p. 13/4

Eliminer ZLquation pour 1982:F Ri82 = 0 + 1 BTi82 + 2 Zi + ui82

Lquation pour 1988F Ri88 = 0 + 1 BTi88 + 2 Zi + ui88

Supposon que E (uit |BTit , Zi ) = 0 (Supposons quil ny a pas dautres facteurs importants). Diffrence entre 1982 et 1988F Ri = 1 BTi + vi

avec vi = ui88 ui82 . Bien que Z a disparu, corr (BT, v) = 0.

Cours dconomtrie IIDonnes de panel p. 14/4

RsultatsDonnes pour 1982F Ri = 2.01 + 0.15 BTi(0.15) (0.13)

(n = 48)

Donnes pour 1988F Ri = 1.86 + 0.44 BTi(0.11) (0.13)

(n = 48)

Diffrences 19821988F Ri = 0.072 1.04 BTi(0.065) (0.36)

(n = 48)

Cours dconomtrie IIDonnes de panel p. 15/4

Reprsentation graphique

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 16/4

Rgression effet xeComment faire lorsquon dispose dobservations sur plus de 2 priodes? On peut crire le modleYit = 0 + 1 Xit + 2 Zi + uit

commeYit = i + 1 Xit + uit

avec i = 0 + 2 Zi . Leffet xe individuel inobservable devient un coefcient estimer!

Cours dconomtrie IIDonnes de panel p. 17/4

EstimationIl existe trois mthodes pour estimer un modle effets xes: 1. Reprsenter i par n 1 variables binaires (en pratique, que si n nest pas trop grand) 2. Estimer en cart la moyenne de chaque individu (au cours du temps) 3. Estimer sur les donnes en diffrence (seulement si T = 2) Les trois mthodes fournissent les mmes valeurs estimes et les mmes erreurstype pour les coefcients.

Cours dconomtrie IIDonnes de panel p. 18/4

Variables binairesImaginons que nous navons que trois Etats: Californie (CA), Texas (TX) et Massachusetts (MA). Nous obtenons les quations suivantes:YCA,t = CA + 1 XCA,t + uCA,t YT X,t = T X + 1 XT X,t + uT X,t YM A,t = M A + 1 XM A,t + uM A,t

Trois droites parallles avec la mme pente (1 ). On peut reprsenter les trois i laide de deux variables binaires: DCA = 1, sil sagit de la Californie, 0 autrement DT X = 1, sil sagit du Texas, 0 autrement.

Cours dconomtrie IIDonnes de panel p. 19/4

Variables binaires (suite)On obtient le modleYit = 0 + CA DCAi + T X DT Xi + 1 Xit + uit

etCA = 0 + CA T X = 0 + T X M A = 0

En gnral, il faut n 1 variables binaires.

Cours dconomtrie IIDonnes de panel p. 20/4

Variables binaires (suite)Modle gnral:Yit = 0 + 1 Xit + 2 D2i + . . . + n Dni + ui

Peut tre estim par les MCO Les tests et les intervalles de conance se calculent de la manire habituelle (en utilisant les erreurs-type robustes lhtroscdasticit) Difcile utiliser pour un trs grand nombre dindividus

Cours dconomtrie IIDonnes de panel p. 21/4

Donnes centresModle effets xesYit = i + 1 Xit + uit

Moyennes au cours du temps pour chaque individu:1 TT t=1

1 Yit = i + 1 T

T t=1

1 Xit + T

T

uitt=1

Modle en carts la moyenne:1 Yit TT

Yitt=1

= 1

1 Xit T

T

Xitt=1

1 + uit T

T

uitt=1

Cours dconomtrie IIDonnes de panel p. 22/4

Donnes centres (suite) Yit = 1 Xit + uitavec 1 Yit T 1 Xit T 1 uit TT

Yit

=

Yit =1 T

Xit

=

Xit =1 T

uit

=

uit =1

Par exemple, pour i = 1 et t = 1, Yit reprsente la diffrence entre le taux de mortalit par accident en Alabama en 1982 et le taux moyen de mortalit dans cet Etat entre 1982 et 1988.

Cours dconomtrie IIDonnes de panel p. 23/4

Estimation Yit = 1 Xit + uit

Calculer Yit et Xit Estimer par les MCO Les tests et les intervalles de conance se calculent de la manire habituelle (en utilisant les erreurs-type robustes lhtroscdasticit)

Cours dconomtrie IIDonnes de panel p. 24/4

ExempleF Rit = 0.66 BTit + effets xes(0.20)

A comparer avec diffrences 19821988F Ri = 0.72 1.04 BTi(0.065) (0.36)

Cours dconomtrie IIDonnes de panel p. 25/4

Effets xes temporelsUne variable omise peut tre identique dans les diffrents Etats, mais varier au cours du temps. Par exemple la scurit des vhicles ou la rglementation nationale. On introduit des constantes qui changent avec le temps, mais pas les individusYit = 0 + 1 Xit + 2 Zi + 3 St + uit

Cours dconomtrie IIDonnes de panel p. 26/4

EstimationModles uniquement effets xes temporelsYit = 0 + 1 Xit + 3 St + uit

Les modles effets xes temporelles peuvent sestimer en ajoutant T-1 variables binaires en centrant les donnes autour de la moyenne des individus par priode

Cours dconomtrie IIDonnes de panel p. 27/4

Effets xes individuels et temporelsLe modleYit = 0 + 1 Xit + 2 Zi + 3 St + uit

peut sestimer 1. laide de variables binairesYit = 0 + 1 Xit + 2 D2i + . . . + n Dni 2 B2t + . . . + T BTt + uit

2. en centrant les variables autour de la moyenne globale ( travers le temps et les individus)1 Yit = Yit nTn T

Yjj=1 =1

Cours dconomtrie IIDonnes de panel p. 28/4

HypothsesH1 : le modle Yit = i + 1 Xit + uit H2 : E (uit |Xi1 , . . . , XiT i ) = 0 H3 : (Xi1 , . . . , XiT , Yi1 , . . . , YiT ) est i.i.d. H4 : (Xit , uit ) a des quatrimes moments nis H5 : il ny a pas de multicolinarit parfaite (lorsquil y a plusieurs variables explicatives) H6 : corr (uit , uis |Xit , Xis , i ) = 0

Cours dconomtrie IIDonnes de panel p. 29/4

E (uit|Xi1, . . . , XiT i) = 0uit = 0 tant donn leffet xe pour lindividu i et toute lhistoire de X pour cet individu.

Il ne peut y avoir deffets retards omis. Les effets retards doivent tre modliss explicitement. Il ne peut non plus y avoir deffets vers le futur. Par exemple, un taux daccidents particulirement lev une anne ne doit pas entraner une hausse des impts sur la bire les annes suivantes.

Cours dconomtrie IIDonnes de panel p. 30/4

(Xi1, . . . , XiT , Yi1, . . . , YiT ) est i.i.d.Lhypothse est satisfaite si les individus sont tirs au hasard dans la population et quon enregistre lhistoire de ces individus Il nest pas ncessaire que les observations successives au cours du temps pour le mme individu soient i.i.d. Ce serait hautement irraliste.

Cours dconomtrie IIDonnes de panel p. 31/4

corr (uit, uis|Xit, Xis, i) = 0Nouvelle hypothse propre aux panels. Les erreurs ne sont pas corrles au travers du temps pour un mme individu. Les facteurs omis de lquation ne doivent pas tre corrls au cours du temps. Exemples: Conditions mtorologiques Ouverture dune nouvelle autoroute Fluctuations du trafc dues aux conditions conomiques locales

Cours dconomtrie IIDonnes de panel p. 32/4

Si H6 nest pas satisfaiteAutocorrlation des erreurs. 1 demeure nonbiais et convergent lerreurtype de lestimateur est fausse. Intuitivement, lorsque les erreurs sont autocorrles, on ne dispose pas dautant dinformation quon le croit. Solution: utiliser une formule qui corrige les erreurstype poru lhtroscdasticit et lautocorrlation (HAC).

Cours dconomtrie IIDonnes de panel p. 33/4

ApplicationQuels sont les effets des diffrentes mesures contre lalcool au volant? sanctions pnales ge minimum pour consommer de lalcool impts sur lalcool

Cours dconomtrie IIDonnes de panel p. 34/4

DonnesUn panel quilibr (n = 48, T = 7) Variables: taux de mortalit par accident de la circulation (pour 10000 habitants) impts sur la bire ge minimum pour consommer de lalcool sanctions pnales prison service dintrt gnral amende miles parcourus par conducteur taux de chmage revenu rel par habitant

Cours dconomtrie IIDonnes de panel p. 35/4

Utilit dun panelEffets manquants, variables dun Etat lautre, mais constants au cours du temps attitudes culturelles visvis de boire et conduire qualit des routes ge des vhicules Effets manquants, constants parmi les Etats, mais changeants au cours du temps amlioration de la scurit des vhicules modication nationale de lattitue visvis de boire et conduire

Cours dconomtrie IIDonnes de panel p. 36/4

Rsultats

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 37/4

Rsultats (suite)

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 38/4

DiscussionLe signe de leffet des impts sur la bire change lorsquon introduit des effets xes individuels. Les effets xes temporels sont signicatifs, mais ne changent pas les rsultats de lestimation de manire importante. Leffet estim de limpt sur la bire diminue lorsquon introduit les autres mesures dissuasives. La seule mesure qui apparat statistiquement signicative est limpt sur la bire. Les variables denvironnement conomique apparaissent comme importante.

Cours dconomtrie IIDonnes de panel p. 39/4

Utiliser des variables binairesOn peut utiliser des variables binaires dans dautres contextes que les donnes en panel pour contrler des effets de groupe. Cest utile si lon souponne que des groupes dobservations sont affects par des effets nonobservs constants pour les observations dun groupe. Exemple: si la politique scolaire tait dcide au niveau du comt et que chaque comt soit compos de plusieurs districts scolaires.

Cours dconomtrie IIDonnes de panel p. 40/4

Donnes de panel: rsumAvantages des effets xes: permettent de contrler pour des effets nonobservs xes au cours du temps ou travers les individus Davantage dobservations fournit davantage dinformation (valeurs estimes plus prcises) Extension de la mthodologie de la rgression Infrence se conduit de la manire habituelle Limitations: Les observations doivent varier au cours du temps. Les effets retards peuvent tre importants Les erreurstypes peuvent tre sousestimes si les erreurs sont autocorrles

Cours dconomtrie IIDonnes de panel p. 41/4