pensées sur la théorie statistique

Download Pensées sur la théorie statistique

Post on 24-Feb-2016

33 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

Pensées sur la théorie statistique. Nancy Reid. La statistique en demande. “La science statistique connaît une croissance sans précédent tant en opportunités qu'en activités” Physique des hautes énergies Histoire de l'art Forage de réalité Bioinformatique Enquêtes complexes - PowerPoint PPT Presentation

TRANSCRIPT

Thoughts on the theory of statistics

Penses sur la thorie statistique

Nancy ReidSSC 2010Thorie statistique

La statistique en demandeLa science statistique connat une croissance sans prcdent tant en opportunits qu'en activitsPhysique des hautes nergiesHistoire de l'artForage de ralitBioinformatiqueEnqutes complexesClimat et environnementSSC 2010

SSC 2010Thorie statistique Pense StatistiqueSSC 2010Pleins des ressources

Theory of statistics

One of a great many resources now available, including3Pense statistique 1SSC 2010Si une statistique tait la rponse, quelle est la question?Que comptons-nous?Embches frquentesmoyennes, mdianes et valeurs aberrantesSommes-nous certains?signification et confiance statistiquesPourcentages et risqueschangements relatifs et absolus

Thorie statistique

Thorie statistique pour 20xxSSC 2010Que devrions-nous enseigner?Si une statistique est la rponse, quelle est la question?Planification d'exprience et enqutesEmbches frquentesStatistiques descriptives: exhaustivit etc.Sommes-nous certains?InfrencePourcentages et risquesInterprtationThorie statistique

Modles et vraisemblanceSSC 2010La modlisation est difficile et importanteIl y a beaucoup tirer de la fonction de vraisemblancePas que des estimateurs ponctuels dePas que (pas du tout!) des tests les plus puissantsQuantits infrentielles (pivots)Distributions infrentielles (asymptotiques)Un point de dpart naturel, mme pour des modles trs complexes

Thorie statistiqueLikelihood is everywhere!SSC 2010

Thorie statistiqueMidlife: National Post, January 30, 2008.7AperuSSC 2010Thorie asymptotique dordre suprieur/la vraisemblance en tant que pivotInfrence baysienne et non baysienneVraisemblance partielle, quasi et compositeO allons-nous?

Thorie statistique Fonctions valeur-p partir de vraisemblanceLa vraisemblance en tant que pivotSSC 2010 Fonctions valeur-p partir de vraisemblanceLa vraisemblance en tant que pivotSSC 20100.9750.025Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Racine de la vraisemblanceEstimateur du max. de vraisemblanceFonction de scoreToutes approximativement de loi

Beaucoup mieux:

peut tre Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Racine de la vraisemblanceEstimateur du max. de vraisemblanceFonction de score

Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010Peut tre presque exacteLa vraisemblance en tant que pivotSSC 2010 Utiliser des approximations dordre suprieurLa vraisemblance en tant que pivotSSC 2010Approximations excellentes pour cas facilesFamilles exponentielles, rgression linaire non normaleDemandant plus de travail pour cas modrsModles autorgressifs, effets fixes et alatoires, rponse discrteDlicates pour cas difficilesModles structurels complexes sources de variation multiplesMeilleurs rsultats pour un paramtre scalaireMais on peut devoir faire de linfrence sur des paramtres vectorielsDo est-ce que a vient?La vraisemblance en tant que pivotSSC 2010

4Amari, 1982, Biometrika; Efron 1975 AnnalsDo est-ce que a vient?La vraisemblance en tant que pivotSSC 2010Gomtrie diffrentielle de modles statistiquesThorie des familles exponentiellesApproximations dEdgeworth et du point de selleIde clef:Un modle paramtrique lisse peut tre approxim par un modle tangent tir dune famille exponentielleNcessite de diffrencier la fonction de log-vraisemblance par rapport lespace chantillonnalPermet des gnralisations aux modles plus complexesDo est-ce que a vient?Likelihood as pivotalSSC 2010

Fraser, Reid Jianrong Wu 1999; Reid 2003; Fraser 199021GnralisationsLa vraisemblance en tant que pivotSSC 2010 des donnes discrtesLorsque diffrencier la log-vraisemblance par rapport lespace chantillonnal est plusSolution: utiliser plutt la valeur espre de la statistique de scoreLerreur relative est alors plutt queTout de mme mieux que lapproximation normaleGnralisationsLa vraisemblance en tant que pivotSSC 2010GnralisationsLa vraisemblance en tant que pivotSSC 2010 des paramtres dintrt vectorielsMais nos solutions ncessitent un seul paramtreSolution: utiliser la longueur du vecteur, conditionnelle sa directionGnralisationsLa vraisemblance en tant que pivotSSC 2010tendre le rle de la famille exponentielleEn gnralisant la diffrentiation par rapport lespace chantillonnalIde: diffrencier la log-vraisemblance esprePlutt que la log-vraisemblanceMne une nouvelle version de la famille exponentielle approximantePeut tre utilise avec les pseudo-vraisemblancesQue pouvons-nous apprendre?baysienne/non baysienne SSC 2010Les approximations dordre suprieur demandentDe diffrencier la fonction de log-vraisemblance par rapport lespace chantillonnalLinfrence baysienne sera diffrenteLes dveloppements asymptotiques soulignent cet cartLes a posteriori baysiens ne sont en gnral pas calibrsNe peuvent pas toujours tre corrigs par le choix da prioriNous pouvons tudier ceci en comparant approximations baysiennes et non baysiennes

Exemple: infrence pour ED50baysienne/non baysienne SSC 2010Rgression logistique avec une seule covariableSur lchelle logistiqueLois a priori plates pourLe paramtre dintrt estCouverture empirique des intervalles baysiens a posteriori:0.90, 0.88, 0.89, 0.90Couverture empirique dintervalles utilisant0.95, 0.95, 0.95, 0.95Loi a priori plates: mauvaise ide!baysienne/non baysienne SSC 2010

Loi a priori plates: mauvaise ide!baysienne/non baysienne SSC 2010Loi a priori plates: mauvaise ide!baysienne/non baysienne SSC 2010Valeur-p baysienne valeur-p frquentiste Modles plus complexesPartial, quasi, composite likelihood SSC 2010Linfrence base sur la vraisemblance a plusieurs qualits souhaitablesExhaustivit, efficacit asymptotiqueBonnes approximations pour les distributions requisesObtenue naturellement partir de modles paramtriquesPeut tre difficle construire, surtout pour des modles complexesPlusieurs gnralisations naturelles: vraisemblance partielle pour donnes censures, quasi-vraisemblance pour quations destimation gnralises, vraisemblance composite pour donnes dpendantesModles complexesVraisemblance partielle, quasi et compositeSSC 2010Exemple: tudes longitudinales de sujets atteints de migrainesVariable latente Variable observe

E.g. maux de tte intenses, modrs, faibles, absents Covariables: ge, ducation, analgsiques, mto, effets alatoires inter- et intra-sujetsCorrlation srielle Vraisemblance pour donnes discrtes longitudinalesVraisemblance partielle, quasi et compositeSSC 2010Fonction de vraisemblance

Difficile calculerHypothses fortesProposition: utiliser des densits bivaries marginales la place des densits normales multivariesCe qui donne un modle mal spcifiVraisemblance compositeVraisemblance partielle, quasi et compositeSSC 2010Fonction de vraisemblance composite

Plus gnralement,

Les ensembles indexent des distributions marginales ou conditionnelles (ou ) Infrence base sur la thorie des quations destimation

Un exemple simpleVraisemblance partielle, quasi et compositeSSC 2010LEMV par paires de est entirement efficaceSi , la perte defficacit dpend de la dimensionPetite pour dimension plus petite que, disons, 10Scroule si et que la taille chantillonnale est fixePertinent pour sries chronologiques, applications gntiques

Estimateur par vraisemblance compositeVraisemblance partielle, quasi et compositeSSC 2010Information de Godambe

Applications rcentesVraisemblance partielle, quasi et compositeSSC 2010Donnes longitudinales binaires et continues: modles effets alatoiresAnalyse de survie: modles de dfaillance, copules Rponses de types multiples: discrte et continue; marqueurs et temps dvnementsFinance: modle covariance variant dans le temps Gntique/bioinformatique: CCL pour distribution vonMises: repliement de protine; cartographie gntique; dsquilibre de liaison Donnes spatiales: gostatistique, processus spatiaux ponctuels

\onslide \hfill {\footnotesize {\color{gray} Molenberghs and Verbeke, 2005, Ch.~9; Zhao \& Joe, 2005}}\\\onslide\hfill{\footnotesize {\color{gray} Parner, 2001; Andersen, 2004; Fiocco et al., 2009}}\\\onslide \hfill {\footnotesize{\color{gray} de Leon and Carriere, 2007; Fieuws et al.,2007}}\\\onslide\hfill {\footnotesize {\color{gray} Engle et al., 2009}}\\literature \\\onslide\hfill {\footnotesize{\color{gray}Tamura et al.,2007; Li, 2008; Mardia et al.,2009}}\\\onslide {\footnotesize {\color{gray} Stein, 2004; Caragea and Smith, 2008; Varin et al., 2005; ...}}

37 et plusVraisemblance partielle, quasi et compositeSSC 2010Analyse dimages Modle de RaschModle de Bradley-Terry Modle espace dtatsDynamique des populations

\onslide \hfill {\footnotesize {\color{gray} Molenberghs and Verbeke, 2005, Ch.~9; Zhao \& Joe, 2005}}\\\onslide\hfill{\footnotesize {\color{gray} Parner, 2001; Andersen, 2004; Fiocco et al., 2009}}\\\onslide \hfill {\footnotesize{\color{gray} de Leon and Carriere, 2007; Fieuws et al.,2007}}\\\onslide\hfill {\footnotesize {\color{gray} Engle et al., 2009}}\\literature \\\onslide\hfill {\footnotesize{\color{gray}Tamura et al.,2007; Li, 2008; Mardia et al.,2009}}\\\onslide {\footnotesize {\color{gray} Stein, 2004; Caragea and Smith, 2008; Varin et al., 2005; ...}}NottandRyden,1999 Fearnhead,2008;Song,2008LarribeandLessard,2008 38Que pouvons-nous apprendre?Vraisemblance partielle, quasi et compositeSSC 2010Que devons-nous savoir?Vraisemblance partielle, quasi et compositeSS