aide a la redaction du plan d’analyse et a l...

2
CHU d’Angers / Département de Santé Publique / Elsa Parot-Schinkel (interne) 1 / 2 AIDE A LA REDACTION DU PLAN D’ANALYSE ET A L’INTERPRETATION DES RESULTATS A) PLAN D’ANALYSE STATISTIQUE TYPE Les analyses statistiques ont été réalisées par le méthodologiste du Centre de Recherche Clinique du CHU d’Angers (Dr Elsa PAROT-SCHINKEL) avec le logiciel SPSS version 15. Le seuil de significativité est fixé à 0,05 et tous les tests sont bilatéraux. Les résultats sont exprimés sous forme de moyenne ± déviation standard (pour les variables quantitatives) ou de pourcentage (pour les variables qualitatives). Une analyse descriptive simple a été réalisée sur l’ensemble de la population de l’étude puis par sous-groupes. Cette description a porté sur les données socio-démographiques, les antécédents médicaux, les traitements en cours, … Une étude qualitative et quantitative des données manquantes a été réalisée. Les deux sous-groupes étudiés ont été constitués en fonction du statut pour « variable de groupe » G +/- seuil choisi si variable quantitative (ex : insuffisance rénale Oui/Non déterminé en fonction de la valeur de la créatininémie). Pour répondre à l’objectif principal de l’étude, une analyse univariée a été réalisée afin de déterminer les facteurs associés à G (ex : insuffisance rénale) à inclure dans l’analyse multivariée. Les tests statistiques utilisés sont le test de Chi-deux de Pearson (ou le test exact de Fisher selon la distribution de la variable) pour les variables qualitatives et le test-T de Student (ou le test non paramétrique de Mann-Whitney selon la distribution de la variable) pour les variables quantitatives. L’association entre chaque facteur de risque supposé et G a été estimée au moyen de l’Odds Ratio (OR) [risque relatif (RR) si prospectif] et de son intervalle de confiance à 95%. Une analyse multivariée par régression logistique multiple [régression linéaire multiple si variable d’intérêt quantitative] a permis d’estimer l’Odds Ratio ajusté [le coefficient ajusté] et son intervalle de confiance à 95% pour chaque facteur retenu (seuil conservateur 0,20). Variables d’ajustement forcées dans le modèle ? Modèle ascendant ou descendant ? Interactions recherchées ? Les hypothèses à tester (résultats attendus) sont … B) INTERPRETATION DES TESTS « dans notre échantillon, on observe (ou pas) une différence (ou un lien) statistiquement significative entre x et y avec une probabilité p=0,0… » ~ OUI (p<0,05 ; p peut ne pas être mentionnée dans le texte mais indiquée dans le tableau récapitulatif des résultats) « x est un facteur influençant (~ facteur de risque, facteur pronostic) de y » ~ NON Cette conclusion implique que l’on a vérifié la puissance (effectifs) et la représentativité (biais diverses et variés) de l’étude ; ainsi que les critères (statistiques, scientifiques, cliniques, bibliographiques, …) de causalité entre x et y !! … les faibles effectifs observés ne nous permettent pas de conclure … (limite S ou L) = à la limite de la significativité ~ quand p est compris entre ]0,05-0,10] => le résultat n’est pas significatif mais on peut le mentionner à part et il est intéressant de le discuter tout de même car on peut supposer (en fonction des données étudiées ~ faibles effectifs, biais d’échantillonnage ou de classement) qu’il n’est pas significatif non pas parce qu’il n’y a pas de différence mais probablement parce qu’on n’a pas assez de puissance pour mettre en évidence cette différence !!!

Upload: dinhphuc

Post on 06-Feb-2018

214 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: AIDE A LA REDACTION DU PLAN D’ANALYSE ET A L ...dusp.angers.free.fr/fichiers/aide_redaction_chap_stats.pdf · CHU d’Angers / Département de Santé Publique / Elsa Parot-Schinkel

CHU d’Angers / Département de Santé Publique / Elsa Parot-Schinkel (interne) 1 / 2

AIDE A LA REDACTION DU PLAN D’ANALYSE ET A L’INTERP RETATION DES RESULTATS

A) PLAN D’ANALYSE STATISTIQUE TYPE

Les analyses statistiques ont été réalisées par le méthodologiste du Centre de Recherche Clinique du CHU d’Angers (Dr

Elsa PAROT-SCHINKEL) avec le logiciel SPSS version 15.

Le seuil de significativité est fixé à 0,05 et tous les tests sont bilatéraux. Les résultats sont exprimés sous forme de

moyenne ± déviation standard (pour les variables quantitatives) ou de pourcentage (pour les variables qualitatives).

Une analyse descriptive simple a été réalisée sur l’ensemble de la population de l’étude puis par sous-groupes. Cette

description a porté sur les données socio-démographiques, les antécédents médicaux, les traitements en cours, … Une

étude qualitative et quantitative des données manquantes a été réalisée.

Les deux sous-groupes étudiés ont été constitués en fonction du statut pour « variable de groupe » G +/- seuil choisi si

variable quantitative (ex : insuffisance rénale Oui/Non déterminé en fonction de la valeur de la créatininémie).

Pour répondre à l’objectif principal de l’étude, une analyse univariée a été réalisée afin de déterminer les facteurs associés

à G (ex : insuffisance rénale) à inclure dans l’analyse multivariée. Les tests statistiques utilisés sont le test de Chi-deux de

Pearson (ou le test exact de Fisher selon la distribution de la variable) pour les variables qualitatives et le test-T de

Student (ou le test non paramétrique de Mann-Whitney selon la distribution de la variable) pour les variables

quantitatives. L’association entre chaque facteur de risque supposé et G a été estimée au moyen de l’Odds Ratio (OR)

[risque relatif (RR) si prospectif] et de son intervalle de confiance à 95%.

Une analyse multivariée par régression logistique multiple [régression linéaire multiple si variable d’intérêt quantitative] a

permis d’estimer l’Odds Ratio ajusté [le coefficient ajusté] et son intervalle de confiance à 95% pour chaque facteur

retenu (seuil conservateur 0,20). Variables d’ajustement forcées dans le modèle ? Modèle ascendant ou descendant ?

Interactions recherchées ?

Les hypothèses à tester (résultats attendus) sont …

B) INTERPRETATION DES TESTS

• « dans notre échantillon, on observe (ou pas) une différence (ou un lien) statistiquement significative entre x et y avec

une probabilité p=0,0… » ~ OUI

(p<0,05 ; p peut ne pas être mentionnée dans le texte mais indiquée dans le tableau récapitulatif des résultats)

≠≠≠≠ « x est un facteur influençant (~ facteur de risque, facteur pronostic) de y » ~ NON

⇒ Cette conclusion implique que l’on a vérifié la puissance (effectifs) et la représentativité (biais diverses et variés) de l’étude ; ainsi

que les critères (statistiques, scientifiques, cliniques, bibliographiques, …) de causalité entre x et y !!

• … les faibles effectifs observés ne nous permettent pas de conclure …

• (limite S ou L) = à la limite de la significativité ~ quand p est compris entre ]0,05-0,10] => le résultat n’est pas significatif mais

on peut le mentionner à part et il est intéressant de le discuter tout de même car on peut supposer (en fonction des données

étudiées ~ faibles effectifs, biais d’échantillonnage ou de classement) qu’il n’est pas significatif non pas parce qu’il n’y a pas de

différence mais probablement parce qu’on n’a pas assez de puissance pour mettre en évidence cette différence !!!

Page 2: AIDE A LA REDACTION DU PLAN D’ANALYSE ET A L ...dusp.angers.free.fr/fichiers/aide_redaction_chap_stats.pdf · CHU d’Angers / Département de Santé Publique / Elsa Parot-Schinkel

CHU d’Angers / Département de Santé Publique / Elsa Parot-Schinkel (interne) 2 / 2

C) RAPPELS STATISTIQUES

1) Tests statistiques pour les variables Quantitati ves :

a) Groupes indépendants :

- comparaisons de moyennes pour 2 groupes indépendants = test-T de Student pour variables quantitatives qui suivent

une loi normale (~ effectifs de chaque sous-groupes > 30); sinon test non paramétrique de Mann-whitney.

- comparaisons de moyennes pour >2 groupes indépendants = ANOVA pour variables quantitatives qui suivent une loi

normale (~ effectifs de chaque sous-groupes > 30); sinon test non paramétrique de Kruskall Wallis.

(le test non paramétrique de Kruskall Wallis est applicable aussi sur seulement 2 groupes ; dans ce cas les résultats sont identiques à

un test de Mann-Whitney)

b) Séries appariées (le sujet est son propre témoi n) :

- comparaisons de moyennes pour 2 groupes non indépendants (séries appariées ~ comparaison dans le temps) =

test-T de Student pour séries appariées pour variables quantitatives qui suivent une loi normale (~ effectifs > 30); sinon

test non paramétrique de Wilcoxon.

- comparaisons de moyennes pour >2 groupes non indépendants (séries appariées ~ comparaison dans le temps) =

ANOVA pour mesures répétées pour variables quantitatives qui suivent une loi normale (~ effectifs > 30); sinon test non

paramétrique de Friedman.

2) Tests statistiques pour les variables Qualitativ es :

a) Groupes indépendants :

- pour les variables qualitatives et groupes indépendants, il s'agit du test de chi-deux de Pearson qui n'est valide que si

tous les effectifs calculés sont supérieurs ou égaux à 5 sinon il faut prendre le test exact de Fisher mais il ne se calcule

que pour les tableaux croisés de 2 lignes et 2 colonnes (tableau croisé avec deux variables à 2 modalités ~ 0/1) !!!

Effectifs calculés ~ effectifs attendus (théoriques) sous l’hypothèse nulle c’est-à-dire sous l’hypothèse d’indépendance des deux

variables ! Pour chaque case du tableau croisé :

Effectif calculé = [(Total de la ligne correspondante) x (Total de la colonne correspondante)] / (Total du tableau croisé)

b) Séries appariées (le sujet est son propre témoi n) :

- pour les variables qualitatives et groupes non indépendants, il s'agit du test de Mac-Nemar qui n'est valide que si le

nombre de paires discordantes > 10 sinon aucun test n’est possible !!!