publications02_24

Upload: amelie-chloe

Post on 26-Feb-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 publications02_24

    1/50

    Introduction du logiciel libre de statistiques :R et R commander

    (La version 05/09/2011)

  • 7/25/2019 publications02_24

    2/50

    Prambule

    Le but du prsent document de fournir un point de dpart pour des dbutants

    intresss R et surtout le package R commander.

    R est un systme danalyse statistique et graphique cre par Ross Ihaka et Robert

    Gentleman. R est distribu librement sous les termes de la GNU General Public

    Licence; son dveloppent et sa distribution assurs par plusieurs statisticiens

    rassembls dans le R Development CoreTeam. R est disponible pour WINDOWS,

    Macihtosh et UNIX partir du site internet du Comprehensive R Archive Network

    (CRAN). Cependant R est assez compliqu pour des dbutants dutilisateurs du

    logiciel statistiques. Pour surmonter ce problmes, le package R commander

    (Rcmdr) a t dvelopp par Pr. John FOX de luniversit de McMaster au Canada.

    Ce manuel prsente des principales utilisations de R commander en utilisant des

    donnes de lenqute de lvaluation du Projet de renforcement du Programme de

    Prvention du VIH /JICA et Programme National du sida(PNLS) du ministre de la

    Sant Publique Madagascar. Si vous intressez ce manuel et des donnes

    dexercice et des suggestions, vous adressez au bureau du Projet.

    Je vous souhaite un renforcement de capacit de lanalyse en statistiques de PNLS

    et des intresss de ce manuel.

    Toshiharu OKAYASU

  • 7/25/2019 publications02_24

    3/50

    Tables des matires

    Menu de statistiques R Commander (version 1.7.0) ................................................ 4

    Installation de R.................................................................................................................. 5

    Installation du package R commander Rmdr) et dmarrage........................................ 8

    Donnes dans les packages................................................................................................. 9

    Importation des donnes................................................................................................... 11

    Convertir des variables numriques en facteurs............................................................. 14

    Recoder des variables........................................................................................................ 15

    Dcouper une variable numrique en classe.................................................................... 17

    Les tableaux croiss la main.......................................................................................... 18

    Les tableaux croiss en double entre.............................................................................. 19

    Tables de contingences avec tableau plusieurs entres................................................ 20

    Fusionner des jeux de donnes......................................................................................... 21

    Nom des cas....................................................................................................................... 23

    Exporter le jeu de donnes actif....................................................................................... 26

    Distribution de frquence................................................................................................. 27

    Utilisation de Fentre de Script....................................................................................... 28Eliminer les cas contenant des valeurs manquants........................................................ 29

    Graphe en camembert....................................................................................................... 31

    Graphe en Nuage de points.............................................................................................. 32

    Graphe en 3D .................................................................................................................... 33

    Test de corrlation............................................................................................................. 34

    Test de normalit de Shapiro Wilk................................................................................... 36Test F de deux variances................................................................................................... 38

    Test de Welch..................................................................................................................... 39

    Test de Wilcoxon bivari Test non paramtrique pour comparer deux moyennes

    40

  • 7/25/2019 publications02_24

    4/50

    Menu de statistiques R Commander (version 1.7.0)

    Statistiques Rsum -Jeu de donne actif| |-distribution de frquence| |-Dnombrer les observations manquantes| |-Tableau de statistiques| |-Matrice de corrlation| |-Test de corrlation| |-Test de normalit de Shapiro-Wilk

    Table de contingences- Tableau de double entre| -Tableau de plusieurs entre| -Remplir et analyser un tableau double entre

    Moyennes -T test uni vari

    | |-T test indpendant| |-T test apparie| |-ANOVA un facteur| |-ANOVA plusieurs facteurs

    Proportions Test de proportion uni-vari| |-Test de proportions bi vari

    Variances-Test F de deux variences| |-Test de Bartlett| |-Test de Levene

    Tests non paramtriques- Test Wilcoxon bi vari| |-Test Wilcoxon appari| |-Test de Kruskal-wallis| |-Test de somme de rangs de Fridman

    Analyse multi vari Fiabilit dchelle| |Analyse en composantes principales| |-Analyse factorielle| |-Classification-Classification pour K-means| |-Classification hirarchique

  • 7/25/2019 publications02_24

    5/50

    Installation de R

    Tlchargez R2-13.1-win.exe

    (www.r-project.org/)

    Double-cliquez sur R-2.13.1-win.exe

    Cliquez sur Suivant.

    Cliquez sur OK.

    Slectionnez la langue

    dinstallation.

  • 7/25/2019 publications02_24

    6/50

    Cliquez sur Suivant.

    Slectionnez toutes les

    options et Cliquez sur

    Suivant.

    Slectionnez sur Non et

    cliquez sur Suivant.

  • 7/25/2019 publications02_24

    7/50

    Note : Quand R se dmarre, il peut vous demander les packages manquants. Vous

    allez tlchargez ou vous allez copier et coller des packages manquants dans le

    fichier de library.

    Quand licne de R est sur votre bureau de lordinateur, cliquez droite etslectionnez la proprit.

    Cliquez sur Suivant etattendez la finition

    dinstallation.

    Cliquez sur Suivant.

  • 7/25/2019 publications02_24

    8/50

    Installation du package R

    commander (Rmdr) et dmarrage

    Double cliquez sur licne de R sur votre bureau de lordinateur.

    Si la connexion internet est disponible, vous pouvez tlcharger un package de

    Rcommander.

    Packages >Installer le s) package s)

    Slectionnezle pays plus

    proche, en cas

    de

    Madagascar,

    Afrique de

    Sud estrecommand. Slectionnez

    Rcmdr et

    Cliquez sur

    OK

  • 7/25/2019 publications02_24

    9/50

    R Commander sera apparu.

    Donnes dans les packages

    Quand vous installez R et Rcmdr, certaines donnes de packages aussi ont t

    installes en mme temps. Pour voir et utiliser ces donnes, cliquez sur ;

    Donnes > Donnes dans les packages > Liste des jeux des donnes dans les

    packages

    Quand vous mettez le curseur

    au coin de la fentre R

    Commander, vous changez la

    taille de fentre.

    Messages seront affichs avec

    chaque lopration.

  • 7/25/2019 publications02_24

    10/50

    Donnes > Donnes dans les packages > Lire des jeux des donnes dans les

    packages

    Slectionnez le package etdonnes.

    Mettez le nom de jeu de

    donnes

  • 7/25/2019 publications02_24

    11/50

    Importation des donnes

    R Commander peut lire des donnes un ficher text(.csv), le presse-papier,

    SPSS(.sav), donnes minitab, Excel , Access, dBase.

  • 7/25/2019 publications02_24

    12/50

    Mettez le nom dun jeu de donnes : Par exemple< DRSP_AaG> et cliquez sur OK.

    Chercherez vos donnes dans votre ordinateur.

    Si vos donnes dAccess qui a plusieurs tableaux, vous devez slectionner un

    tableau et cliquez sur OK.

    Slectionnez le type de ficher

    (Access, Excel) et cliquezsur Ouvrir

  • 7/25/2019 publications02_24

    13/50

    Si vous voulez voir le jeu des donnes, cliquez sur Visualiser.

    Rsums des donnes du jeu des donnes

    Pour voir des donnes entiers, cliquez sur ;

    Statistiques >Rsums >Jeu de donnes actif

    R vous demande la continuit, cliquez sur OK.

    Dans la fentre de sortie, un rsum sera affich.-Pour des donnes numriques/quantitatives, Min (Minimum), 1st Qu. (PremierQuantile), Median (Mdian), Mean (Moyenne) ,3rd Qu. (Troisime Quantile) , Max

    Quand vous cliquez le triangleen bas droite, vous allez voirdautres variables.Note : R va lire des donnesnon entre automatiquementcomme NA ou case vide.

  • 7/25/2019 publications02_24

    14/50

    Note : Certaines donnes sont traites comme numriques au lieu de donnescatgoriques, il faut changer le type de donnes comme Facteurs (donnescatgoriques). Par exemple, le type de ltude, nous voudrions savoir combien pour2008 et combien pour 2011 mais pas Mdian, ni Moyennne. Il faut les changer pourles donnes en facteurs.

    Convertir des variables numriques en facteurs

    R a deux types de variables ; variables numriques et facteurs.

    Note : pour faire le tableau crois, il faut des variables en facteurs pour des donnes

    traites.

    Donnes > Grer les variables dans le jeu de donnes actif >Convertir des variables

    numriques en facteurs

    Pour la case de variables, slectionnez sur TYPEETUDE,

  • 7/25/2019 publications02_24

    15/50

    Vous vrifiez le changement avec la fonction de Rsums des donnes du jeu desdonnes

    Exercices : vous allez changer le type de donnes pour des dautre donnes.

    Recoder des variables

    Quand nous voudrions compter le nombre par catgorie avec des donnesnumrique, il faut recoder des variables. Par exemple, on a besoin le nombre desattributions par catgorie au lieu de Moyenne et Mdian.

    Donnes > Grer les variables dans le jeu de donnes actif >Recoder des variables

    Ecrivez les noms de niveau. Etcliquez sur OK.Note : ici, nous avons crit lesnombres, mais ils vont les traitercomme facteur (catgorie)

  • 7/25/2019 publications02_24

    16/50

    Pour la vrification de recodage, vous cliquez sur Visualiser.

    Pour la vrification de changement , cliquez sur ;Statistiques >Rsums >Jeu de donnes actif

    Slectionnez une ou desvariables. Ex.ATTRIBUTIONSEt mettez le nouveau nom.Ex.Attribution_categorie.Entrez les directives derecodage. Pour des donnes enfacteurs, il faut ajouter .Et cliquez sur OK.

    Donnes recodes seront

    apparues la fin de votre

    tableau actif.

  • 7/25/2019 publications02_24

    17/50

    Dcouper une variable numrique en classe

    Statistiques >Donne>Dcoder une variable numrique en classe

    Slectionnez Variables dcouper. Ex. A2 POPTOTALE.Et mettez le nom de la nouvellevariable. Ex. POP11enClasse.Fixez le nombre de classe. Ex.3.Cliquez sur OK.

    Mettez des noms des classes,

    Cliquez sur OK.

    Si vous glissez ce buton, vous

    pouvez changer le nombre de

    classes.

  • 7/25/2019 publications02_24

    18/50

    Les tableaux croiss la main

    Statistiques >Tables de contingence>Remplir et analyser un tableau double

    entre

    Mettez des noms de variables

    dans les case de 1, 2 et deschiffres dans les cases vides.Note : cette fonction est commeSTATCALC dEpi info.

    Donnes en classes serontapparues la fin de tableau.

    Vous pouvez changer nombre

    de lignes et de colonnes en

    glissant les buttons.

  • 7/25/2019 publications02_24

    19/50

    Les tableaux croiss en double entre

    Statistiques >Tables de contingence>Tableau double entre

    Slectionnez une variable enligne. Ex. PROFESSION.Slectionnez une variable encolonne. Ex. POP11en classe.Cliquez sur OK.

    Une case de Frquence

    Escompt sera moins de 5, vous

    couchez sur Test exact de

    Ficher.

  • 7/25/2019 publications02_24

    20/50

    Tables de contingences avec tableau plusieurs entres

    Statistiques >Tables de contingence>Tableau plusieurs entres

    -Slectionnez une variable enligne. Ex. PROFFESSION.

    -Slectionnez une variable encolonne Ex. G11Collaboration.-Slectionnez une ou plusieursvariables de contrles. Ex.POPenclasse.NOTE : variables de contrlevont stratifier le tableau 2x2par chaque variable en facteur.

  • 7/25/2019 publications02_24

    21/50

    Fusionner des jeux de donnes

    Tous dabord, il faut insrer le jeu de donnes que vous voulez ajouter.

    Donnez >Importation des donnes >depuis Excel, Acess ou dBase

    Mettez le nom dun jeu de donnes : Par exemple< DRSP_HaN> et cliquez sur OK.

  • 7/25/2019 publications02_24

    22/50

    Donnes > Fusionner des jeux de donnes

    Pour la vrification de la fusion des donnes, cliquez sur Visualiser.

    -Mettez le nom du tableau dedonnes fusionnes.-Slectionnez le premier jeu etle second jeu-Slectionnez la Fusion descolonnes.-Cliquez sur OK.

  • 7/25/2019 publications02_24

    23/50

    Nom des casDonnes > Jeu de donnes actif > Nom des cas

    Note : Quand vous avez fait la de saisie des donnes avec plusieurs tableaux (Access

    etc), vous devez utiliser le mme code (ID) pour chaque donnes de tableaux

    diffrents. Cependant R va importer des ordres des donnes diffrents que vous

    avez fixs avec Access, car la fusion des jeux de donnes fait avec le nom de cas

    (row.names), pas le champ commun.Pour que deux ou plusieurs tableaux se fusionner correctement, il faut utiliser la

    fonction de .

  • 7/25/2019 publications02_24

    24/50

  • 7/25/2019 publications02_24

    25/50

    Note pour 1ertableau, ID sera affich comme row.names.

  • 7/25/2019 publications02_24

    26/50

    Exporter le jeu de donnes actif

    R peut exporter le jeu de donnes actif en tant que le fiche texte (.txt)Donnes > Donnes de jeu actif > Exporter le jeu de donnes actif

    Cliquez sur OK sil y a pas dechangement.

    Vous allez indiquer un endroitde sauvegarder des donnes.

  • 7/25/2019 publications02_24

    27/50

    Distribution de frquence

    Statistiques > Rsum >Distribution de frquence

    Vous peuvez compter des nombres et pourcentage de donnes en facteur et test

    dajustement de Chi-Carre.

    Slectionnez une ou plusieurs variables.

    Si vous voulez faire un Testdajustement au Chi-deux,slectionnez une variable etcochez la case de Testdajustement.

    Vous allez dfinir lesprobabilits dhypothse. Pardfaut R peut calculer desprobabilits en fonction de typede donnes.

  • 7/25/2019 publications02_24

    28/50

    Utilisation de Fentre de Script

    Si vous connaissez certains script de R comme sum( ) qui signe le total ou la somme,

    vous allez directement crire des script directement dans la Utilisation de Fentre

    de Script.

    sum(nom de jeu de donnes

    actif et ajouter $ et ensuite

    nom de variable)

    Ex.sum(DRSP_AaG$A31ACSB1

    PUBF)

    Cliquez Soumettre.

    Note : si vos variables

    contient NA, R ne peut pas

    calculer le la somme.

    df=Degrs de

    Libert

  • 7/25/2019 publications02_24

    29/50

    Eliminer les cas contenant des valeurs manquants

    Donnes > Jeu de donnes actif > Eliminer les cas contenant des valeurs

    manquants

    Dcochez la case de Inclure tout

    si vos variables.Slectionnez une variable etmettez le nom du nouveautableau.Quand vous cliquez sur OK, lenouveau tableau sera apparu entant que le jeu de donnes actif.

  • 7/25/2019 publications02_24

    30/50

  • 7/25/2019 publications02_24

    31/50

    Graphe en camembertGraphe >Graphe en camembert

    Slectionnez une variable et cliquez

    sur OK.

  • 7/25/2019 publications02_24

    32/50

    Graphe en Nuage de pointsGraphe > Nuage de points

    Ligne des moindres carres

    Courbe de lissage

    Montre ltendue

  • 7/25/2019 publications02_24

    33/50

    Graphe en 3DGraphe >Graphe en 3D> Nuage de points en 3D

    Moindre carre linaire

  • 7/25/2019 publications02_24

    34/50

    Test de corrlationStatistique >Rsum > Test de corrlation

    Note. Cette exercice est cvec les donnes de table SDSP_AaG de SDSP final.(Access)

    En cliquant Ctrl, vous devez slectionner deux variables.

    Pour le Type de corrlation, si votre variables sont comme la distribution normale,

    vous utilisez Coefficient de Person, si non coeffcient de Sepearman. Taux de Kendall

    est moins utilis par rapport de deux mthodes.

    Pour Hypothse alternative, vous slectionnez Bilatral.

  • 7/25/2019 publications02_24

    35/50

    points.

    Vrifiez sur la ligne des

    r Coeficient de corr

    0,2 r 0,2 corrlation trs faible

    0,4 r 0,2 0,2 0,4corrlation faible

    0, 7 r 0,4 0,4 0,7 correlationmoyennement forte

    1,0 r 0,7 0,7 1,0corrlation forte

  • 7/25/2019 publications02_24

    36/50

    Test de normalit de Shapiro WilkStatistiques > Rsum > Test de Normalit de Sapiro Wilk

    Comme la value de P >0,05(P=0,8718), on ne peut pas dire que cette variable ne suit

    pas la distribution normale Si bien que vous utiliser le test paramtrique.

    On va vrifier cette distribution avec une graphe

  • 7/25/2019 publications02_24

    37/50

    Le graphe est comme la

    distribution normale.

  • 7/25/2019 publications02_24

    38/50

    Test F de deux variancesAvant que deux comparer deux moyennes, vous devez vrifier que variables cibles

    suivent la distribution normale (Test de normalit de Sapio Wilk )et les variances

    sont gales ou pas (Test F de deux variances) . Nous voudrions comparer les

    moyens de temps en tant que le responsable VIH par profession au niveaux de

    DRSP.

  • 7/25/2019 publications02_24

    39/50

    Comme le rsultat de F test de Variance, on prend une hypothse alternative, il faut faire le test de Welch.

    Test de Welch

    Test de Welch est inclus dans t-test indpendant.

    Statistiques > Moyennes > T Test indpendant

    Nous avons fait le test de

    variance (test F de deux

    variance) et rsultat est que

    variances ne sont pas gales.

    Vous cliquez sur NON.

    Attention !

    Par dfaut, variance gales :

    NON.

    Quand vous cliquez sur OUI,

    R va calculer T Test

    indpendant :

  • 7/25/2019 publications02_24

    40/50

    Test de Wilcoxon bivari (Test non paramtrique pour comparer deux

    moyennes (Mdians)

    Nous voudrions comparer la moyenne de deux groupes de FS (2008 et 2011) pour la

    ralisation de dpistage du VIH en 2011.

    Cette variable ne se

    ressemble avec la distribution

  • 7/25/2019 publications02_24

    41/50

    Le rsultat de test de Sapiro Wilk est

    P

  • 7/25/2019 publications02_24

    42/50

    Note : Le test non paramtrique ne montre pas la moyenne mais le mdian car les

    variables ne suit pas la distribution normale.

  • 7/25/2019 publications02_24

    43/50

    R commander Personnalis

    Vous pouvez personnaliser R commander en modifiant le fichier MyProgramme.R

    et le fichier Rcmdr-menus. Si vous ne connaissez pas des programmations ou

    Rcmdr, il vaux mieux consulter cette partie quelquun qui connaisse R commander

    et/ou programmation. Si vous avez des fichiers de MyProgramme.R et

    Rcmdr-menus qui ont dj personnalis, vous les copiez et coller dans le dossier

    avec Rpertoire : MyDocement>R>win-library>2.13>Rcmdr>etc ou Programmefiles>R>library>2.13>Rcmdr>etc.

    Si vous ouvrerez Rcmdr-meus, le contenu va sapparaitre comme ci-dessous ;

    Si vous modifiez Rcmdr-menus, menus peuvent tre chang.

  • 7/25/2019 publications02_24

    44/50

    Avec notre atelier du 29 aout au 2 septembre 2011, nous avons ajout les fonctions

    de Somme des donnes,(Statistiques >Ajouter >Sommes des

    Donnes) ,Histogramme Stratifi(Graphes >Ajouter > Histogramme Stratifie) ,

    Histogramme Stratifi 2(Graphes >Ajouter > Histogramme Stratifie2), Diagramme

    de transition individuelle(Graphes >Ajouter >Diagramme de transition

    individuelle), Rgression de Cox(Statistiques >Ajustement de Modles >Rgression

    de Cox) dans R commander.

  • 7/25/2019 publications02_24

    45/50

    45

    ANNEXE : Test statistique de base et R commander

  • 7/25/2019 publications02_24

    46/50

    46

    Type de donnes

  • 7/25/2019 publications02_24

    47/50

    47

    Schma de test statistique 1

  • 7/25/2019 publications02_24

    48/50

    48

    Schma de test statistique 2

  • 7/25/2019 publications02_24

    49/50

    49

    Distribution T

  • 7/25/2019 publications02_24

    50/50

    50

    Distribution Chi-carre