publications02_24
Post on 26-Feb-2018
219 Views
Preview:
TRANSCRIPT
-
7/25/2019 publications02_24
1/50
Introduction du logiciel libre de statistiques :R et R commander
(La version 05/09/2011)
-
7/25/2019 publications02_24
2/50
Prambule
Le but du prsent document de fournir un point de dpart pour des dbutants
intresss R et surtout le package R commander.
R est un systme danalyse statistique et graphique cre par Ross Ihaka et Robert
Gentleman. R est distribu librement sous les termes de la GNU General Public
Licence; son dveloppent et sa distribution assurs par plusieurs statisticiens
rassembls dans le R Development CoreTeam. R est disponible pour WINDOWS,
Macihtosh et UNIX partir du site internet du Comprehensive R Archive Network
(CRAN). Cependant R est assez compliqu pour des dbutants dutilisateurs du
logiciel statistiques. Pour surmonter ce problmes, le package R commander
(Rcmdr) a t dvelopp par Pr. John FOX de luniversit de McMaster au Canada.
Ce manuel prsente des principales utilisations de R commander en utilisant des
donnes de lenqute de lvaluation du Projet de renforcement du Programme de
Prvention du VIH /JICA et Programme National du sida(PNLS) du ministre de la
Sant Publique Madagascar. Si vous intressez ce manuel et des donnes
dexercice et des suggestions, vous adressez au bureau du Projet.
Je vous souhaite un renforcement de capacit de lanalyse en statistiques de PNLS
et des intresss de ce manuel.
Toshiharu OKAYASU
-
7/25/2019 publications02_24
3/50
Tables des matires
Menu de statistiques R Commander (version 1.7.0) ................................................ 4
Installation de R.................................................................................................................. 5
Installation du package R commander Rmdr) et dmarrage........................................ 8
Donnes dans les packages................................................................................................. 9
Importation des donnes................................................................................................... 11
Convertir des variables numriques en facteurs............................................................. 14
Recoder des variables........................................................................................................ 15
Dcouper une variable numrique en classe.................................................................... 17
Les tableaux croiss la main.......................................................................................... 18
Les tableaux croiss en double entre.............................................................................. 19
Tables de contingences avec tableau plusieurs entres................................................ 20
Fusionner des jeux de donnes......................................................................................... 21
Nom des cas....................................................................................................................... 23
Exporter le jeu de donnes actif....................................................................................... 26
Distribution de frquence................................................................................................. 27
Utilisation de Fentre de Script....................................................................................... 28Eliminer les cas contenant des valeurs manquants........................................................ 29
Graphe en camembert....................................................................................................... 31
Graphe en Nuage de points.............................................................................................. 32
Graphe en 3D .................................................................................................................... 33
Test de corrlation............................................................................................................. 34
Test de normalit de Shapiro Wilk................................................................................... 36Test F de deux variances................................................................................................... 38
Test de Welch..................................................................................................................... 39
Test de Wilcoxon bivari Test non paramtrique pour comparer deux moyennes
40
-
7/25/2019 publications02_24
4/50
Menu de statistiques R Commander (version 1.7.0)
Statistiques Rsum -Jeu de donne actif| |-distribution de frquence| |-Dnombrer les observations manquantes| |-Tableau de statistiques| |-Matrice de corrlation| |-Test de corrlation| |-Test de normalit de Shapiro-Wilk
Table de contingences- Tableau de double entre| -Tableau de plusieurs entre| -Remplir et analyser un tableau double entre
Moyennes -T test uni vari
| |-T test indpendant| |-T test apparie| |-ANOVA un facteur| |-ANOVA plusieurs facteurs
Proportions Test de proportion uni-vari| |-Test de proportions bi vari
Variances-Test F de deux variences| |-Test de Bartlett| |-Test de Levene
Tests non paramtriques- Test Wilcoxon bi vari| |-Test Wilcoxon appari| |-Test de Kruskal-wallis| |-Test de somme de rangs de Fridman
Analyse multi vari Fiabilit dchelle| |Analyse en composantes principales| |-Analyse factorielle| |-Classification-Classification pour K-means| |-Classification hirarchique
-
7/25/2019 publications02_24
5/50
Installation de R
Tlchargez R2-13.1-win.exe
(www.r-project.org/)
Double-cliquez sur R-2.13.1-win.exe
Cliquez sur Suivant.
Cliquez sur OK.
Slectionnez la langue
dinstallation.
-
7/25/2019 publications02_24
6/50
Cliquez sur Suivant.
Slectionnez toutes les
options et Cliquez sur
Suivant.
Slectionnez sur Non et
cliquez sur Suivant.
-
7/25/2019 publications02_24
7/50
Note : Quand R se dmarre, il peut vous demander les packages manquants. Vous
allez tlchargez ou vous allez copier et coller des packages manquants dans le
fichier de library.
Quand licne de R est sur votre bureau de lordinateur, cliquez droite etslectionnez la proprit.
Cliquez sur Suivant etattendez la finition
dinstallation.
Cliquez sur Suivant.
-
7/25/2019 publications02_24
8/50
Installation du package R
commander (Rmdr) et dmarrage
Double cliquez sur licne de R sur votre bureau de lordinateur.
Si la connexion internet est disponible, vous pouvez tlcharger un package de
Rcommander.
Packages >Installer le s) package s)
Slectionnezle pays plus
proche, en cas
de
Madagascar,
Afrique de
Sud estrecommand. Slectionnez
Rcmdr et
Cliquez sur
OK
-
7/25/2019 publications02_24
9/50
R Commander sera apparu.
Donnes dans les packages
Quand vous installez R et Rcmdr, certaines donnes de packages aussi ont t
installes en mme temps. Pour voir et utiliser ces donnes, cliquez sur ;
Donnes > Donnes dans les packages > Liste des jeux des donnes dans les
packages
Quand vous mettez le curseur
au coin de la fentre R
Commander, vous changez la
taille de fentre.
Messages seront affichs avec
chaque lopration.
-
7/25/2019 publications02_24
10/50
Donnes > Donnes dans les packages > Lire des jeux des donnes dans les
packages
Slectionnez le package etdonnes.
Mettez le nom de jeu de
donnes
-
7/25/2019 publications02_24
11/50
Importation des donnes
R Commander peut lire des donnes un ficher text(.csv), le presse-papier,
SPSS(.sav), donnes minitab, Excel , Access, dBase.
-
7/25/2019 publications02_24
12/50
Mettez le nom dun jeu de donnes : Par exemple< DRSP_AaG> et cliquez sur OK.
Chercherez vos donnes dans votre ordinateur.
Si vos donnes dAccess qui a plusieurs tableaux, vous devez slectionner un
tableau et cliquez sur OK.
Slectionnez le type de ficher
(Access, Excel) et cliquezsur Ouvrir
-
7/25/2019 publications02_24
13/50
Si vous voulez voir le jeu des donnes, cliquez sur Visualiser.
Rsums des donnes du jeu des donnes
Pour voir des donnes entiers, cliquez sur ;
Statistiques >Rsums >Jeu de donnes actif
R vous demande la continuit, cliquez sur OK.
Dans la fentre de sortie, un rsum sera affich.-Pour des donnes numriques/quantitatives, Min (Minimum), 1st Qu. (PremierQuantile), Median (Mdian), Mean (Moyenne) ,3rd Qu. (Troisime Quantile) , Max
Quand vous cliquez le triangleen bas droite, vous allez voirdautres variables.Note : R va lire des donnesnon entre automatiquementcomme NA ou case vide.
-
7/25/2019 publications02_24
14/50
Note : Certaines donnes sont traites comme numriques au lieu de donnescatgoriques, il faut changer le type de donnes comme Facteurs (donnescatgoriques). Par exemple, le type de ltude, nous voudrions savoir combien pour2008 et combien pour 2011 mais pas Mdian, ni Moyennne. Il faut les changer pourles donnes en facteurs.
Convertir des variables numriques en facteurs
R a deux types de variables ; variables numriques et facteurs.
Note : pour faire le tableau crois, il faut des variables en facteurs pour des donnes
traites.
Donnes > Grer les variables dans le jeu de donnes actif >Convertir des variables
numriques en facteurs
Pour la case de variables, slectionnez sur TYPEETUDE,
-
7/25/2019 publications02_24
15/50
Vous vrifiez le changement avec la fonction de Rsums des donnes du jeu desdonnes
Exercices : vous allez changer le type de donnes pour des dautre donnes.
Recoder des variables
Quand nous voudrions compter le nombre par catgorie avec des donnesnumrique, il faut recoder des variables. Par exemple, on a besoin le nombre desattributions par catgorie au lieu de Moyenne et Mdian.
Donnes > Grer les variables dans le jeu de donnes actif >Recoder des variables
Ecrivez les noms de niveau. Etcliquez sur OK.Note : ici, nous avons crit lesnombres, mais ils vont les traitercomme facteur (catgorie)
-
7/25/2019 publications02_24
16/50
Pour la vrification de recodage, vous cliquez sur Visualiser.
Pour la vrification de changement , cliquez sur ;Statistiques >Rsums >Jeu de donnes actif
Slectionnez une ou desvariables. Ex.ATTRIBUTIONSEt mettez le nouveau nom.Ex.Attribution_categorie.Entrez les directives derecodage. Pour des donnes enfacteurs, il faut ajouter .Et cliquez sur OK.
Donnes recodes seront
apparues la fin de votre
tableau actif.
-
7/25/2019 publications02_24
17/50
Dcouper une variable numrique en classe
Statistiques >Donne>Dcoder une variable numrique en classe
Slectionnez Variables dcouper. Ex. A2 POPTOTALE.Et mettez le nom de la nouvellevariable. Ex. POP11enClasse.Fixez le nombre de classe. Ex.3.Cliquez sur OK.
Mettez des noms des classes,
Cliquez sur OK.
Si vous glissez ce buton, vous
pouvez changer le nombre de
classes.
-
7/25/2019 publications02_24
18/50
Les tableaux croiss la main
Statistiques >Tables de contingence>Remplir et analyser un tableau double
entre
Mettez des noms de variables
dans les case de 1, 2 et deschiffres dans les cases vides.Note : cette fonction est commeSTATCALC dEpi info.
Donnes en classes serontapparues la fin de tableau.
Vous pouvez changer nombre
de lignes et de colonnes en
glissant les buttons.
-
7/25/2019 publications02_24
19/50
Les tableaux croiss en double entre
Statistiques >Tables de contingence>Tableau double entre
Slectionnez une variable enligne. Ex. PROFESSION.Slectionnez une variable encolonne. Ex. POP11en classe.Cliquez sur OK.
Une case de Frquence
Escompt sera moins de 5, vous
couchez sur Test exact de
Ficher.
-
7/25/2019 publications02_24
20/50
Tables de contingences avec tableau plusieurs entres
Statistiques >Tables de contingence>Tableau plusieurs entres
-Slectionnez une variable enligne. Ex. PROFFESSION.
-Slectionnez une variable encolonne Ex. G11Collaboration.-Slectionnez une ou plusieursvariables de contrles. Ex.POPenclasse.NOTE : variables de contrlevont stratifier le tableau 2x2par chaque variable en facteur.
-
7/25/2019 publications02_24
21/50
Fusionner des jeux de donnes
Tous dabord, il faut insrer le jeu de donnes que vous voulez ajouter.
Donnez >Importation des donnes >depuis Excel, Acess ou dBase
Mettez le nom dun jeu de donnes : Par exemple< DRSP_HaN> et cliquez sur OK.
-
7/25/2019 publications02_24
22/50
Donnes > Fusionner des jeux de donnes
Pour la vrification de la fusion des donnes, cliquez sur Visualiser.
-Mettez le nom du tableau dedonnes fusionnes.-Slectionnez le premier jeu etle second jeu-Slectionnez la Fusion descolonnes.-Cliquez sur OK.
-
7/25/2019 publications02_24
23/50
Nom des casDonnes > Jeu de donnes actif > Nom des cas
Note : Quand vous avez fait la de saisie des donnes avec plusieurs tableaux (Access
etc), vous devez utiliser le mme code (ID) pour chaque donnes de tableaux
diffrents. Cependant R va importer des ordres des donnes diffrents que vous
avez fixs avec Access, car la fusion des jeux de donnes fait avec le nom de cas
(row.names), pas le champ commun.Pour que deux ou plusieurs tableaux se fusionner correctement, il faut utiliser la
fonction de .
-
7/25/2019 publications02_24
24/50
-
7/25/2019 publications02_24
25/50
Note pour 1ertableau, ID sera affich comme row.names.
-
7/25/2019 publications02_24
26/50
Exporter le jeu de donnes actif
R peut exporter le jeu de donnes actif en tant que le fiche texte (.txt)Donnes > Donnes de jeu actif > Exporter le jeu de donnes actif
Cliquez sur OK sil y a pas dechangement.
Vous allez indiquer un endroitde sauvegarder des donnes.
-
7/25/2019 publications02_24
27/50
Distribution de frquence
Statistiques > Rsum >Distribution de frquence
Vous peuvez compter des nombres et pourcentage de donnes en facteur et test
dajustement de Chi-Carre.
Slectionnez une ou plusieurs variables.
Si vous voulez faire un Testdajustement au Chi-deux,slectionnez une variable etcochez la case de Testdajustement.
Vous allez dfinir lesprobabilits dhypothse. Pardfaut R peut calculer desprobabilits en fonction de typede donnes.
-
7/25/2019 publications02_24
28/50
Utilisation de Fentre de Script
Si vous connaissez certains script de R comme sum( ) qui signe le total ou la somme,
vous allez directement crire des script directement dans la Utilisation de Fentre
de Script.
sum(nom de jeu de donnes
actif et ajouter $ et ensuite
nom de variable)
Ex.sum(DRSP_AaG$A31ACSB1
PUBF)
Cliquez Soumettre.
Note : si vos variables
contient NA, R ne peut pas
calculer le la somme.
df=Degrs de
Libert
-
7/25/2019 publications02_24
29/50
Eliminer les cas contenant des valeurs manquants
Donnes > Jeu de donnes actif > Eliminer les cas contenant des valeurs
manquants
Dcochez la case de Inclure tout
si vos variables.Slectionnez une variable etmettez le nom du nouveautableau.Quand vous cliquez sur OK, lenouveau tableau sera apparu entant que le jeu de donnes actif.
-
7/25/2019 publications02_24
30/50
-
7/25/2019 publications02_24
31/50
Graphe en camembertGraphe >Graphe en camembert
Slectionnez une variable et cliquez
sur OK.
-
7/25/2019 publications02_24
32/50
Graphe en Nuage de pointsGraphe > Nuage de points
Ligne des moindres carres
Courbe de lissage
Montre ltendue
-
7/25/2019 publications02_24
33/50
Graphe en 3DGraphe >Graphe en 3D> Nuage de points en 3D
Moindre carre linaire
-
7/25/2019 publications02_24
34/50
Test de corrlationStatistique >Rsum > Test de corrlation
Note. Cette exercice est cvec les donnes de table SDSP_AaG de SDSP final.(Access)
En cliquant Ctrl, vous devez slectionner deux variables.
Pour le Type de corrlation, si votre variables sont comme la distribution normale,
vous utilisez Coefficient de Person, si non coeffcient de Sepearman. Taux de Kendall
est moins utilis par rapport de deux mthodes.
Pour Hypothse alternative, vous slectionnez Bilatral.
-
7/25/2019 publications02_24
35/50
points.
Vrifiez sur la ligne des
r Coeficient de corr
0,2 r 0,2 corrlation trs faible
0,4 r 0,2 0,2 0,4corrlation faible
0, 7 r 0,4 0,4 0,7 correlationmoyennement forte
1,0 r 0,7 0,7 1,0corrlation forte
-
7/25/2019 publications02_24
36/50
Test de normalit de Shapiro WilkStatistiques > Rsum > Test de Normalit de Sapiro Wilk
Comme la value de P >0,05(P=0,8718), on ne peut pas dire que cette variable ne suit
pas la distribution normale Si bien que vous utiliser le test paramtrique.
On va vrifier cette distribution avec une graphe
-
7/25/2019 publications02_24
37/50
Le graphe est comme la
distribution normale.
-
7/25/2019 publications02_24
38/50
Test F de deux variancesAvant que deux comparer deux moyennes, vous devez vrifier que variables cibles
suivent la distribution normale (Test de normalit de Sapio Wilk )et les variances
sont gales ou pas (Test F de deux variances) . Nous voudrions comparer les
moyens de temps en tant que le responsable VIH par profession au niveaux de
DRSP.
-
7/25/2019 publications02_24
39/50
Comme le rsultat de F test de Variance, on prend une hypothse alternative, il faut faire le test de Welch.
Test de Welch
Test de Welch est inclus dans t-test indpendant.
Statistiques > Moyennes > T Test indpendant
Nous avons fait le test de
variance (test F de deux
variance) et rsultat est que
variances ne sont pas gales.
Vous cliquez sur NON.
Attention !
Par dfaut, variance gales :
NON.
Quand vous cliquez sur OUI,
R va calculer T Test
indpendant :
-
7/25/2019 publications02_24
40/50
Test de Wilcoxon bivari (Test non paramtrique pour comparer deux
moyennes (Mdians)
Nous voudrions comparer la moyenne de deux groupes de FS (2008 et 2011) pour la
ralisation de dpistage du VIH en 2011.
Cette variable ne se
ressemble avec la distribution
-
7/25/2019 publications02_24
41/50
Le rsultat de test de Sapiro Wilk est
P
-
7/25/2019 publications02_24
42/50
Note : Le test non paramtrique ne montre pas la moyenne mais le mdian car les
variables ne suit pas la distribution normale.
-
7/25/2019 publications02_24
43/50
R commander Personnalis
Vous pouvez personnaliser R commander en modifiant le fichier MyProgramme.R
et le fichier Rcmdr-menus. Si vous ne connaissez pas des programmations ou
Rcmdr, il vaux mieux consulter cette partie quelquun qui connaisse R commander
et/ou programmation. Si vous avez des fichiers de MyProgramme.R et
Rcmdr-menus qui ont dj personnalis, vous les copiez et coller dans le dossier
avec Rpertoire : MyDocement>R>win-library>2.13>Rcmdr>etc ou Programmefiles>R>library>2.13>Rcmdr>etc.
Si vous ouvrerez Rcmdr-meus, le contenu va sapparaitre comme ci-dessous ;
Si vous modifiez Rcmdr-menus, menus peuvent tre chang.
-
7/25/2019 publications02_24
44/50
Avec notre atelier du 29 aout au 2 septembre 2011, nous avons ajout les fonctions
de Somme des donnes,(Statistiques >Ajouter >Sommes des
Donnes) ,Histogramme Stratifi(Graphes >Ajouter > Histogramme Stratifie) ,
Histogramme Stratifi 2(Graphes >Ajouter > Histogramme Stratifie2), Diagramme
de transition individuelle(Graphes >Ajouter >Diagramme de transition
individuelle), Rgression de Cox(Statistiques >Ajustement de Modles >Rgression
de Cox) dans R commander.
-
7/25/2019 publications02_24
45/50
45
ANNEXE : Test statistique de base et R commander
-
7/25/2019 publications02_24
46/50
46
Type de donnes
-
7/25/2019 publications02_24
47/50
47
Schma de test statistique 1
-
7/25/2019 publications02_24
48/50
48
Schma de test statistique 2
-
7/25/2019 publications02_24
49/50
49
Distribution T
-
7/25/2019 publications02_24
50/50
50
Distribution Chi-carre
top related