module 5 modes de codification, darchivage et de traitement des données recueillies pour...
Post on 04-Apr-2015
105 Views
Preview:
TRANSCRIPT
Module 5
Modes de codification, d’archivage et de traitement des données recueillies pour
l’élaboration des indicateurs
Module 5_socio eco1
1
Module 5_socio eco 22
INTRODUCTION AU MODULE 5
Module 5_socio eco33
Les participants sont introduits aux notions et méthodes de dépouillement, de traitement et d'analyse des données socio économiques (codification, saisi des données, tableau de données, archivage et traitement des données, etc.
Objectifs
Les participants ont pris connaissance d'exemples pratiques d'appui et d'illustration
Module 2_socio eco 44
AgendaJOURNEE 2
14h30 Introduction du module 5 et rappel des acquis du module 4 (Durée : 15')
14h45 •Présentation PowerPoint par le formateur : Introduction aux méthodes de dépouillement, de codification de données socio économiques (codification des données, numérique, alpha numérique, saisi des données qualitatives et quantitatives, etc., exemples et méthodes de traitement et d'analyse des données recueillies pour l’élaboration des résultats, etc. (Durée : 25')•Questions/réponses, discussion générale avec modération sur les aspects présentés dans le PowerPoint, synthèse (Durée : 40')•Constitution de groupes (Durée : 10')
16h00 Pause café
5
16h30 Travaux de groupes : exercice sur le saisi et l'analyse des données, (moyenne, médiane, écart type, etc.).
(Durée : 45')
Restitution des résultats, discussions, leçons tirées, enseignements
(Durée : 15')
17h30Synthèse générale : Discussions et harmonisation : Questions/réponses, discussion générale
(Durée : 30')
6Module 5_socio eco 6
PRÉSENTATION POWERPOINT
INTRODUCTION AUX MÉTHODES DE
DÉPOUILLEMENT, DE CODIFICATION ET
D’ANALYSE DE DONNÉES SOCIO ÉCONOMIQUES
7
CODIFICATION DES QUESTIONNAIRES
En quoi consiste une codification ? L’opération de codification consiste à reconvertir le langage ordinaire du questionnaire en un langage qui s’apprête au traitement informatique.
C’est quoi un code ?
Au sens strict un code est un “ dictionnaire des équivalences entre deux langages “ (Le Robert)
Module 5_socio eco
8
CODIFICATION DES QUESTIONNAIRES
Pourquoi un code ?
Rendre possible le traitement et l’analyse numérique de données récoltées surtout
Comment procéder ?
L’opération de codification correspond à un chiffrement, elle consiste à accorder un
chiffre unique à une variable, à une modalité ou une réponse donnée.
Module 5_socio eco
9
CODIFICATION DES QUESTIONNAIRES
Types de codes?
Numérique : composé uniquement de chiffres :
Simple : 1 à nDécimal : 1, 2, 3, …
11, 12, 13, 21, 22, 23, 31, 32, 33,… 111, 112, 121, 122, 131, 132, etc.
Alphanumérique : combine des chiffres et des alphabets, comme par exemple : 12a,
12b, 12c ou A1, A2, A3.Module 5_socio eco
10
CODIFICATION DES QUESTIONNAIRES
Étape de la codification ?
Elle s'effectue en général en deux temps :
Pré codage du questionnaire : Codification préalable des questions fermées et semi fermées
Codage a posteriori : Codification complémentaires après la réalisation des enquêtes sur terrain (Codification des réponses aux questions ouvertes, etc.)
Module 5_socio eco
11
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Module 5_socio eco
Questions fermées
1. L’exploitant recrute-t-il de la main d’œuvre extérieure ? Code : [1. Oui, 2. Non]
En cas de oui
En cas de Non
1
2
12
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Module 5_socio eco
Questions fermées 2. Niveau d’instruction : Code : 1. Analphabète, 2. Ecole primaire, 3. Niveau secondaire, 4.
Niveau supérieur
En cas Analphabète
En cas Ecole primaireEtc….
1
2
13
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Module 5_socio eco
Questions semi fermées Quelle est l’activité secondaire du chef de l'UE ? Code : 1. Agriculture; 2. Élevage; 3. Cueillette; 4. Exploitation du bois; 5. Commerce; 6. Fonctionnaire; 7. Artisanat; 8. Apiculture; 9.Tourisme; 10. Autre
(préciser) :…………… En cas de Agriculture
En cas de ÉlevageEtc.En cas de « autre »
1
2
10
Puis inscrire la réponse
14
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Module 5_socio eco
Questions ouvertes
Quels objectifs en termes de production espérez-vous atteindre à l’issue de la prochaine campagne agricole ? …………………………………………………………………..………………………………………………………………………………………………………………………………………………………………
Le codage est effectué lors de l'opération de dépouillement après avoir cerner les réponses et les grouper, après quoi un code leur sera accordé.
CODIFICATION DES QUESTIONNAIRES
Exemples pratiquesQuestions ouvertes
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
15
Exemple : si, pour un échantillon de 50 individus, les réponses à la question se présentent comme suit : Augmenter la production : 25 individus Améliorer la qualité : 10 individus Accroître la part de la production biologique : 8
individus Diverses réponses différentes pour les 7 restants
Le code sera par exemple le suivant : 1. Augmenter la production, 2. Améliorer la qualité, 3. Accroître la part de la production biologique, 4. autres
Questions ouvertes
CODIFICATION DES QUESTIONNAIRES
Exemples pratiquesÉclater en deux diapo
16
DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES
DépouillementEnsemble d'opérations de vérification et d'épuration des questionnaires, de
finalisation de la codification
Cas simples d'échantillon réduit
un traitement manuel permet de faire ressortir les résultats et leur interprétation.
Cas pratiques de grandes enquêtes
Le dépouillement
informatique est une nécessaire.
17
DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES
Transcription sur tableau des données Le tableau de données est une matrice (tableau à double entrée) constitué de n lignes (individus) et m colonnes (caractères)
CaractèresN Individus
V1 V2 … Vj …..
Vm M caractères
Ind. 1
…….
Ind. i
…..
Ind. n
18
DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES
Transcription sur tableau des données
Exemple simple CaractèresIndividus
Age**(Années)
Activité principale*
Superficie (Ha)**
……
1 65 20 0,4 …
2 40 21 1,5 …
3 30 21 0,8 …
4 83 21 2,0 …
……. ……. ……. ……. …
* Variables qualitative, ** Variables quantitatives
19
DÉPOUILLEMENT ET TRANSCRIPTION SUR TABLEAU DES DONNÉES
Transcription sur tableau des données
Saisie et apurement des données
Après la saisie des données, procéder à la vérification des erreurs et de la validité des données introduite dans une opération d'apurement.
L'apurement éviterait d'obtenir des résultats aberrants dont l'interprétation pourrait induire le spécialiste en erreur.
20
Individus
<
Caractères
<
EXEMPLE DE TABLEAU DE DONNÉES : PROGRAMME ROSELT/OSS (EXTRAIT DU TABLEAU DE DONNÉES SUR EXCEL DE L'ENQUÊTE NIVEAU 2 (UE)
Cas de l’observatoire de MH, IRA, Tunisie
21
EXEMPLE DE TABLEAU DE DONNÉES TABLEAU FORMAT SPSS (Cas de l’observatoire de MH, IRA, Tunisie)
Individus
<
Caractères
<
22
TRAITEMENT ET ANALYSE DES DONNÉES
Quand l’opération de T&A des données pourra être entamée ?
Après avoir été rassuré de la fiabilité du tableau à la suite de l’apurement.
Dans la pratique des itérations entre dépouillement et traitement des données s'avèrent parfois nécessaires (résultats douteux ou incompatibles)
Donc, des corrections ultimes sont apportées dans le tableau de données.
Module 5_socio eco
23
TRAITEMENT ET ANALYSE DES DONNÉES
Deux grandes catégories de T&A des données (selon les besoins de l'approche
méthodologique adoptée) :
Analyse générale ou tri à plat
Analyses complexes exigeant la maîtrise de la modélisation et/ou de l'économétrie
Module 5_socio eco
24
TRAITEMENT ET ANALYSE DES DONNÉES
Analyse générale ou tri à plat
Module 5_socio eco
Deux grandes familles d'analyse :
Cas des variables qualitatives
Cas des variables quantitatives
25
TRAITEMENT ET ANALYSE DES DONNÉES
Analyse de fréquences
Module 5_socio eco
Fréquence : Nombre de fois le cas est présent
Pourcentage :
Pourcentage cumulé : Somme des pourcentages précédents
100)néchantillol’ de totalNombre
présent est cas le fois de Nombre( X
Cas des variables qualitatives
26
TRAITEMENT ET ANALYSE DES DONNÉES
Module 5_socio eco
Exemple : Résultats des analyses des fréquences de la variable « niveau d'instruction »
Variables
Fréquence PourcentagePourcentage
Cumulé
Analphabète 9 36.0 36.0
Koutteb (Ecole coranique) 3 12.0 48.0
Ecole primaire 11 44.0 92.0
Niveau secondaire 2 8.0 100.0
Total 25 100.0
27
TRAITEMENT ET ANALYSE DES DONNÉES
Module 5_socio eco
Représentations graphiques
Histogramme de fréquences avec la courbe de la loi normale
Secteurs ou Fromage
28
TRAITEMENT ET ANALYSE DES DONNÉES
Analyses descriptives
Module 5_socio eco
Cas des variables quantitativesJe pense qu’il est important de faire une diapo pour chaque param. Avec formule et intérêt
29
TRAITEMENT ET ANALYSE DES DONNÉES
Analyses descriptives
Module 5_socio eco
Cas des variables quantitatives
La moyenne : la moyenne arithmétique, que l’on se contente généralement d’appeler moyenne tout court, se calcule de la manière suivante :
1 2 3 ... ....i nX X X X XX
n
où X1 , X2 , X3, …, Xn sont les valeurs successives de la variable envisagée, et n le nombre total d’observations.
iXXn
X se lit "x barre"
Module 5_socio eco 30
Distribution de fréquences
1 1 2 2 .... ....i i n nF X F X F X F XX
n
i iF X
Xn
Exemple : Soient les âges observés dans une classe d’école primaire. L’âge moyen des enfants sera de
1*8 14*9 11*10 3*11 1*12
30X
La moyenne = 9,6 ans ou 9ans 8mois.Il y a en effet 30 observations au total, correspondant à l’effectif des 30 élèves de la classe.
Module 5_socio eco 31
La variance et écart-type : la variance est égale à la somme des carrés des écarts à la moyenne rapportée à l’effectif de la population. L’écart-type est la racine carrée de la variance.
22 ( )
ou n-1
f x x
n
2( )
ou n-1
f x x
n
L’écart-
type :
La variance.
32
La médiane : la médiane est le paramètre qui divise la distribution en deux parties égales. Dans une distribution simple, si le nombre d’observations est impair, il n’y a aucun calcul à effectuer. Soit, pour 7 entreprises d’une région donnée, les effectifs de leurs personnels respectifs : 15 25 66 74 87 194 432.La médiane de la distribution est la 4iéme observation, soit 74. De part et d’autre de 74, en effet, il y a 3 observations. Si le nombre d’observations est pair la médiane correspond à la moyenne arithmétique des deux observations centrales.
33
TRAITEMENT ET ANALYSE DES DONNÉES
Module 5_socio eco
Exemple : Analyse descriptive de 3 variables quantitatives :
a. Tableau de données et commande des analyse sur SPSS
Variables analysées Analyses
demandées
34
TRAITEMENT ET ANALYSE DES DONNÉES
Module 5_socio eco
b. Tableau des résultats des analyses descriptives (ha)
Min Max Somme MoyenneÉcart type
Médiane
Superficie totale des terres privées 2 80 819 23 20 20
Superficie arboricole totale 0 52 503 14 13 10Superficie totale des cultures annuelles
0 74 420 12 17 5
3535
Fin de la présentation
Merci pour votre attention
36
Pause-café
Module 5_socio eco
Module 5_socio eco 3737
TRAVAUX DE GROUPES DES PARTICIPANTS:
EXERCICE CODIFICATION, SAISI ET ANALYSE DES
DONNÉES QUALITATIVES ET QUANTITATIVES
Travail en 2 groupes
38
Termes de références pour les travaux de groupes
Objectif Exercice et apprentissage des participants à la codification, le saisi et l’analyse des données qualitatives et quantitatives
Durée : 45 minutes
39
ORGANISATION Les participants sont organisés en 2 groupes de travail.
Le support est constitué des questionnaires de l'exercice du module 4 (il faut insister lors de l'exercice du M4 sur les questions V et IX dans l'extrait du questionnaire, de bien soigner ces parties qui devront servir l'exercice du M5 en continuation).
Groupe 1
Le groupe 1 est chargé de la codification, saisi et analyse des variables qualitatives.
Les supports sont constitués par l'ensemble des questionnaires remplis lors du module 1,
Il prendra comme exercice la question :
V. IDENTIFICATION DE L’ACTIVITE PRINCIPALE (PAGES 2 ET 3 DANS LE QUESTIONNAIRE)
40
Groupe 2
Le groupe 2 est chargé de la codification, saisi et analyse des variables quantitatives.
Les supports sont constitués par l'ensemble des questionnaires remplis lors du module 4,
Il prendra comme exercice la question :IX. FORMATION DES REVENUS DE L’UE
(PAGES 5 ET 6 DANS LE QUESTIONNAIRE)
41
TÂCHES DE CHAQUE GROUPE
Rassemblement des questionnaires auprès des binômes,
Extrait des pages correspondantes aux travaux du groupe (groupe 1 pages 2 et 3, groupe 2 : pages 5 et 6)
Dépouillement des données
Vérification des questionnaires, (bien remplis, données manquantes, retour aux enquêtés, etc.)
42
Vérification des codes pré établis et codage des questions ouvertes éventuellement
Constitution du tableau des données et saisi des informations
Analyses pertinentes par type de variables
Evaluation des résultats obtenus
Restitution de l'exercice, enseignements tirés, difficultés etc.
Valorisation du document d'appui relatif aux résultats obtenus par l'équipe de l'ira pour le cas de l'observatoire de menzel habib relatif aux questions traitées.
4343
Fin de la présentation
Merci pour votre attention
Module 5_socio eco 4444
RESTITUTION PAR LES RAPPORTEURS DES TRAVAUX DE
GROUPES
Module 5_socio eco 4545
DISCUSSION GÉNÉRALE :
DIFFICULTÉS, LEÇONS TIRÉES
top related