“datation des événements dans un questionnaire et gestion...

62
Jean RENAUD et Alain CARPENTIER (1993) “Datation des événements dans un questionnaire et gestion de la base de données.” LES CLASSIQUES DES SCIENCES SOCIALES

Upload: others

Post on 24-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

Jean RENAUDet Alain CARPENTIER

(1993)

“Datation des événementsdans un questionnaire et

gestion de la base de données.”

LES CLASSIQUES DES SCIENCES SOCIALESCHICOUTIMI, QUÉBEChttp://classiques.uqac.ca/

Page 2: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 2

http://classiques.uqac.ca/

Les Classiques des sciences sociales est une bibliothèque numérique en libre accès, fondée au Cégep de Chicoutimi en 1993 et développée en partenariat avec l’Université du Québec à Chicoutimi (UQÀC) de-puis 2000.

http://bibliotheque.uqac.ca/

En 2018, Les Classiques des sciences sociales fêteront leur 25e anni-versaire de fondation. Une belle initiative citoyenne.

Page 3: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 3

Politique d'utilisationde la bibliothèque des Classiques

Toute reproduction et rediffusion de nos fichiers est interdite, même avec la mention de leur provenance, sans l’autorisation for-melle, écrite, du fondateur des Classiques des sciences sociales, Jean-Marie Tremblay, sociologue.

Les fichiers des Classiques des sciences sociales ne peuvent sans autorisation formelle:

- être hébergés (en fichier ou page web, en totalité ou en partie) sur un serveur autre que celui des Classiques.

- servir de base de travail à un autre fichier modifié ensuite par tout autre moyen (couleur, police, mise en page, extraits, support, etc...),

Les fichiers (.html, .doc, .pdf, .rtf, .jpg, .gif) disponibles sur le site Les Classiques des sciences sociales sont la propriété des Classiques des sciences sociales, un organisme à but non lucratif composé exclu-sivement de bénévoles.

Ils sont disponibles pour une utilisation intellectuelle et personnelle et, en aucun cas, commerciale. Toute utilisation à des fins commer-ciales des fichiers sur ce site est strictement interdite et toute rediffu-sion est également strictement interdite.

L'accès à notre travail est libre et gratuit à tous les utilisateurs. C'est notre mission.

Jean-Marie Tremblay, sociologueFondateur et Président-directeur général,LES CLASSIQUES DES SCIENCES SOCIALES.

Page 4: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 4

Un document produit en version numérique par Réjeanne Toussaint, bénévole, Chomedey, Ville Laval, Qc. courriel: [email protected] web dans Les Classiques des sciences sociales :http://classiques.uqac.ca/inter/benevoles_equipe/liste_toussaint_rejeanne.html à partir du texte de :

Jean Renaud et Alain Carpentier

“Datation des événements dans un questionnaire et gestion de la base de données.”

In ouvrage sous la direction de André TURMEL, avec la collaboration de Claude Bariteau et Gilles Pronovost, Chantiers sociologiques et anthropologiques. Actes du 58e colloque de l’ACSALF 1990, pp 231-260. Montréal : Les Éditions du Méridien, 1993, 274 pp.

La présidente de l’ACSALF, Mme Marguerite Soulière, nous a accordé le 20 août 2018 l’autorisation de diffuser en accès libre à tous ce livre dans Les Clas-siques des sciences sociales.

Courriels : La présidente de l’ACSALF, Marguerite Soulière : professeure, École de Service sociale, Université d’Ottawa : [email protected] André Turmel : [email protected] Gilles Pronovost : [email protected] Jean Renaud : [email protected]

Police de caractères utilisés :

Pour le texte: Times New Roman, 14 points.Pour les notes de bas de page : Times New Roman, 12 points.

Édition électronique réalisée avec le traitement de textes Microsoft Word 2008 pour Macintosh.

Mise en page sur papier format : LETTRE US, 8.5’’ x 11’’.

Édition numérique réalisée le 22 juin 2020 à Chicoutimi, Québec.

Page 5: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 5

Jean Renaud et Alain Carpentier

“Datation des événements dans un questionnaireet gestion de la base de données.”

In ouvrage sous la direction de André TURMEL, avec la collaboration de Claude Bariteau et Gilles Pronovost, Chantiers sociologiques et anthropologiques. Actes du 58e colloque de l’ACSALF 1990, pp 231-260. Montréal : Les Éditions du Méridien, 1993, 274 pp.

Page 6: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 6

La présidente de l’ACSALF, Mme Marguerite Soulière, nous a accordé le 20 août 2018 l’autorisation de diffuser en accès libre à tous ce livre dans Les Clas-siques des sciences sociales.

Courriel :

La présidente de l’ACSALF, Marguerite Soulière : professeure, École de Service sociale, Université d’Ottawa : [email protected]

Page 7: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 7

Note pour la version numérique : La numérotation entre crochets [] correspond à la pagination, en début de page, de l'édition d'origine numérisée. JMT.

Par exemple, [1] correspond au début de la page 1 de l’édition papier numérisée.

Page 8: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 8

[231]

Chantiers sociologiques et anthropologiques.Actes du 58e colloque de l’ACSALF 1990.

“Datation des événementsdans un questionnaire et

gestion de la base de données.”Par Jean RENAUD et Alain CARPENTIER

[232]

Page 9: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 9

[233]

L’avantage de la datation des données

Depuis 1972 (et de façon beaucoup plus marquée depuis 1980) s’est développée une nouvelle classe de modèles d’analyse statistique connue en anglais sous le nom de « Event History Analysis » et qu’on pourrait nommer en français l’analyse du changement d’état ou l’étude des déterminants du changement, ou encore, l’analyse de bio-graphies. Ce développement qui a sa source dans la solution de pro-blèmes mathématiques d’estimation (1972) et de mise au point d’algo-rithmes informatiques efficaces (1979 et 1980) est en train de modifier les théories sociologiques elles-mêmes. Le centre d’intérêt passe de la connaissance des déterminants pour ainsi dire statiques d’un état (par exemple pourquoi certains travailleurs œuvrent dans un secteur indus-triel plutôt que dans un autre ?) à la connaissance des déterminants du mouvement menant à cet état (pourquoi certains travailleurs changent de secteur industriel et vont vers un secteur donné ?).

Se distinguant des modèles économiques traitant des séries tempo-relles qui portent sur des agrégats ou des collectivités plutôt que sur des individus, et inspirée de l’étude des tables de mortalité des démo-graphes et des travaux des biostatisticiens, cette nouvelle forme d’ana-lyse statistique est utilisée en sciences sociales par l’introduction de causes qui sont variables dans le temps (augmentation de salaire mo-difiant les chances de changer d’emploi) et du repérage d’événements multiples et répétables pris comme variables dépendantes (change-ments d’emploi). Dans le cas de la recherche sur l’établissement des nouveaux immigrants, cette méthode qui permet [234] l’étude d’inter-relations dynamiques, s’avère utile puisque les itinéraires profession-nels de d’emploi, l’apprentissage linguistique, la nature et l’étendue du ménage, et le choix du lieu de résidence fournissent des conditions pour une transformation des uns et des autres.

Formellement, la variable dépendante dans ce modèle est obtenue par la mesure du temps passé dans un « état ». À partir de cette infor-mation, il est possible d’estimer une table de « survie » ou de « sé-jour » représentant la probabilité d’un changement d’état pour chaque

Page 10: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 10

unité de temps, c’est-à-dire la probabilité qu’une transition ait lieu à un moment donné. Cette information, transposée au niveau des indivi-dus à l’étude, est reliée à des prédicteurs afin d’en expliquer la varia-tion, puis sont identifiés (dans un contexte de régression dite de sur-vie) les facteurs qui font fluctuer cette probabilité en introduisant des variables indépendantes qui sont, soit métriques, soit catégorielles mo-difiées en polydichotomies.

Nous allons traiter, dans ce texte, des problèmes de cueillette et de bases de données reliés au recours à des événements datés.

Comment obtenir des données datées

Les outils nécessaires à la cueillette et à la saisie de ce genre de données doivent être adaptés afin de supporter le rappel temporel des événements. Nous avons donc testé l’utilisation d’un calendrier aide-mémoire accompagné de deux questionnaires : l’un orienté sur le ca-lendrier (consignes et questions), et un autre de type plus convention-nel.

Après avoir présenté ces supports à la cueillette, nous tenterons de cerner le degré de précision des datations ainsi obtenues. Puis, nous présenterons un aperçu des problèmes de gestion de base de données temporelles.

Le calendrier

La localisation temporelle d’événements, plus ou moins rapprochés de la date d’interview, fait appel, nécessairement, à la mémoire du répondant. Le type d’événement même peut faire qu’on se souvienne plus ou moins facilement de sa date d’avènement. Des événements [235] plus rares et/ou bouleversants comme une naissance, une morta-lité, un déménagement ou un changement d’emploi risquent d’être plus facilement, et plus précisément datables que le dernier rendez-vous avec un médecin (à moins que ce rendez-vous n’est été l’objet d’un annonce de maladie incurable...). C’est donc en se basant sur ces

Page 11: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 11

événements plus marquants que le répondant peut tendre à se rappeler plus facilement d’autres événements « plus banals ».

Un calendrier où sont résumées différentes séquences d’événe-ments permet la validation et la contre-validation des événements entre eux. Ce calendrier, un document séparé du questionnaire, est en fait une grille où sur un des axes on retrouve des dates, et sur l’autre, les événements en question. On y trace alors des lignes correspondant à la durée de chacun des événements. Le répondant peut donc, en se fiant à la date d’un déménagement par exemple, dater le début d’un cours suivi quelques semaines avant ou après ce déménagement. Le calendrier d’événements du répondant ainsi que celui du conjoint ou du responsable du ménage sont ainsi complétés.

Avant l’interview, l’axe des dates n’est qu’une série de nombre allant de 1 à 60 (pour les 60 premières semaines de l’arrivée au Qué-bec). L’intervieweur doit donc, lors des premières minutes de la ren-contre avec le répondant, ajuster et coller une règle des dates sur le calendrier. Le but est d’ajuster la date effective de la semaine d’arri-vée au Québec du répondant avec la première semaine absolue du ca-lendrier. Cette date ne peut que faire l’objet d’une très grande pré-sence à la mémoire ; elle marque, pour les immigrants, le début d’une vie dans un nouveau pays.

Au moins deux hypothèses de calendrier sont possibles : l’un où on ne retrouve que les dates de début et de fin des différents événements, et l’autre où on y code une partie ou l’ensemble des qualificatifs de ces événements. Les deux hypothèses permettent cette aide à la mé-moire. Cependant, la deuxième hypothèse comporte des difficultés supplémentaires de codage post-interview.

Si l’avantage principal de l’usage d’un calendrier est l’aide à la mémoire pour la datation, toutes autres informations portées sur celui-ci semblent, suite à notre expérience, n’avoir aucun avantage pour le répondant. Les informations, autres que les dates, inscrites [236] sur le calendrier, pour une question pratique d’espace d’abord, ne peuvent y être transcrites que sous forme abrégée ou codée. Le répondant n’y peut donc s’y référer et la saisie des données n’est pas simplifiée, au contraire. La solution semble donc être à mi-chemin entre un calen-drier ne contenant que des dates et un calendrier contenant des dates et d’autres informations.

Page 12: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 12

Certaines informations, autres que des dates, peuvent être inscrites dans un calendrier sans perdre les qualités du calendrier, et sans don-ner trop de cauchemars aux codeurs. Il s’agit, lorsque la nature de l’in-formation le permet, de marquer les dates de début et de fin d’événe-ment à l’aide de codes. Par exemple, pour un cours suivis, la date de début sera marquée par le code de la langue du cours (F pour français, A pour anglais et * pour autres), tandis que la date de fin est inscrite avec le code du type de fin de ce cours (1- en cours au moment de l’entrevue (troncature), 2- abandon, 3- fin normale). Ainsi, cinq in-dices sont inscrits sur une même ligne :

date début date de fin

| |

code de langue — durée — type de fin

Ce type de codification prévoit, bien entendu, lorsque l’informa-tion est pertinente, qu’une colonne ou une ligne par type de cours a été prévue. Dans ce cas, la colonne ou la ligne dans laquelle se trouve l’information apporte l’indication du type de cours suivi.

Pour d’autre événements où l’information à obtenir est plus com-plexe, le calendrier ne contiendra que les dates de début et de fin, alors que les caractéristiques de ces événements seront saisis par un questionnaire de type conventionnel (questions et réponses sur ques-tionnaire).

Les questionnaires

Comme nous l’avons déjà annoncé plus haut, deux questionnaires complémentaires ont été utilisés. Le premier regroupe les consignes se rapportant au calendrier ainsi que les questions propres aux différents événements saisis par celui-ci.

Page 13: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 13

[237]Le deuxième questionnaire (ou questionnaire no 2) est de type plus

conventionnel. Il se veut surtout l’outil pour obtenir les informations non datables telles que, principalement, la situation avant la venue au Québec (pays de résidence, emplois, études) du répondant et du conjoint s’il existe, la situation économique au Québec, l’utilisation et la connaissance des langues et la scolarité des enfants (s’il y a lieu). Il contient aussi des informations dont on ne s’intéresse qu’à la datation de la première occurrence comme les dates de cohabitation avec le parrain d’immigration, le premier contact avec un médecin ou un spé-cialiste de la santé, le premier contact avec une association ethnique, l’ouverture du compte en banque, etc.

La précision temporelle des données

La connaissance de la précision avec laquelle les répondants ont daté leurs informations est vitale à l’analyse : cette précision impose d’elle même la périodicité que l’analyse pourra prendre en compte. Nous allons montrer que, pour les variables qui sont issues du ques-tionnaire calendrier, cette précision est de l’ordre de la semaine alors qu’elle n’est que saisie au mois près dans la plupart des questions du questionnaire no 2.

Pour identifier la précision temporelle des réponses, il suffit de voir si l’unité de temps de fait utilisée est celle qui a été codée à partir des réponses ou si, au contraire, elle est d’un niveau inférieur. Dans le cas des événements où l’entrevue et la codification demandaient d’identifier la semaine, comme dans la partie calendrier, on pourra tester si chaque semaine du mois (le mois étant l’unité moins précise du temps) est utilisée avec la même fréquence dans le rapport d’un événement. Si tel est bien le cas, on pourra conclure que la précision est bien de l’ordre de la semaine. Dans le cas contraire, on conclura que le temps effectivement rapporté par les interviewés (ou effective-ment noté par les intervieweurs) n’est précis qu’au mois près.

Plus spécifiquement, dans le cas des questions que nous avons po-sées en demandant une précision à la semaine depuis l’arrivée, nous regarderons si la première semaine du mois (i.e. celle contenant le

Page 14: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 14

premier du mois) est mentionnée de façon plus fréquente. Cette men-tion correspondrait à la réponse « en début de tel mois », voire « à [238] tel mois », réponses que l’intervieweur aurait noté à la semaine contenant le début du mois. Pour la vaste majorité des événements, il n’y a pas de raison de croire que cette semaine particulière ait une si-gnification différente des autres et qu’elle doive apparaître plus sou-vent (ou moins souvent) que les autres. On s’attend donc que cette semaine ait une probabilité de 12/52 puisqu’elle apparait 12 fois par 52 semaines. Cette probabilité de 0,231 est la probabilité théorique (P) à laquelle sont comparés les probabilités observées (p) pour chaque événement (tableau 1).

Page 15: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 15

Tableau 1

Événements dont la date est demandée à la semaine

empl

oi ré

-po

n.

empl

oi

conj

oint

scol

ar. e

n-fa

nts

loge

men

t dé

but

loge

men

t fin lo

g dé

b no

n ho

tel

Semaine du mois

autre semaine 0 76 45 108 132 123 881ere semaine 1 26 16 9 40 49 23Total 102 61 117 172 172 111

proportion 0.254902 0.262295 0.076923 0.232558 0.284884 0.207207écart à P 0.024133 0.031526 -0.15385 1.79E-03 0.054114 -0.02356valeur Z 0.578481 0.584406 -3.94968* 0.055685 1.684459 -0.58919

étud

es

débu

t

étud

es fi

n

ét. c

onj.

débu

t

ét. c

onj.

fin non-

empl

. ré

p.

non-

empl

. co

nj.

églis

e

Semaine du moisautre sem 84 86 35 41 88 61 531ère sem 28 26 13 7 25 11 11Total 112 112 48 48 113 72 64

proportion 0.25 0.232143 0.270833 0.145833 0.221239 0.152778 0.171875écart à P 0.019231 1.37E-03 0.040064 -0.08494 -9.5E-03 -0.07799 -0.05889valeur Z 0.483046 0.034503 0.658808 -1.39667 -0.24045 -1.57071 -1.11827

On constate qu’à une exception près la première semaine du mois n’apparaît pas plus souvent que ce à quoi on s’attend si les réponses sont de fait fournies avec une précision de l’ordre de la semaine. En fait, la seule exception tend plutôt à confirmer cette précision : la sco-larité des enfants étant liée à une horloge externe — celle de [239] l’école — (deuxième semaine de septembre 1988 et deuxième se-maine de janvier 1989), cela expliquerait que seulement 8% des en-fants aient été déclarés avoir débuté l’école la première semaine du mois.

Page 16: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 16

Interviewés de façon rétrospective sur l’année écoulée avec l’aide d’un repère visuel que constitue leur calendrier d’établissement, les immigrants ont fourni sur les grands événements de leur vie au Qué-bec des réponses avec une précision de l’ordre de la semaine.

Il n’en va pas ainsi d’événements disparates pour lesquels on de-mandait une date absolue. Ces événements que l’on retrouve au ta-bleau 2 sont notés avec une précision temporelle de beaucoup infé-rieure. Dans ce cas, le test le plus simple que l’on puisse faire consiste à regarder la distribution des jours du mois qui sont fournis (ou notés par les intervieweurs ou codé par les codeurs, ces derniers ayant eu comme consigne de noter le jour 1 en l’absence d’information sur le jour au questionnaire). Alors qu’on s’attend que chaque jour du mois soit utilisé 3% (12/365) des fois, le jour 1 est de beaucoup au delà de ce seuil pour tous les événements ainsi saisis. Il est même très large-ment au-delà du seuil de 12/52 qu’on aurait observé si les réponses avaient été données à la semaine près.

Tableau 2

Pourcentage de datation au premier jour du mois

variable % du jour 1 total

envoi de cadeaux 81.3 32

contact avec MCCI 43,5 62

contact assoc. ethnique 73.7 19

1ère visite médicale 68.1 72

1er compte de banque 59.3 81

Dans ce cas, que ce soit à cause de la nature de l’événement ou parce que le questionnaire ne forçait pas le recours au calendrier d’établissement pour dater l’information, celle-ci est beaucoup plus imprécise que la précédente : elle est, somme toute, notée au mois près.

Page 17: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 17

[240]

La construction des données pour l’analyse

Chaque type d’événements saisi par le calendrier a sa propre oc-currence : un répondant peut, sur la période couverte par l’enquête, avoir eu 3 logements, 2 emplois et n’avoir suivis aucun cours ; un autre aura eu 1 seul logement, 6 emplois et suivis 5 cours de différents types. On voit, plus loin dans ce texte que la solution la plus parcimo-nieuse, et la plus souple lors des analyses, est de constituer un fichier de données par type d’événement ou par type d’information. On aura, par exemple, un fichier d’emplois où chaque cas est un épisode d’em-ploi plutôt qu’un individu. On fera de même pour les logements, les cours suivis, etc. Un seul des fichiers, qu’on peut qualifier de « fiche mère », est un fichier des personnes de l’échantillon. Cependant que ce soit la « fiche mère » ou tout autres fichiers, le numéro d’identifica-tion du répondant doit apparaître comme clef universelle sur chacune des unités d’analyse des fichiers. On rencontrera, pour un fichier d’emplois par exemple, le numéro d’identification d’un individu au-tant de fois que celui-ci aura connu d’emploi pendant la période cou-verte. De même, si un individu n’a pas eu d’emploi, son numéro d’identification ne se retrouvera sur aucun des emplois du fichier.

Cette solution prime, à notre avis, sur celle de créer un fichier rec-tangulaire unique qui à toute fin pratique, serait en partie vide. Ce type de fichier nécessite en effet que l’espace pour le plus grand nombre d’épisode de chacun des événements soit réservé même pour ceux qui n’ont connu aucun événement. Cette matrice, en plus d’être creuse, ne permet pas d’une manière aussi simple le jeu de construction de don-nées propres et adaptées à une analyse particulière, ce que permet la division un événement/un fichier.

En fait, cette méthode de constitution des données fait que chaque analyse exige une construction particulière de l’information. Les don-nées ne peuvent être utilisées telles quelles (fichier par fichier) que de manière très limitée. Passons maintenant à la description des quatre types « purs » de jonctions de fichiers. Ces quatre types, seront les building blocks des jonctions réelles.

Page 18: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 18

[241]

Comment créer un fichier pour une analyse particulière ?

Rendons clair au départ que les données doivent être préparées de façon spécifique pour chaque analyse. Le moment de l’occurrence de l’événement étudié comme variable dépendante impose le rejet de toute information qui lui est temporellement postérieure et la construction des informations antérieures. Le changement dans la dé-finition de l’événement étudié entraînera alors la nécessité de recons-truire un nouveau fichier d’analyse.

On a d’une part des fichiers où chaque répondant n’apparaît qu’une fois et une seule. C’est le cas par exemple du fichier contenant les in-formations générales relatives aux répondants (date d’arrivée, âge, sexe, etc.). Comme ces fichiers contiennent un enregistrement et un seul pour chaque répondant, on les appellera fichiers rectangulaires complets ou fichiers de type l. Pour certaines analyses, ces fichiers seront considérés comme événementiels parce qu’ils contiennent la date de l’événement non répétable (p.e. date du premier contact avec le système bancaire canadien, avec le système de santé, avec une asso-ciation ethnique).

On a, d’autre part, des fichiers où les « cas », les enregistrements (les records dirait SPSS) portent sur un événement donné et un répon-dant apparaît autant de fois au fichier qu’il a eu d’événements de ce type. Par exemple, un immigrant ayant eu trois emplois apparaît trois fois au fichier emploi alors que celui qui n’a connu qu’un emploi n’y apparaît qu’une fois et celui qui n’a pas travaillé durant la période d’observation n’y apparaît pas du tout. On appellera les fichiers de ce type des fichiers événementiels ou fichiers de type 2.

Pour fins d’analyse, il ne suffit pas de prendre « le » fichier et de le traiter comme dans une enquête normale puisque l’information sur un répondant est disséminée dans plusieurs fichiers et, dans les fichiers de type 2, sur plusieurs enregistrements. Le présent document tente de tracer les procédures les plus utiles pour le traitement de ces données.

Page 19: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 19

[242]

I. Les grands types de traitement des fichiers

A. La conservation ou le cumul de l’information portant sur les événements du même genre qui se sont produits avant l’événe-ment à l’étude : jonction de type A.

Pour étudier un événement répétable comme l’emploi, il est utile d’aller chercher de l’information sur les emplois précédemment tenus par un répondant donné pour mieux comprendre un emploi donné. Par exemple, on voudra savoir si le répondant a déjà travaillé en français au Québec, quelle est son expérience de travail totale depuis la migra-tion, etc. afin de voir si ces éléments sont des prédicteurs de sa stabili-té dans un emploi donné.

Ce type de jonction ne porte que sur un seul fichier de type 2 : on joint l’information concernant un (des) événement(s) précédent(s) d’un répondant à un événement de même nature mais subséquent pour le même répondant.

Le numéro d’identification du répondant est la clé de la jonction d’information. La date de l’événement sert à préparer l’ordre des enre-gistrements d’un même répondant.

B. Joindre deux fichiers parallèles, i.e. où il y a une correspon-dance un à un entre les enregistrements des deux fichiers : jonc-tion de type B.

L’idée centrale ici est de créer un nouveau fichier contenant les variables des deux fichiers d’origine. Par exemple, si un fichier contient la date d’arrivée au Québec, la langue préférée pour l’entre-vue et le sexe alors que l’autre contient l’âge et l’état civil, on peut vouloir créer un seul fichier contenant ces cinq variables afin d’étudier leurs relations.

Page 20: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 20

Ce type de jonction porte sur deux fichiers qui non seulement sont de même longueur mais contiennent exactement les mêmes « cas ». Il peut tout aussi bien s’appliquer à des fichiers de type 1 qu’à des fi-chiers de type 2.

Dans le cas de fichiers de type 1, le numéro d’identification est la seule clé de correspondance entre les 2 fichiers à joindre. Dans le cas de fichiers de type 2 à joindre, la conjonction du numéro d’identifica-tion avec la date constitue la clé.

[243]

C. Joindre deux fichiers non parallèles, i.e. où il n’y a pas de cor-respondance un à un entre les enregistrements. Un fichier four-nit les « cas », l’autre des variables. Jonction de type C.

L’exemple le plus clair de ceci sur des données événementielles est la jonction entre un fichier de type 2 contenant des événements répé-tables et un fichier de type 1. Les répondants apparaissent de zéro à n fois au premier fichier et ils apparaissent exactement une fois au se-cond fichier. On voudra joindre à chaque événement du premier fi-chier des données issues du second décrivant la personne ayant connue ces événements.

Le résultat de cette jonction est un fichier rectangulaire : les don-nées sur une personne donnée seront répétées autant de fois que cette personne a connue d’événements dans le fichier à l’étude.

Le numéro d’identification des répondants est la seule clé pour cette jonction.

D. Joindre deux fichiers événementiels. Jonction de type D.

La jonction entre deux fichiers événementiels présente une diffi-culté logique absente des types précédents : un événement ne peut ser-vir d’explication à un autre que s’il lui est temporellement antérieur. Si cette difficulté est aisément solutionnées pour les jonctions de type

Page 21: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 21

A, il n’en va pas si simplement ici. On veut combiner deux types dif-férents d’événements qui ont chacun leur périodicité propre.

Par exemple, si on veut joindre le fichier portant sur l’emploi à ce-lui portant sur le non-emploi, il n’est évidemment pas question que les périodes de non-emplois qui suivent un emploi donné viennent expli-quer celui-ci ! Au contraire, on ne voudra apparier à un emploi donné que les informations sur le(s) non-emploi(s) qui le précède (nt).

Cette jonction recourt à trois clés : le numéro d’identification du répondant, la date de l’événement de premier fichier et la date de l’événement du second fichier.

E. La combinatoire

Les quatre types de jonction décrits brièvement ci-dessus peuvent être combinés pour produire les informations qu’on désire réellement analyser. Ils sont des cas purs, des buildings blocks mais, en pratique, on devra recourir à des séquences d’opération de jonction.

[244]

Par exemple, on peut vouloir cumuler des informations sur l’en-semble des non-emplois qui précèdent un emploi afin de mieux expli-quer celui-ci. Dans ce cas, on fera une jonction de type A avant de faire une jonction de type D.

Dans le cas d’analyse de type régression de survie, on devra prendre soin de ne pas évacuer de l’analyse (i.e. du groupe à risque) les personnes n’ayant pas vécu un événement. Pour tous les événe-ments datés répétables, on devra, après avoir produit une jonction de type C (ou D) reliant ces événements aux variables de base (« stables ») rajouter les répondants n’ayant pas connu l’événement. Pour ceux-ci, outre les variables de base on prendra la date de l’entre-vue pour obtenir la mesure de leur durée de séjour dans un état et on créera une variable de troncature indiquant le retrait de l’observation à cette date.

Page 22: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 22

II. Procédures 1

A. Les fichiers sources pour ces jonctions

La jonction de type A peut être faite à partir de fichiers de données en ASCII ou créés par un SAVE de SPSS.

Les jonctions de type B et C nécessitent des fichiers créés par un SAVE de SPSS.

La jonction de type D nécessite des fichiers de données en ASCII.Le plus sécuritaire est de procéder avec les fichiers SAVE de SPSS

le plus possible (type A, B, C) et d’écrire avec un WRITE à partir de ces fichiers pour les jonctions de type D. On évitera ainsi une multi-plication indue des sources d’erreur.

B. Avant quelque traitement...

Toutes les procédures qui suivent présument que les fichiers ont été triés par le numéro du répondant (NO_ID) et, s’il s’agit d’un fi-chier événementiel (type 2), qu’ils ont été triés aussi (2ème clé) sur la date de l’événement. Cette dernière exigence implique le recours à des transformations préalables afin de créer une seule variable [245] « date » commune à l’ensemble des répondants, que leurs réponses aient été fournies en « numéro de semaine » ou en « date calendrier ».

Pour les jonctions de fichier où la date entre en compte, la façon de mesurer importe peu : que ce soit des semaines depuis l’arrivée (ques-tionnaire calendrier), la date calendrier, le nombre de secondes depuis l’entrée en vigueur du calendrier grégorien (14 octobre 1582), etc. n’importe pas. Ce qui est vital par ailleurs c’est

1 Nous tenons à remercier Monsieur Robert Boucher (Applications acadé-miques, Services informatiques, Université de Montréal) pour son support à la mise au point de ces procédures.

Page 23: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 23

1. que la date soit notée de la même façon sur les fichiers qu’on veut joindre ;

2. que la date ne constitue qu’une seule variable numérique (i.e. la date 25/01/47 ne va pas parce qu’elle contient des caractères non numériques, les « / »).

C. La jonction de type A : procédures

On n’a qu’un seul fichier et on veut « passer » l’information d’un enregistrement à l’autre. La création des nouvelles variables (concer-nant le passé) va se faire avec les moyens usuellement utilisés avec SPSS pour créer des variables : COMPUTE, IF, DO IF, RECODE, etc. La seule différence tient à ce qu’on va prendre un moyen qui per-met de ne pas effacer (initialiser) le contenu des variables lorsqu’on lit un nouveau cas. La procédure permettant cela est LEAVE. (cf. les ma-nuels pour les détails).

Si, à titre d’exemple, on travaille sur le fichier des emplois (type 2) et qu’on a une variable (fran) qui contient 1 si l’emploi est en français et 2 autrement et qu’avec cela on veut créer une variable (dejafran) qui indique si le répondant a déjà travaillé (dans le passé au Québec) en français dans ses emplois précédents, on utilisera les instructions du tableau 3.

Page 24: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 24

Tableau 3

DO IF (NO_ID NE LAG (NO_ID,1)) OR MISSING(LAG(NO_ID, 1)) /* si nouveau répondant

+ COMPUTE DEJAFRAN=0 /* initialiser à zéro+ ELSE /* si même répondant que précédant+ IF (LAG (FRAN. l) EQ 1)+ COMPUTE DEJAFRAN=1 /* mettre à 1 si français déjà utilisé

avantEND IFLEAVE DEJAFRAN /* conserver la valeur accumulée de la va-

riable pour le cas suivant

[246]Si on veut calculer son expérience de travail acquise au Québec

avant un emploi donné, on fera comme au tableau 4.

Tableau 4

DO IF (NO_ID NE LAG (NO_ID,1)) OR MISSING(LAG(NO_ID,1)) /* si nouveau répondant

+ OMPUTE EXPERIEN = 0 /* initialiser a zéro+ ELSE /* si même répondant que précédant+ COMPUTE EXPERIEN = EXPERIEN + (LAG (DATEFIN.l) —

LAG (DATEDE- BU,1)) /* accumuler exp.END IFLEAVE EXPERIEN /* conserver la valeur accumulée de la va-

riable pour le cas suivant

Les deux exemples montrent la nécessité de tester si on est en pré-sence d’un nouveau répondant et de faire une déclaration LEAVE

Page 25: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 25

pour que la valeur de la variable créée soit conserver pour utilisation par l’enregistrement suivant. Le reste est affaire usuelle de création de variables.

Une dernière remarque. Les cas étant triés par NO_ID et par la date, les valeurs s’accumulent d’un événement à l’autre pour un ré-pondant. Pour chaque événement, on a l’information la plus « à date » qui soit disponible.

D. La jonction de type B : procédures

Cette jonction se fait par unMATCH FILES FILE= / FILE= /BYde SPSS (ou JOIN de SPSS-PC). Il suffit que les fichiers soient triés dans le même ordre (la variable de tri sera déclarée après le / BY) et qu’ils contiennent exactement les mêmes cas. Le tableau 5 joint deux fichiers sur la base du NO_ID (sous l’hypothèse que les NO_ID sont uniques dans les fichiers, i.e. qu’on est en présence de fichiers de type 1).

Tableau 5

FILE HANDLE A /NAME=’ ... ’ /* fichier créé par un SAVEFILE HANDLE B /NAME=’ ... 1 /* fichier créé par un SAVEMATCH FILES FILE=A / FILE=B / BY NO_ID /* joindre par le NO_ID

Page 26: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 26

E. La jonction de type C : procéduresCette jonction se fait par un

[247]

MATCH FILES FILE= / TABLE= / BYde SPSS. On remarquera qu’un des fichiers à joindre, celui contenant les « cas » est identifié par le FILE= alors que l’autre fichier qui four-nit des variables mais pas des cas est identifié par le TABLE=. Un même répondant peut apparaître plusieurs fois dans le fichier FILE= mais les identificateurs doivent être uniques dans le fichier référencé par TABLE. Encore une fois, les fichiers doivent avoir été triés au préalables sur la variable constituant la clé de jonction (usuellement le NO_ID).

Le tableau 6 illustre cette jonction.

Tableau 6

FILE HANDLE A /NAME=’ ... ’ /* fichier contenant les cas (pro-bablement de type 2)

FILE HANDLE B /NAME=’ ... ’ /* fichier de type 1MATCH FILES FILE=A / TABLE=B / BY NO_ID /* joindre par

le NO_ID

F. La jonction de type D : procédures

Cette jonction est de beaucoup la plus complexe en ceci qu’elle ne peut être faite de façon automatique et simple. J’ai, pour contrer cette complexité, écrit un INPUT PROGRAM qui devrait satisfaire la plu-part des besoins pour ce type de jonction. Ce petit programme SPSS-X est long ... mais l’usager n’a que peu de choses à y changer pour qu’il fonctionne à sa convenance. Pas de panique !

Décrivons d’abord les opérations qui sont effectuées.

Page 27: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 27

Le programme lit d’abord un cas sur le fichier EVENT1 contenant les cas (i.e. le fichier qui sera créé portera sur ces individus-évène-ments). Ensuite, il examine si des événements correspondants à cet individu (NO_ID) existent sur le fichier EVENT2. Si oui, il jumelle les informations du fichier EVENT ! a l’enregistrement de même NO_ID du fichier EVENT2 et dont la date est soit simultanée soit an-térieure (la plus proche disponible s’il y en a plusieurs) à l’événement mesuré par le fichier EVENT1 : on va ainsi chercher les informations les plus récentes qui sont susceptibles d’influer sur l’événement de EVENT1.

Pour réaliser cela, les deux fichiers doivent être en ASCII (i.e. avoir été produits par un WRITE de SPSS.). De plus, les deux pre-mières informations doivent être, dans l’ordre, le NO_ID (l’identifica-teur [248] de l’individu) et la date de l’événement. Pour cette dernière information, il s’agit de la date qui est pertinente pour l’analyse envi-sagée : soit la date de début de l’épisode, soit la date de fin de l’épi-sode selon le cas. L’unité dans laquelle est mesurée la date importe peu mais doit être la même sur les deux fichiers à joindre. Les fichiers doivent avoir été triés selon le NO_ID (clé 1) et la date (clé 2).

L’INPUT PROGRAM que j’ai écrit devrait pouvoir être simplifié (pour l’usager) lorsque une version 3.0 ou meilleure de SPSS-X sera disponible à l’Université de Montréal. On pourra alors utiliser des MACROS pour faire des changements qui, pour l’heure, doivent être fait main.

Pour s’en servir1. Prendre une copie informatique du programme (ne pas le trans-

crire « à la main » : cela créerait nécessairement des erreurs !)2. Effectuer les modifications indiquées par des COMMENT

*****.

Les changements portent sur1. Les FILE HANDLE (i.e faire monter les bons fichiers !)2. Le nombre et la liste de variables et le format de lecture de

chaque fichier

Page 28: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 28

3. les caractéristiques du fichier à produire (SAVE, WRITE,...) ATTENTION1. Sur EVENT1 : les deux premières variables doivent s'appeler

NO_ID et DATE ; le nom des autres variables importe peu2. Sur EVENT2 : les variables sont lues sous le nom de #T, puis

transformées en LU, LUAVA, NONLU et finalement, ce qui doit être conservé est nommé ECRIT. Ces noms sont réservés ; ne pas les modifier. Ce qui importe pour lire le fichier EVENT2, c’est le nombre total de variables à y lire, le pro-gramme leur donne des noms. Les deux premières variables à être lues doivent être l’identificateur de l’individu et la date per-tinente (début ou fin selon le cas) de l’événement.

[249]Le programme est conçu pour trois variables au total pour cha-cun des fichiers (le numéro d’identification de l’individu, la date et une variable quelconque). Lorsque plus de trois va-riables sont utilisées, il suffit, là où indiqué, de changer le chiffre 3 par le chiffre correspondant au nombre de variables réellement utilisées.

3. Toujours vérifier les résultats obtenus en listant les deux fi-chiers originaux et le fichier produit. Vérifier avec soin les der-niers cas (qui sont facilement affectés par la présence d’une ligne blanche à la fin de certains fichiers de données)

Pour éviter d’alourdir le texte, cette série de commandes SPSS dé-crivant l’INPUT PROGRAM est donnée en annexe.

[250]

Page 29: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 29

[251]

Annexe : INPUT PROGRAM pour jonction de type D(copier l’ensemble de ces lignes)

title jonction de deux fichiers d’évènements répétables

Comment les lignes qui doivent être modifiées pour faire une jonction entre deux fichiers sont PRÉCÉDÉES d’une ligne de ************** ces modifications portent sur la description des variables, leur format, leur nombre, le nom des fichiers

comment le fichier EVENT1 contient la var dépendante, i.e. fournit les cas le fichier EVENT2 fournit les infos « a date » pour le fichier 2 Ces fichiers doivent être déjà tries sur id du cas et date.

comment cette passe est conçue avec trois variables par fichier. On peut aisément modifier cela :pour le fichier EVENT1, simplement lire plus de variables (NO_ID et DATE doivent cependant être présents avec ces noms) pour le fichier EVENT2s’assurer que le premier élément lu est l’identificateur de cas (comme NO_ID) et que le deuxième élément contient la DATE de l’évènement puis modifier partout ou le chiffre « 3" apparait ci-dessous par le nombre de variables contenues (id et date in-cluses) dans le fichier EVENT2 enfin, modifier les formats de lecture

Comment NE PAS changer les noms EVENT1 et EVENT2SEULEMENT CHANGER le nom entre guillemets (name=’abc.def...’)

Page 30: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 30

ET la valeur de LRECL (longueur maximale d’une ligne de données)

comment ******************************************file handle EVENTl/name=’$user.test.EVENTl’/lrecl=6comment ******************************************file handle EVENT2/name=’$user.test.EVENT2’/lrecl=7

INPUT PROGRAM

Comment NVAR1 contient le nombre de variables du fichier EVENT 1 NVAR2 contient le nombre de variables du fichier EVENT2 comment ******************************************COMPUTE N VAR 1=3comment ******************************************

Page 31: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 31

[252]

COMPUTE NVAR2=3LEAVE NVAR1, NVAR2

Comment finde2 vaut 1 lorsque le fichier 2 est a sa fin (EOF)compute finde2=0LEAVE finde2

Comment NONLU contient les valeurs par défaut pour les cas sans information pertinente sur le fichier 2 (ici, il est mis a -1)LU contient les dernières valeurs lues sur le fichier2LUAVA contient les avant-dernières (lu-avant) valeurs lues sur le fichier2

Comment INITIALISATIONcomment ******************************************mettre la valeur de NVAR2 dans la parenthèsevector nonlu lu luava écrit #t (3)

compute findecas=l

loop #i=l to nvar2+ compute nonlu(#i)=-l + compute luava(#i)=0+ compute lu(#i)=0end loop

comment ******************************************

Page 32: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 32

LEAVE NONLU 1 TO NONLU3.LUAVA1 TO LUAVA3, LUI TO LU3

comment BOUCLE PRINCIPALE

LOOP+ do if (findecas eq 1)comment lecture d’un cas du fichier EVENT1comment ******************************************+ data list file=EVENTl /no_id,date,y (3f2.0)

[253]+ compute findecas=0comment ******************************************+ LEAVE NO_ID to Y, FINDECAS+ end if

comment on réglé pour commencer les cas ou le fichier EVENT2 est épuisé

do if (finde2 eq 1)do if (no_id eq luaval)do if (date ge luava2)do if ((no_id eq lu1) and (date 1t lu2))loop #i=l to nvar2compute ecrit(#i)=luava(#i) end loopcompute findecas=lend caseend if

Page 33: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 33

end ifend ifdo if (findecas ne 1)do if ((no_id eq lu1) and (date ge lu2))loop #i=1 to nvar2compute ecrit(#i)=lu(#i)end loopcompute findecas=lend caseelseloop #i=l to nvar2compute ecrit(#i)=nonlu(#i)end loopcompute ecrit(1)=no_idcompute findecas=lend caseend ifend ifelse

comment on réglé maintenant lorsque le fichier 2 n’est pas à sa fin+ DO IF (NO_ID EQ luAVAl)+ do if (date ge luava2)+ do if (no_id eq lu1)

Page 34: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 34

[254]+ do if (date 1t lu2)+ loop #i=l to nvar2+ compute ecrit(#i)=luava(#i)+ end loop+ compute findecas=l+ end case+ elsecomment ******************************************+ DATA LIST FILE=EVENT2 end=finde2/#tl TO #t3 (2f2.0,f3.0)+ do if (finde2 ne 1)+ loop #i= 1 to nvar2+ compute luava(#i)=lu(#i)+ compute lu(#i)=#t(#i)+ end loop+ end if+ end if+ else+ loop#i=l to nvar2+ compute ecrit(#i)=luava(#i)+ end loop+ compute findecas=l+ end case+ end if+ else+ loop #i=l to nvar2 + compute ecrit(#i)=nonlu(#i)+ end loop

Page 35: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 35

+ compute ecrit(l)=no_id+ compute findecas=l+ end case+ end if+ ELSE+ do if (nojd ge lu1)comment ******************************************+ DATA LIST FILE=EVENT2 end=finde2/#tl TO #t3 (2f2.0,f3.0)+ do if (finde2 ne 1)+ loop #i= 1 to nvar2 + compute luava(#i)=lu(#i)+ compute lu(#i)=#t(#i)+ end loop+ end if+ else+ loop #i=l to nvar2+ compute ecrit(#i)=nonlu(#i)

[255]+ end loop+ compute ecrit(l)=no_id+ compute findecas=l+ end case+ end if+ END IFend if

END LOOPEND INPUT PROGRAM

Page 36: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 36

comment finir par un SAVE OUTFILE= ... avec soit un KEEP(garder no_id et autres var lues sur EVENT1 et Ecrit1 à Ecrit??) ou un DROP (nonlu1 to lu??, findecas, finde2)comment on peut également terminer par un WRITE en ne gar-dant que les variables du KEEP ci-dessus

Page 37: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 37

[256]

AnnexeIllustration des jonctions de type a, b, c et d

Jonction de type A :EXEMPLE : Création d’une variable DEJAFRAN qui indique si le

répondant a déjà travaillé en français (fichier de type 2).

On fait... (avec SPSSX 2.2 ou mieux)DO IF (NO_ID NE LAG(NO_ID,l)) ORMISSING(LAG(NO_ID,1))COMPUTE DEJAFRAN=0 .ELSEIF (LAG(FRAN,1) EQ 1)COMPUTE DEJAFRAN=1END IFLEAVE DEJAFRAN

Page 38: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 38

On obtient...

NO_ID DATDEB DATFIN LANG DEJAFRAN

1 1 5 2 01 10 20 1 01 30 50 2 12 16 45 2 03 4 10 1 0

Note : La variable sujette au LAG doit être numérique.

[257]

Jonction de type B :EXEMPLE : Joindre deux fichiers parallèles, i.e. où il y a une cor-

respondance un à un entre les enregistrements des deux fichiers (fi-chier de type 1)

On a...

On fait... (avec SPSSX 2.2 ou mieux)FILE HANDLE FICHE 1 /NAME=’...’FILE HANDLE FICHE2 /NAME=’...’MATCH FILES FILE = FICHE1 / FILE = FICHE2 / BY NO_ID

Page 39: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 39

On obtient...

NO_ID

FICHE XI X2 X3 X4 X5 X6

1 1 1 4 2 23 45 12 1 0 6 3 12 52 03 1 0 2 2 4 12 14 1 1 9 3 9 23 05 1 0 2 1 30 36 0

Note : FICHE1 et FICHE2 doivent avoir été créés par un SAVE

[258]

Jonction de type C :EXEMPLE : Joindre deux fichiers non parallèles, i.e. où il n’y a

pas de correspondance un à un entre les enregistrements. Un fichier fournit les « cas » (fichier de type 2), l’autre des variables (fichier de type 1).

On a...

On fait... (avec SPSSX 2.2 ou mieux)FILE HANDLE FICHEI /NAME=\... ’FILE HANDLE FICHE2 /NAME=’.... ’

Page 40: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 40

MATCH FILES FILE = FICHEI / TABLE = FICHE2 / BY NO_ID

On obtient...

NO_ID FICHE XI X2 X3 X4 X51 1 1 2 23 45 11 1 10 1 23 45 11 1 30 2 23 45 12 1 16 2 12 52 03 1 4 1 4 12 1

[259]

Jonction de type D :

EXEMPLE : Joindre deux fichiers événementiels : un fichier contenant la variable dépendante (le ou les emplois en français du ré-pondant) et un fichier de variables indépendantes si celle-ci sont tem-porellement simultanées ou antérieures à la variable dépendante (l’emploi français du conjoint).

On a...

Page 41: “Datation des événements dans un questionnaire et gestion …classiques.uqac.ca/.../Datation_evenements.docx · Web viewLe plus sécuritaire est de procéder avec les fichiers

“Datation des événements dans un questionnaire et gestion de la base de données.” (1993) 41

On fait... comme décrit à la fin du document... On obtient...

NO_ID DATE1 DATE2 X2 X31 2 NAP 4 NAP1 8 5 6 31 11 5 2 3

[260]