Enquête canadienne sur l’incapacité, 2017 : Guide des concepts et méthodes
5. Traitement des données
Consulter la version la plus récente.
Information archivée dans le Web
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
Passer au texte
Début du texte
5.1 Prétraitement : saisie des données
Toutes les réponses aux questions de l’Enquête canadienne sur l’incapacité (ECI) de 2017 étaient saisies directement dans l’application du questionnaire électronique (QE), tant pour la composante dirigée par l’intervieweur (QEi) que pour la composante d’autodéclaration par le répondant (QEr). Pour le QEi, des renseignements supplémentaires de gestion de cas ont été saisis au moyen du logiciel Blaise dans les bureaux régionaux de Statistique Canada avant la transmission des données au bureau central. Les données du QEr, quant à elles, étaient transmises directement au bureau central. Ces systèmes électroniques créent de nombreux gains d’efficacité tant en temps qu’en coûts liés à la saisie et à la transmission des données. Toutes les réponses aux enquêtes ont été hautement sécurisées au moyen de protocoles de chiffrement standards de l’industrie, de pare-feu et de couches de cryptage.
Pour certaines questions de l’ECI, les données ont fait l’objet d’un processus de vérification préliminaire alors que les participants répondaient à l’enquête. Cela a été effectué au moyen d’une série de contrôles programmés dans le QE. Plus particulièrement, lorsqu’une réponse donnée ne semblait pas correspondre aux réponses antérieures ou qu’elle tombait à l’extérieur des valeurs prévues, l’intervieweur ou le répondant par autodéclaration en était avisé à l’aide d’un message d’avertissement à l’écran qui lui donnait la possibilité de modifier la réponse fournie. Environ 90 % des répondants qui recevaient ces messages automatiques ont changé leurs réponses. Les données des réponses ont été soumises à d’autres processus de vérification et d’imputation suite à leur réception au bureau central, comme décrit dans les sections ci-dessous.
5.2 Étapes du traitement
Dès que les réponses à l’ECI sont transmises au bureau central, un traitement des données plus exhaustif commence. Le traitement des données comporte une série d’étapes pour la conversion des réponses au questionnaire, de leur format brut initial en une base de données conviviale de grande qualité, contenant un vaste ensemble de variables à analyser. L’équipe du traitement exécute une série d’opérations sur les données afin d’enlever des fichiers les erreurs commises par inadvertance, de modifier les données aux fins de cohérence, de coder les questions à réponse libre, de créer les variables utiles aux fins de l’analyse des données et enfin de systématiser et de documenter les variables pour en faciliter l’analyse.
Pour l’ECI, nous nous sommes servis d’une série d’outils de traitement des enquêtes sociales élaborée à Statistique Canada et appelée « Environnement pour le traitement des enquêtes sociales » (ETES). L’ETES comprend des programmes du logiciel SAS, des applications sur mesure et des procédures manuelles permettant d’exécuter les étapes systématiques de traitement suivantes :
- Réception des données brutes
- Nettoyage
- Recodage
- Enchaînement des questions
- Codage
- Vérifications de la cohérence
- Conversion des variables
- Variables dérivées
- Création du fichier de traitement final
- Création des fichiers de diffusion
Chaque étape de traitement, du nettoyage initial à l’élaboration des variables dérivées, est décrite de façon plus détaillée dans les sections suivantes de ce chapitre. Le chapitre 6 détaille la création de la base de données finale.
5.3 Nettoyage des enregistrements : enregistrements dans le champ de l’enquête et enregistrements complets
Après avoir reçu les données brutes du questionnaire électronique, un certain nombre de procédures de nettoyage préliminaires étaient mises en œuvre au niveau des enregistrements individuels de l’ECI de 2017. Celles-ci incluaient la suppression de tous les renseignements personnels des fichiers comme le nom et l’adresse, effectuée dans le cadre d’un ensemble de mesures rigoureuses pour protéger la confidentialité des répondants. À cette étape, s’il y avait des doublons (c’est-à-dire deux enregistrements pour un même répondant), on s’assurait de n’en garder qu’une copie. Chaque paire a été examinée individuellement et, en règle générale, on retenait le premier enregistrement reçu. Les seules exceptions étaient lorsqu’il était évident que le premier enregistrement était erroné.
Au nombre des procédures de nettoyage figurait aussi l’examen des enregistrements de tous les répondants afin de vérifier si chaque répondant était « dans le champ de l’enquête » et avait répondu à un nombre suffisant de questions pour que le questionnaire soit considéré comme « complet ». Voici les critères spécifiques pour les répondants.
- Pour être « dans le champ de l’enquête » de l’ECI de 2017, les répondants devaient être âgés d’au moins 15 ans le jour du Recensement (soit le 10 mai 2016), et vivre au Canada dans un ménage privé au moment de l’enquête. Certaines questions du module d’entrée permettaient de vérifier ces informations avant même de débuter l’entrevue. Les répondants considérés « dans le champ de l’enquête » sont classés dans deux groupes : 1) les répondants qui ont été retenus après avoir répondu aux Questions d’identification des incapacités (QII), et qui faisaient donc partie de la population ayant une incapacité; 2) les répondants qui n’ont pas été retenus après avoir répondu aux QII et qui étaient donc considérés comme des personnes sans incapacité. Les deux groupes se retrouvent dans le fichier analytique final de l’enquête.
- Le questionnaire d’un répondant avec incapacité est considéré comme étant « complet » si une réponse a été fournie à la dernière question du module sur la discrimination sur le marché du travail (LFD)Note . Ceci fait en sorte qu’on obtient des réponses à certaines questions essentielles, soit celles servant à la production des tableaux de données sur les personnes ayant une incapacité selon les exigences stipulées par la Loi sur l’équité en matière d’emploi de 1995. Plus de détails à ce sujet figurent à l’annexe E.
- Le questionnaire d’un répondant sans incapacité est considéré comme étant « complet » si une réponse a été fournie à la dernière question des QII. En effet, les répondants sans incapacité n’avaient pas à répondre au reste du questionnaire de l’ECI puisqu’il ne s’appliquait pas à eux.
Veuillez noter que durant la collecte des données, plusieurs échanges d’information ont eu lieu entre le bureau central et les intervieweurs dans les bureaux régionaux. Cette information ne pouvant pas toujours être conservée convenablement dans le système de collecte, un journal permettant de prendre en note toute information utile au sujet des répondants a été créé et tenu à jour au bureau central. Par exemple, un répondant pouvait communiquer avec le bureau régional suite à son entrevue pour fournir de l’information supplémentaire ou rectifier de l’information déjà donnée. Comme le cas avait été finalisé, il n’était plus accessible par l’intervieweur pour y faire des changements ou y entrer des notes. On se servait donc du journal pour prendre en note ces informations. De plus, toutes les notes entrées par les intervieweurs ou les répondants dans l’application ont été examinées par le bureau central, et toute information pertinente a été inscrite au journal.
Pour déterminer le statut final de questionnaire complet ou incomplet d’une unité de l’échantillon, les informations supplémentaires conservées dans le journal étaient prises en considération et avaient préséance sur toute autre information contradictoire générée de façon automatique par le système.
Une fois le statut final de chaque répondant déterminé, les cas considérés comme hors du champ de l’enquête ou comme incomplets ont été retirés de la base de données. Le poids des répondants dont le questionnaire était complet a été ajusté à la hausse pour compenser ces pertes (pour plus de détails sur la pondération, consultez la section 6.1).
5.4 Recodage : changements aux variables et questions à réponses multiples
Cette étape du traitement consistait en des modifications de variables individuelles. Certaines variables pouvaient être éliminées, recodées, redimensionnées ou laissées telles quelles. On a apporté des changements au formatage dans le but de faciliter le traitement ainsi que l’analyse des données par les utilisateurs finaux. Parmi les autres changements apportés aux variables, on note la transformation des questions à réponses multiples (questions pour lesquelles toutes les réponses appropriées doivent être choisies : « Sélectionnez tout ce qui s'applique ») en séries correspondantes de variables à réponse unique, qui sont plus faciles à utiliser. Pour chaque catégorie de réponse associée à la question initiale, on a créé une nouvelle variableNote avec « oui/non » comme valeurs de réponse. Reportez-vous à l’exemple ci-après. Cette procédure s’appelle « désenchaîner » les variables.
Début de l’encadré
Question initiale à réponses multiples
IU_Q15 Au cours des 12 derniers mois, avez-vous utilisé Internet :
Sélectionnez tout ce qui s'applique.
- à votre maison
- au moyen d’un téléphone intelligent, d’une tablette ou d’un autre appareil portatif sans fil
- à la maison de quelqu'un d'autre
- au travail
- à l'école ou à un institut de formation
- à un autre emplacement
p. ex. Wi-Fi public, bibliothèque, centre communautaire, etc.
Fin de l’encadré
Début de l’encadré
Variables définitives sous la forme de questions à réponse unique « oui/non »
IU_15A Au cours des 12 derniers mois, avez-vous utilisé Internet - à votre maison
- Oui
- Non
IU_15B Au cours des 12 derniers mois, avez-vous utilisé Internet - au moyen d’un téléphone intelligent, d’une tablette ou d’un autre appareil portatif sans fil
- Oui
- Non
IU_15C Au cours des 12 derniers mois, avez-vous utilisé Internet - à la maison de quelqu'un d'autre
- Oui
- Non
... autres questions dont la réponse est « Oui » ou « Non » pour chaque catégorie de réponse, soit IU_15D – au travail, IU_15E - à l'école ou à un institut de formation… et la dernière catégorie :
IU_15F Au cours des 12 derniers mois, avez-vous utilisé Internet - à un autre emplacement, p. ex. Wi-Fi public, bibliothèque, centre communautaire, etc.
- Oui
- Non
Fin de l’encadré
5.5 Enchaînement des questions : parcours des réponses, enchaînements valides et la non-réponse aux questions
La vérification de l’enchaînement des questions ou des instructions « passez à » représente une autre série de procédures de traitement des données pour l’ECI de 2017. On a vérifié tous les parcours des réponses et toutes les instructions « passez à » intégrées au questionnaire afin de s’assurer que l’univers de chaque question soit saisie précisément au cours du traitement.
Différents types de catégories utilisées pour la réponse et la non-réponse aux questions sont exposés ci-après, ce qui aidera les utilisateurs à mieux comprendre les univers de questions ainsi que les résultats statistiques pour les variables de l’ECI.
Catégories de réponse et de non-réponse aux questions
Les éléments du questionnaire électronique étaient identiques pour les intervieweurs (QEi) et les répondants au questionnaire autoadministré (QEr). Les répondants ou les intervieweurs étaient habituellement invités à sélectionner une réponse à partir d’un ensemble de catégories de réponse présentées à l’écran. Dans certains cas, les questions de l’enquête étaient ouvertes, et donc une réponse en toutes lettres devait être fournie. Une catégorie de réponse facultative « Ne sais pas » était proposée pour un nombre limité de questions. Dans certaines situations, un répondant pourrait avoir sauté la question en cliquant sur le bouton Suivant sans avoir fourni de réponse. Pour certaines questions d’enquête critiques, une question sautée entraînait un rappel automatisé demandant au répondant de répondre à la question sautée. Toutefois, les répondants avaient toujours l’option de sauter une question.
On a affecté des codes spéciaux à chaque type de non-réponseNote , dans le but d’aider les utilisateurs à les reconnaître et de faciliter l’analyse des données.
Réponse
- Une réponse se rapportant directement au contenu de la question, qui peut être classée dans les catégories de réponse établies d’avance, ou qui peut être catégorisée par codage, comme c’est le cas pour les réponses « Autre - Précisez » et les réponses aux questions ouvertes.
Enchaînement valide (saut valide)
- Indique que la question n’a pas été posée au répondant, compte tenu des réponses à des questions précédentes. Dans un tel cas, on considère que le répondant ne fait pas partie de l’univers de la question.
- Le code se termine par un « 6 », précédé d’un ou de plusieurs « 9 » (par exemple « 6 », « 96 » ou « 996 »), selon la longueur de la variable.
Ne sais pas
- Dans une enquête avec QE, il n’est pas toujours possible de cerner les situations où un répondant ne connaît pas la réponse. En effet, le répondant a toujours le choix de sauter une question en appuyant sur le bouton Suivant, sans préciser la raison de ce choix. Les éléments sautés sont normalement codés « Non déclaré » (consultez la section ci-dessous). Cependant, pour certaines questions de l’ECI, il était important de déterminer si les répondants ne connaissaient réellement pas la réponse; c’est pourquoi une catégorie « Ne sais pas » a été ajoutée à la liste des réponses possibles.
- Le code se termine par un « 7 », précédé d’un ou de plusieurs « 9 » (par exemple « 7 », « 97 » ou « 997 »), selon la longueur de la variable.
Non déclaré
- Indique que la question a été posée au répondant, mais que ce dernier n’a pas répondu, comme lorsqu’un répondant saute une question en cliquant sur le bouton Suivant sans avoir donné de réponse.
- Le code se termine par un « 9 », précédé d’un ou de plusieurs « 9 » (par exemple « 9 », « 99 » ou « 999 »), selon la longueur de la variable.
Non-réponse pour les variables dérivées (VD)
La création des variables dérivées (VD) de la base de données de l’ECI nécessite souvent de combiner ou de regrouper des réponses à plus d’une question d’enquête. Parmi les variables composantes d’une VD, il est possible que certaines comprennent des réponses valides, tandis que d’autres comportent des valeurs de non-réponse. Lorsque les composantes d’une VD donnée comprenaient un code de non-réponse « Ne sais pas » ou « Non déclaré », les VD étaient codées de façon à refléter la meilleure compréhension possible de la combinaison de réponses en question.
Non-réponse pour les variables de recensement externes couplées
Dans le cas de variables de recensement externes couplées à l’ECI, il convient de souligner que ces variables ne comportent généralement aucune donnée manquante comme les réponses « Ne sais pas », « Refus » ou « Non déclaré », puisque, pour la majorité des variables, les activités de traitement du recensement comprenaient l’imputation de toutes les réponses manquantes avant le couplage à l’ECI. La seule exception à cette règle concerne les variables liées à la question du recensement sur les activités de la vie quotidienne. Les données de cette variable n’ont pas été imputées, car elles servaient uniquement à fournir une base de sondage pour l’ECI postcensitaire. Comme nous le mentionnons ci-dessous, le code « Non déclaré » est attribué à toute valeur manquante de ces variables.
Cependant, il y avait d’autres catégories de non-réponse pour les variables de recensement telles que décrites ci-dessous :
Sans objet
- Indique que la question ne s’appliquait pas à la situation du répondant, tel que déterminé par les réponses valides fournies à une question précédente. Pour certaines variables de recensement, il existe plusieurs catégories « Sans objet », chacune indiquant que la question ne s’applique pas pour une raison différente. Dans de tels cas, le répondant n’est pas considéré comme faisant partie de l’univers de cette question.
- Des codes de l’ECI ont été créés pour remplacer les codes « Sans objet » du recensement, dont les valeurs étaient négatives. Les nouveaux codes étaient nécessaires afin que les données de l’ECI soient conformes au système de traitement utilisé, qui ne permettait pas les valeurs négatives dans les variables catégoriques. Toutefois, les nouveaux codes de l’ECI conservent les distinctions faites par les codes du recensement, pour indiquer les différentes raisons pour lesquelles la variable pourrait ne pas s’appliquer. De plus, le cas échéant, un chiffre a été ajouté à la longueur officielle des variables du recensement, pour les adapter à ces codes spéciaux.
- Le dernier chiffre du code de l’ECI est fixé à « 2 », « 3 », « 4 » ou « 5 » (remplaçant les codes de recensement -2, -3, -4 et -5), et tout chiffre précédent est fixé à « 9 », comme 92, 992 ou 9992; 93, 993 ou 9993; 94, 994 ou 9994; ou 95, 995 ou 9995, selon la longueur de la variable.
Supprimé
- Indique que les données de recensement n’ont pas été couplées à la base de données de l’ECI à la demande du répondant, exprimée au moment de l’interview de l’ECI.
- Le code de l’ECI se termine par un « 0 », précédé d’un ou de plusieurs « 9 » (par exemple, « 90 », « 990 » ou « 9990 »), selon la longueur de la variable.
Non déclaré
- Indique qu’aucune réponse n’a été donnée à la question du recensement et que la valeur n’a pas été imputée. Renvoie seulement aux variables de la question du recensement sur les activités de la vie quotidienne, qui n’ont pas été imputées, car elles visaient uniquement à fournir une base de sondage pour l’ECI post-censitaire.
- Le code de l’ECI est 92. Il remplace le code du recensement, -2 – Non déclaré.
Vous trouverez plus d’information sur les variables dérivées et les variables de recensement dans les sections 5.9 et 5.10 ci-dessous.
5.6 Codage
L’étape suivante du traitement des données consistait à procéder à la révision et à la classification des réponses écrites données aux éléments du questionnaire, le cas échéant – un processus appelé codage. Deux types de questions exigeaient l’application des procédures de codage : les éléments « Autre – précisez » et les questions qui étaient entièrement ouvertes. Elles sont décrites plus longuement ci-dessous.
Réponse « Autre – Précisez »
Pour la plupart des questions de l’ECI, on avait prévu des catégories de réponse précodées qui étaient présentées aux répondants. Les questions comportaient souvent un texte d’aide à l’écran avec des explications et des exemples pour aider le répondant à sélectionner la catégorie qui convenait le mieux à sa situation. Cependant, si la réponse d’un répondant était difficile à classer dans une catégorie existante, le répondant ou l’intervieweur pouvait également, pour bien des questions, entrer une réponse écrite dans la catégorie « Autre – Précisez ».
Toutes les questions ayant une catégorie de réponse « Autre – Précisez » ont été examinées au cours du traitement. Un total de 30 questions ont été codées pour les réponses « Autre – précisez ». Vingt-cinq d’entre elles étaient des questions à réponse multiple (« sélectionnez tout ce qui s’applique ») et cinq étaient des questions à réponse unique. Selon les lignes directrices sur le codage préparées par les spécialistes du domaine, le code assigné à plusieurs des réponses écrites des répondants a été remplacé par le code de l’une des catégories de réponses existantes. Les réponses uniques et différentes sur le plan qualitatif par rapport aux catégories existantes sont demeurées dans la catégorie « Autre ». Lorsque les nombres le justifiaient, on a créé des catégories pour saisir les nouveaux thèmes qui ressortaient des données, et que les catégories existantes ne reflétaient pas. L’annexe F présente les catégories supplémentaires ajoutées à l’ECI de 2017, qui seront toutes inscrites dans les dictionnaires de données. Les catégories supplémentaires seront prises en considération au moment de revoir les catégories de réponse pour les cycles à venir de l’enquête.
Questions ouvertes et classifications types
De plus, 27 questions du questionnaire de l’ECI de 2017 ont été enregistrées dans un format complètement ouvert. Il s’agit des questions se rapportant à ce qui suit :
- La principale condition médicale du répondant, qui lui cause le plus de difficulté ou qui limite le plus ses activités (les répondants peuvent fournir un maximum de deux conditions médicales);
- La profession du répondant et l’industrie dans laquelle le répondant travaille;
- La raison principale du travail autonome;
- Les obstacles rencontrés en cherchant du travail;
- Le principal domaine d’études postsecondaires;
- Les aspects de l’accès aux services du gouvernement qui seraient difficiles en raison de leur état de santé.
Pour la plupart de ces questions, on a codé les réponses en se servant d’une combinaison de procédures de codage automatisées et interactives (manuelles). Le cas échéant, les systèmes de classification types ont été utilisés. Le codage pour toutes les classifications a été effectué par une équipe de codeurs chevronnés et de surveillants du contrôle de la qualité. Les spécialistes du domaine qui s’occupent du traitement des données ont appliqué des procédures de vérification supplémentaires. Pour les autres variables, les données ont été examinées par des spécialistes du domaine au moyen de méthodes qualitatives systématiques afin de déterminer et de coder les thèmes pertinents. Des précisions sur ces classifications figurent à l’annexe F, ainsi que les codes qualitatifs émergents générés pour les questions ouvertes.
5.7 Vérifications de la cohérence
Certaines vérifications et imputations sont nécessaires afin d’assurer la cohérence et la complétude des données d’enquête. On a examiné les données de l’ECI afin de vérifier s’il existait des incohérences entre certaines variables de l’enquête. On avait déjà soumis les données à différentes vérifications intégrées par le biais du questionnaire électronique. On avait, par exemple, programmé des vérifications consistant à comparer l’âge fourni à certaines questions avec l’âge du répondant au moment de l’entrevue, et à avertir le répondant s’il y avait incohérence. D’autres vérifications servaient à éviter d’obtenir des valeurs impossibles pour le nombre d’heures travaillées habituellement dans une semaine (ce nombre devant nécessairement être inférieur à 168). Des messages d’avertissement ont aussi été programmés pour réduire les risques que certaines questions-clés servant à déterminer le statut d’activité ne soient laissées sans réponse par inadvertance.
Malgré ces vérifications intégrées et parce que les incohérences identifiées pouvaient ne pas être corrigées lors de l’entrevue, on a procédé à des vérifications et imputations sur les données reçues afin d’assurer la cohérence de certaines variables importantes de l’enquête. On décrit ici les différentes vérifications et imputations qui ont été faites pour l’ECI de 2017.
Âge auquel la condition est apparue et âge auquel la limitation des activités a commencé
Le premier ensemble de vérifications avait trait aux nouvelles questions du module des QII pour chaque type d’incapacité, où les répondants étaient interrogés sur l’âge auquel une difficulté ou condition avait commencéNote et sur l’âge auquel cette difficulté ou condition avait commencé à limiter leurs activitésNote . Un contrôle de la cohérence a été effectué afin de vérifier que l’âge auquel la limitation avait commencé n’était pas inférieur à l’âge auquel la difficulté avait commencé. La seule exception a été pour les incapacités liées au développement, où on demandait l’âge auquel le répondant avait reçu le diagnostic du problèmeNote , par opposition à l’âge auquel la condition avait commencé. Dans ce cas, le diagnostic aurait pu être fait à un âge plus avancé que l’âge auquel les limitations d’activités avaient commencéNote ; et donc aucun contrôle n’était effectué. Pour tous les autres types d’incapacité, lorsqu’il y avait une incohérence, l’âge auquel la difficulté avait commencé était remplacé par l’âge auquel la limitation avait commencé. Environ 3 000 (9 %) cas ont été corrigés de cette façon.
Une fois ces contrôles terminés, un programme spécial était exécuté afin de vérifier la cohérence entre ces deux variables d’âge et l’âge actuel du répondant tel que déclaré au début du questionnaire de l’ECI. Par exemple, l’âge auquel la difficulté a commencé ou l’âge auquel la personne est devenue limitée ne pouvaient pas être supérieurs à l’âge actuel du répondant. Moins de 10 cas ont montré une telle incohérence. Dans certains cas, l’âge auquel la difficulté avait commencé ou l’âge auquel la personne est devenue limitée a été corrigé et, dans d’autres cas, l’âge actuel du répondant a été changé. Il était souvent évident qu’il s’agissait d’erreurs typographiques.
Âge de référence versus âge à l’entrevue
Deux variables d’âge sont présentes dans le fichier analytique de l’ECI : l’âge de référence (REF_AGE) qui correspond à l’âge du répondant en date du 10 mai 2016 (le jour du recensement), et l’âge au moment de l’entrevue (INT_AGE), qui est dérivé le jour de l’entrevue de l’ECI, qui a eu lieu entre le 1er mars et le 30 août 2017. Ces deux variables d’âge ont été dérivées de sorte à être cohérentes. Ainsi, REF_AGE peut être égale ou inférieure à INT_AGE d’au plus deux ans. De façon générale, INT_AGE était toujours considérée valide puisqu’elle était rapportée par le répondant lui-même lors de son entrevue. Certains répondants, toutefois, omettaient de déclarer leur âge lors de l’entrevue, et l’application utilisait alors par défaut l’âge du répondant en date du 1er mars 2017, calculé en fonction de la date de naissance fournie sur la base de sondage.
En examinant les données suite à la collecte, on a comparé l’âge déclaré en date de l’entrevue (INT_AGE) et l’âge en date du 10 mai 2016 (REF_AGE) tel qu’obtenu de la base de sondage. Si REF_AGE différait de plus de deux ans de INT_AGE, on se servait de la date d’entrevue à l’ECI et du jour et mois de naissance déclarés au recensement pour déduire l’année de naissance, et on se servait de celle-ci pour recalculer l’âge du répondant en date du 10 mai 2016 (REF_AGE).
Âge sur la base de diffusion du recensement
Le fichier analytique de l’ECI comprend un grand nombre de variables tirées du questionnaire détaillé du Recensement de 2016. Lorsqu’on a apparié les répondants de l’ECI à la base de diffusion du recensement, on a vu que l’âge sur la base de diffusion du recensement de sept répondants à l’ECI avait été imputéNote à une valeur de moins de 15 ans. Ceci pose un problème puisque plusieurs variables du recensement pour ces sept personnes sont codées « non applicable en raison de l’âge » alors que ce sont des répondants avec qui une entrevue a été faite et qu’on sait qu’ils ont 15 ans ou plus. Pour éviter cette incohérence dans le fichier analytique, on a décidé de trouver des donneurs pour ces sept répondants parmi les répondants à l’ECI en se fondant sur la province, le groupe d’âge, la sévérité de l’incapacité et les types d’incapacité lorsque c’était possible. On a donc remplacé les valeurs de toutes les variables du recensement de ces sept cas par celles de leur donneur. Les variables de l’ECI pour ces sept répondants ont été conservées telles quelles.
Aides et appareils fonctionnels
Une incohérence a été découverte pour certains répondants ayant déclaré qu’ils avaient besoin d’une aide ou d’un appareil fonctionnel qu’ils n’avaient pas présentementNote . Lorsqu’on leur a demandé, dans une question de suivi, de nommer l’aide ou l’appareil fonctionnel dont ils avaient besoin, mais qu’ils n’avaient pas, ils ont répondu « aucun »Note . Dans de tels cas, la réponse à la question initiale a été remplacée par un « Non », indiquant qu’il n’y avait aucune aide ni aucun appareil fonctionnel dont ils avaient besoin, mais qu’ils n’avaient pas. Environ 450 (1 %) cas ont été corrigés de cette façon.
Durée d'occupation de l'emploi et Lien à l’emploi précédent
Une incohérence a été découverte chez un petit nombre de répondants qui avaient indiqué avoir commencé à travailler à leur emploi ou entreprise actuelle en 2017, mais pour lesquels le mois où ils avaient commencé se situait après le mois où l’enquête avait lieuNote . Dans ces rares cas, on a présumé que le répondant avait commencé à son emploi ou son entreprise actuelle au cours du mois déclaré, mais en 2016 et non en 2017; les valeurs en question ont donc été remplacées par 2016. De la même façon, dans le module sur le lien à l’emploi précédent, si un répondant avait indiqué qu’il avait travaillé à un emploi ou une entreprise pour la dernière fois en 2017, mais que le mois fourni était après le mois où l’enquête avait été effectuéeNote , on a présumé que le répondant avait commencé à travailler à son emploi ou son entreprise actuelle au cours du mois déclaré, mais en 2016 et non en 2017; la valeur en question a donc été remplacée par 2016. Environ 15 cas ont été corrigés en lien avec ces trois ensembles de variables.
Vérifications externes
Il y a plusieurs indicateurs dans les secteurs de l’activité sur le marché du travail et du niveau de scolarité qui sont présents dans l’ECI et le recensement et dont les concepts se chevauchent de façon significative. Il se peut que certaines incohérences existent entre les données de ces deux sources. Lorsque de telles incohérences étaient détectées dans l’ECI 2012, les données du recensement étaient supprimées. Ces suppressions entraînaient cependant un inconvénient : lorsque les analystes comparaient des données pour les personnes avec et sans incapacité, les taux de suppressions des personnes avec incapacité dépassaient largement celui des personnes sans incapacité puisque très peu de ces dernières avaient répondu à l’enquête. Pour éviter une telle situation avec l’ECI de 2017, il a été décidé de ne pas procéder à une suppression des données incohérentes. En fait, plusieurs raisons peuvent expliquer ces incohérences : imputation des données au recensement, erreur de réponse due à la réponse par procuration au recensement ou à l’enquête, erreur de réponse due à des problèmes de mémoire ou de compréhension de la question, interversion des données des répondants d’un même ménage au recensement, etc. Ainsi on suggère aux analystes de ne pas tenter d’analyser les changements entre les données du recensement et de l’ECI. Les données du recensement demeurent une source importante d’information pour analyser les caractéristiques des personnes avec et sans incapacité et doivent servir principalement à cette fin.
5.8 Conversion des variables
C’est à cette étape que les noms des variables finales sont établis dans le fichier. Par exemple, la lettre Q qui apparaît dans tous les acronymes des questions est retirée des noms des variables finales. Tous les noms des variables finales doivent respecter une limite de huit caractères.
5.9 Variables dérivées
Afin de faciliter l’analyse approfondie du vaste ensemble de données de l’ECI, on a créé plus de 130 variables dérivées (VD) en regroupant ou en combinant des réponses à une ou plusieurs questions de l’enquête. Tous les noms des VD comportent un « D » à la première position des caractères du nom aux fins d’identification rapide. Les dictionnaires des données de l’ECI de 2017 listent toutes les VD. Les VD sont aussi énumérées par thème dans l’annexe D, accompagnées d’autres indicateurs de l’enquête.
5.10 Variables externes couplées du recensement
En plus des variables de l’ECI, environ 300 variables du recensement ont été ajoutées au fichier de traitement final de l’ECI de 2017 par le biais d’un processus de couplage d’enregistrements. Au début de l’interview de l’ECI de 2017, tous les répondants ont été informés des plans de coupler les données d’enquête de l’ECI avec les renseignements qu’ils avaient fournis dans le cadre du recensement. Tous les renseignements couplés demeurent confidentiels et sont utilisés uniquement à des fins statistiques.
Pour toutes les variables couplées du recensement, le nom de la variable du recensement a été préservé dans la mesure du possible dans la base de données de l’ECI. Certaines exceptions s’appliquaient étant donné que le nom des variables de l’ECI est limité à huit caractères et que celui des variables du recensement dépassait parfois huit caractères. Les dictionnaires de données de l’ECI de 2017 fournissent une liste complète des variables du recensement. Les caractéristiques principales des variables du recensement sont présentées à la section 2.6 ci-dessus.
La structure et le contenu définitifs des fichiers de données sont décrits au chapitre 6.
- Date de modification :