Enquête canadienne sur l’incapacité, 2017 : Guide des concepts et méthodes
6. Pondération et création des fichiers de données définitives

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Passer au texte

Début du texte

6.1 Pondération

Dans une enquête par sondage, chaque répondant représente non seulement lui-même, mais aussi d'autres personnes qui n'ont pas été échantillonnées. C'est pourquoi un poids est assigné à chaque répondant de manière à indiquer le nombre de personnes qu’il représente dans la population. Pour assurer la cohérence des données et s’assurer que les résultats représentent bien l’ensemble de la population cible et non seulement les personnes échantillonnées, ce poids doit être utilisé pour calculer toutes les estimations.

Le calcul des poids pour l’Enquête canadienne sur l’incapacité (ECI) se fait en plusieurs étapes. La première étape consiste à assigner un poids initial fondé sur le plan de sondage à chaque unité sélectionnée pour l’ECI. Le poids initial est l'inverse de la probabilité d'inclusion. Ensuite viennent un certain nombre d’ajustements aux poids pour tenir compte d’exclusions lors de la collecte, de la non-réponse, et pour éviter les poids extrêmes dans les domaines d’estimation. On termine en calant les poids d’enquête sur des totaux estimés du recensement et en procédant à certains ajustements pour tenir compte des unités qui étaient dans le champ de l’enquête lors de la sélection en mai 2016, mais hors champ au moment de l’enquête en 2017. Les sous-sections suivantes décrivent les grandes étapes de la pondération.

Calcul des poids initiaux

Des poids initiaux sont requis pour pondérer l’échantillon des OUI et celui des NON.

Pour l’échantillon des OUI (l’échantillon de l’ECI), puisque le plan d’échantillonnage est fondé sur celui du questionnaire détaillé du recensement (distribué à un échantillon de la population), le poids initial correspond au produit du poids de la base de sondage des OUINote et de l’inverse de la fraction de sondage à l’ECI. La fraction de sondage de l’ECI est calculée en prenant la taille de l’échantillon sélectionné dans une strate, divisé par le nombre d’unités disponibles sur la base de sondage dans cette strate.

Le poids initial pour l’échantillon des NON correspond, quant à lui, au produit du poids final du questionnaire détaillé du recensement et de l’inverse de la fraction de sondage de l’échantillon des NON. Pour en savoir davantage sur la stratégie de pondération de l’échantillon du questionnaire détaillé du recensement, reportez-vous au chapitre 9 du Guide du Recensement de la population.

Les ajustements de poids décrits dans les prochaines sous-sections ne concernent que l’échantillon des OUI, parce qu’aucune donnée n’a été recueillie pour l’échantillon des NON; il n’y a donc aucun ajustement à faire autre que la calibration finale.

Ajustement pour les unités non envoyées à la collecte

L’échantillon qui a été sélectionné pour l’ECI a été gonflé légèrement en prévision de l’exclusion de certaines unités de la collecte pour les raisons suivantes :

On avait estimé ces pertes lors du calcul de la taille d’échantillon, et sur-échantillonné dans certaines strates pour compenser. On a donc traité les unités exclues de la collecte comme des non-répondants et on a procédé à un ajustement des poids pour les unités qui ont été envoyées à la collecte.

Pour ce faire, on a divisé l’échantillon total en deux groupes : les unités envoyées à la collecte et les unités non envoyées à la collecte. On s’est servi d’un modèle de régression logistique pour modéliser la probabilité d’être envoyé à la collecte en se servant des variables de la base du recensement, puisqu’elles sont disponibles pour toutes les unités échantillonnées. Les variables retenues pour ce modèle étaient : le groupe autochtone, le mode de collecte du recensement, un indicateur de faible revenu pour le ménage, la taille du ménage, l’état matrimonial, la strate (combinaison du type de région et du niveau de sévérité), le nombre de chambres à coucher du logement, l’indicateur de centre de population, le fait d’accepter que ses données du recensement soient rendues publiques dans 92 ans, le type de famille de recensement, le revenu du ménage, la langue parlée à la maison, le type de logement, un indicateur de propriété versus location du logement, l’âge et le sexe de la personne sélectionnée. On a également tenu compte de l’interaction entre certaines de ces variables.

Grâce à ce modèle, on a obtenu, pour chaque unité de l’échantillon, une probabilité d’être envoyée à la collecte. On a ensuite formé des classes de réponse homogènes en groupant les unités avec une probabilité d’être envoyées à la collecte similaires. On s’est servi d’une méthode automatique de formation des classesNote afin de générer des classes homogènes en termes de probabilité prédite, et comprenant un nombre suffisant d’unités envoyées à la collecte pour éviter de trop grands facteurs d’ajustement des poids. Au total, 42 classes ont été formées, et à l’intérieur de chacune, le poids des unités qui n’ont pas été envoyées à la collecte a été redistribué aux unités qui ont été envoyées.

Ajustements pour le non-contact et la non-réponse

La non-réponse à l’ECI se divisait en deux grandes catégories : le non-contact, et la non-réponse suite au contact. Ces deux types de non-réponses étaient traités séparément puisqu’ils représentaient deux phénomènes différents. En effet, les facteurs qui expliquaient le non-contact étaient davantage liés aux caractéristiques du ménage et à la mobilité géographique des personnes, tandis que ceux qui expliquaient la non-réponse dans un ménage contacté étaient davantage liés aux caractéristiques des individus.

Dans un premier temps, les unités envoyées sur le terrain ont été séparées en deux grands groupes : les unités contactées, et celles non contactées. On s’est servis de la régression logistique pour modéliser la probabilité d’être contacté. Les variables explicatives pour ce modèle provenaient de la base du recensement. Les variables retenues pour le modèle de non-contact étaient : le fait d’être propriétaire ou locataire de son logement, le domaine d’estimation, le mode de déclaration au recensement, la structure de la famille de recensement, un indicateur de mobilité géographique dans la dernière année, le plus haut niveau de scolarité terminé, l’état du logement, le fait d’accepter que ses données du recensement soient rendues publiques dans 92 ans, le fait d’être un Indien inscrit, un indicateur d’une condition d’ordre émotionnel, psychologique ou de santé mentale, un indicateur de mobilité géographique dans les cinq dernières années, le revenu total du ménage, le nombre de personnes dans le ménage, la profession, la langue parlée à la maison, un indicateur d’autres problèmes de santé ou conditions à long terme, le type de construction résidentielle, le groupe d’âge, un indicateur de difficulté à voir, le revenu total de la personne, le mode de transport principal pour aller au travail, le nombre d’enfants de la personne et son sexe.

Grâce à ce modèle, on a obtenu, pour chaque unité (contactée ou non), une probabilité d’être contactée. On a ensuite formé des classes de réponse homogènes en groupant les unités dont la probabilité d’être contactées était similaire. On s’est servi d’une méthode automatique de formation des classesNote afin de générer des classes homogènes en termes de probabilité prédite d’être contacté, et comprenant un nombre suffisant d’unités contactées pour éviter de trop grands facteurs d’ajustement des poids. Au total, 70 classes ont été formées, et à l’intérieur de chacune, le poids des unités non contactées a été redistribué aux unités contactées.

Ensuite, un ajustement a été fait pour un sous-ensemble des personnes contactées pour qui on sait qu’une incapacité ou une condition de santé ne leur permettait pas de répondre, ou qui ont répondu au module des Questions d’identification des incapacités (QII) (et selon leurs réponses ont une incapacité), mais pas au reste de l’entrevue de l’ECI, et donc ne peuvent pas être considérées comme des répondants. Puisque le nombre de cas de ce type était minime (environ 200), on a procédé à un ajustement relativement simple au niveau des strates, où le poids des non-répondants avec incapacité a été réparti parmi les répondants avec incapacité.

L’étape suivante consistait à ajuster les poids pour tenir compte des autres non-répondants (généralement des refus). Encore une fois, on s’est servi de la régression logistique pour modéliser la probabilité de répondre étant donné qu’un contact avait eu lieu au niveau du ménage. Les variables retenues pour le modèle de non-réponse avec contact étaient : le domaine d’estimation (combinaison de la province et du groupe d’âge), la strate (combinaison du type de région et du niveau de sévérité), l’état matrimonial, le fait d’accepter que ses données du recensement soient rendues publiques dans 92 ans, la situation de la personne dans le ménage, l’indicateur d’une condition d’ordre émotionnel, psychologique ou de santé mentale, l’indicateur d’autres problèmes de santé ou conditions à long terme, l’indicateur d’une difficulté à voir, l’indicateur d’appartenance à une minorité visible, le plus haut niveau de scolarité, le revenu total du ménage, le fait de vivre dans un grand centre urbain ou non, le nombre de chambres à coucher dans le logement, le fait de posséder ou louer son logement, le nombre de soutiens dans le ménage, le secteur du SCIANNote , la connaissance des langues officielles, la première langue officielle parlée, la langue maternelle inuite, le lieu de résidence un an auparavant, et le principal mode de transport du trajet du domicile au lieu de travail.

Grâce à ce modèle de non-réponse, on a obtenu, pour chaque unité (répondanteNote ou non), une probabilité de répondre étant donné le contact. On a ensuite formé des classes de réponse homogènes en groupant les unités dont la probabilité de répondre était similaire. La même procédure que celle pour le modèle de contact a été utilisée et a résulté en la formation de 52 classes. À l’intérieur de chaque classe, le poids des unités non répondantes a été redistribué parmi les unités répondantes.

À noter que les unités hors champ (les décès, les entrées en établissement, les personnes qui vivent maintenant à l’extérieur du pays, etc.) ont été considérées au départ comme des unités répondantes, dans le sens où on a pu parler à quelqu’un de leur ménage qui nous a confirmé leur statut de hors-champ. On n’a pas mis leur poids à zéro, on a plutôt conservé leur poids puisqu’elles représentaient des unités de la population de départ (au 10 mai 2016) qui étaient sorties du champ de l’enquête au printemps 2017. Ces unités sont toutefois exclues du fichier analytique.

Ajustement pour poids extrêmes par province

Suite aux ajustements pour le non-contact et la non-réponse, on a vérifié la distribution des poids des répondants pour détecter la présence de très grands poids par province ou par domaine d’estimation. En effet, certains facteurs d’ajustement pouvaient avoir généré de très grands poids pour certains individus comparativement aux autres dans certains domaines, et ceci pouvait avoir un effet néfaste sur les estimations et leur variance. On a donc utilisé une méthode appelée « écart-sigma » pour détecter ces poids extrêmes d’abord à l’intérieur de chaque province. Un exemple d’application de la méthode de l’écart-sigma est décrit dans Bernier et Nobrega (1998)Note . La méthode de l’écart-sigma, telle qu’utilisée dans cette situation, visait à détecter les grands écarts entre deux poids successifs (et supérieurs à la médiane), lorsque ceux-ci étaient triés en ordre croissant. Lorsqu’on trouvait un écart qu’on jugeait trop grand entre deux poids successifs, le plus grand des deux poids et tous les suivants étaient alors catégorisés comme étant aberrants. Pour juger de la grandeur d’un écart entre deux poids, on le comparait à l’écart-type de la distribution de tous les poids, multipliée par un certain chiffre. Pour l’ECI, on a cherché à détecter les écarts entre les poids supérieurs à deux fois l’écart-type de la distribution au sein de chaque province. La valeur de deux a été choisie puisque c’est celle qui permettait d’identifier les poids aberrants qu’on aurait nous-mêmes identifiés si on avait appliqué une procédure manuelle. Tous les poids identifiés comme étant aberrants ont été fixés à la plus grande valeur non aberrante de la province. Au total, 11 unités ont vu leur poids réduit. La diminution des poids au cours de cette étape sera compensée à l’étape de la calibration.

Avant de procéder à l’identification des poids extrêmes au niveau des domaines d’estimation, on a d’abord examiné les transfuges de domaines d’estimation.

Transfuges de domaines d’estimation et poids extrêmes par domaine

Les domaines d’estimation de l’ECI sont le résultat du croisement de la province et du groupe d’âge. L’âge utilisé était obtenu de la base de données des réponses du recensement. Il arrive que l’âge rapporté au recensement ne soit pas exact, soit parce que la personne qui a répondu au questionnaire du recensement pour le ménage a fait une erreur, soit à cause d’une erreur de saisie ou un problème de lecteur optique pour les questionnaires papier. Il arrive aussi qu’aucune date de naissance ou âge ne soit donné au recensement et qu’on doive imputer un âge approximatif sur la base de sondage. Puisqu’on demande l’âge de chaque répondant au début de l’entrevue de l’ECI, on peut ensuite assigner les répondants au bon domaine d’estimation. Ainsi, 183 répondants à l’ECI ont changé de domaine d’estimation. Pour ces cas, on a comparé leur poids à la fourchette des poids de leur nouveau domaine. Lorsque le poids de l’individu tombait dans la fourchette des poids de son nouveau domaine, celui-ci était conservé tel quel. Cependant, lorsqu’il tombait en dehors de la fourchette des poids de son nouveau domaine, on le changeait pour mettre la valeur minimum (si le poids était inférieur à la fourchette) ou maximum (si le poids était supérieur à la fourchette) du nouveau domaine. On a ajusté ainsi le poids de 34 personnes dans l’échantillon de l’ECI.

On a ensuite réutilisé la méthode de l’écart-sigma, au niveau du domaine d’estimation final cette fois, toujours en comparant la distance entre deux poids successifs (et supérieurs à la médiane) par rapport à deux fois l’écart-type de la distribution des poids du domaine. Cette fois, sept unités ont vu leur poids réduit. La réduction des poids au cours de cette étape sera compensée à l’étape de la post-stratification.

Post-stratification

Une post-stratification a été faite pour l’échantillon des OUI et une autre pour celui des NON. Ensuite, les poids de l’échantillon des NON ont été ajustés pour tenir compte de certaines pertes observées dans l’échantillon des OUI entre le recensement et la collecte de l’ECI, mais impossibles à observer dans l’échantillon des NON, pour lequel on ne fait aucune collecte. Ces pertes sont dues principalement aux décès, aux entrées en établissements et aux émigrants. On décrit ces étapes dans les sections suivantes.

La post-stratification pour l’échantillon des OUI consistait à ajuster les poids des répondants à l’ECI (c’est-à-dire les cas hors champ, les répondants avec incapacité et les répondants sans incapacité) de sorte à obtenir les mêmes totaux pondérés que ceux du recensement de la population (questionnaire détaillé, excluant les réserves des Premières Nations et les moins de 15 ans) pour la population des OUI et ce, par province, groupe d’âge, sexe et sévérité. Par sévérité, on entend les trois niveaux de sévérité utilisés pour stratifier l’ECI à partir des réponses aux six questions filtres sur les Activités de la vie quotidienne. Les groupes d’âge sur lesquels on a post-stratifié dans les 10 provinces sont les suivants : les 15 à 24 ans, les 25 à 34 ans, les 35 à 44 ans, les 45 à 54 ans, les 55 à 64 ans, les 65 à 74 ans et les 75 ans et plus. On a choisi d’utiliser des groupes d’âge de 10 ans et non de 5 ans afin de pouvoir calibrer pour chacun des trois niveaux de sévérité dans chacun des groupes d’âge. Dans les trois territoires, on a post-stratifié pour trois groupes d’âge : les 15 à 44 ans, les 45 à 64 ans et les 65 ans et plus. De plus, au Nunavut, on a combiné les 3 niveaux de sévérité chez les 65 ans et plus à cause des faibles tailles d’échantillon.

Une post-stratification semblable a été faite aux poids préliminaires de l’échantillon des NON en partant du poids initial calculé plus tôt. Pour cet échantillon, on a post-stratifié par province, groupe d’âge de 5 ans et sexe. La sévérité étant nulle pour l’ensemble de la population des NON, nul besoin de post-stratifier selon cette variable. Les groupes d’âge sur lesquels on a post-stratifié dans les 10 provinces et les 3 territoires sont les suivants : 15 à 19 ans, les 20 à 24 ans, les 25 à 29 ans, les 30 à 34 ans, les 35 à 39 ans, les 40 à 44 ans, les 45 à 49 ans, les 50 à 54 ans, les 55 à 59 ans, les 60 à 64 ans, les 65 à 69 ans, les 70 à 74 ans et les 75 ans et plus.

Ajustement pour les cas hors champ

Lors de la collecte de l’ECI, on a identifié un certain nombre de cas hors champ parmi les répondants sélectionnés. Le poids associé à ces cas hors champ permet d’estimer le nombre de personnes dans la population des OUI qui sont devenues hors champ entre le jour du recensement et la collecte de l’ECI. La collecte de l’ECI s’est déroulée de 11 à 16 mois après le recensement, et on estime à un peu plus de 196 000 le nombre de cas hors champ dans la population des OUI, ce qui correspond à 2 % de la population des OUI. Le tableau suivant présente une estimation des cas hors champ de la population des OUI selon leur type.


Tableau 6.1
Estimations des cas hors champ dans la population des OUI
Sommaire du tableau
Le tableau montre les résultats de Estimations des cas hors champ dans la population des OUI. Les données sont présentées selon Type de cas hors champ (titres de rangée) et Non pondéré, Pondéré et
Pondéré, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Type de cas hors champ Non pondéré Pondéré Pondéré
nombre pourcentage
Décès 703 139 810 71,2
Admissions en institution 318 47 920 24,4
Émigrants 24 6 100 3,1
Personnes de moins de 15 ans 13 1 790 0,9
Autre 7 710 0,4
Total 1 065 196 330 100,0

Les trois types de cas hors champ les plus fréquents dans la population des OUI sont les décès (72 % des cas hors champ), les entrées en établissements (24 % des cas hors champ) et les émigrants (3 % des cas hors champ). Les autres types de cas hors champ sont peu nombreux.

Puisque les cas hors champ sont exclus du fichier analytique et donc des taux d’incapacité, il est important de tenter d’exclure également les cas hors champ au dénominateur du taux (qui comprend à la fois la population des OUI et des NON) pour ne pas sous-estimer les taux d’incapacité. Comme l’échantillon des NON n’a pas été envoyé à la collecte, il n’est pas possible d’identifier directement les cas hors champ. On ne peut pas non plus supposer que la proportion des cas hors champ dans la population des NON est la même que celle de la population des OUI, surtout en ce qui a trait aux décès et aux placements en établissements. On a donc eu recours à une méthode indirecte pour estimer et exclure certains cas hors champ de la population des NON. Il n’est pas possible de corriger pour tous les types de pertes dans l’échantillon des NON puisqu’il n’existe souvent aucune donnée fiable pour le faire. Mais on tente de corriger là où c’est possible de le faire.

Ainsi, on a fait appel à la Division de la démographie pour obtenir des taux d’attrition de la population de 15 ans et plus entre le 10 mai 2016 et le milieu de la collecte de l’ECI (le 1er juin 2017). Ces taux sont calculés pour l’ensemble de la population incluant les logements collectifs et établissements, mais excluant les réserves des Premières Nations. Ils sont ensuite appliqués à la population couverte par le questionnaire détaillé du Recensement de 2016 (donc excluant les logements collectifs et établissements ainsi que les réserves des Premières Nations) pour obtenir une estimation du nombre total de pertes dues aux décès et à l’émigration pour cette population. Puisque ces pertes couvrent l’ensemble de la population (c.-à-d. les OUI et les NON), on peut leur soustraire l’estimation des décès et émigrants obtenue de la population des OUI, et ainsi obtenir une estimation des pertes dues aux décès et à l’émigration dans la population des NON. Le poids de l’échantillon des NON est ainsi ajusté à la baisse pour refléter ces pertes. L’ajustement est fait par province/territoire, groupe d’âge et sexe.

Lorsqu’on utilise cette méthode, les pertes sont légèrement surestimées puisque les taux d’attrition sont calculés sur une population qui inclut les personnes qui vivaient en établissement au moment du recensement. En revanche, il n’est pas possible de corriger la population des NON pour les pertes dues aux placements en établissement, ce qui compense un peu la surestimation. Notez qu’il est possible qu’une partie des décès survenus en établissement touchent des personnes qui, au moment du recensement, vivaient dans des ménages privés, mais ont depuis été placées en établissement puis sont décédées. Ainsi, une partie de la sur-correction pour les décès compense le fait qu’aucune correction n’est faite pour les placements en établissement.  

Dans la population des OUI, on estime à environ 146 000 le nombre de décès et émigrants entre le 10 mai 2016 et le 1er juin 2017, ce qui correspond à 1,5 % de la population des OUI au recensement. L’ajustement pour les décès et émigrants dans la population des NON a réduit cette population d’environ 168 000 personnes, soit 0,9 % de la population des NON au recensement.

Le tableau 6.2 présente les comptes de population avant et après l’exclusion des cas hors champ pour les populations des OUI et des NON.


Tableau 6.2
Comptes pondérés de la population des OUI et des NON
Sommaire du tableau
Le tableau montre les résultats de Comptes pondérés de la population des OUI et des NON. Les données sont présentées selon Population (titres de rangée) et Comptes pondérés
avant l'exclusion des cas hors champ et Comptes pondérés
après l'exclusion des cas hors champ, calculées selon nombre unités de mesure (figurant comme en-tête de colonne).
Population Comptes pondérés
avant l'exclusion des cas hors champ
Comptes pondérés
après l'exclusion des cas hors champ
nombre
Population des OUI 10 016 500 9 820 170
Population des NON 18 360 000 18 188 690
Total 28 376 500 28 008 860

6.2 Structure et contenu des fichiers

On a créé pour l’ECI deux fichiers analytiques : un fichier comprenant les personnes avec incapacité, et un autre comprenant les personnes sans incapacité. Selon le type d’analyse à effectuer, les chercheurs devront utiliser le fichier de personnes avec incapacité seulement ou utiliser les deux fichiers ensemble.

Le fichier de personnes avec incapacité comprend les personnes sélectionnées à l’ECI qui, selon la définition de l’incapacité retenue pour l’ECI, sont considérées comme ayant une incapacité. Ce fichier est le plus complet des deux. Il contient à la fois toutes les données de l’ECI, et plusieurs variables provenant du recensement. Toute analyse visant exclusivement les personnes avec incapacité peut être faite grâce à ce seul fichier.

Le fichier de personnes sans incapacité, quant à lui, comprend deux groupes de personnes : le premier groupe provenant de l’échantillon des OUI de l’ECI, le deuxième de l’échantillon des NON. Les deux groupes sont les suivants :

Le fichier de personnes sans incapacité comprend donc un contenu différent, selon le groupe de personnes concerné. Pour les personnes du groupe « a », les faux positifs, on n’a que les données du module des QII provenant de l’ECI puisque l’entrevue s’est terminée immédiatement après ce module. On a cependant aussi accès aux variables du recensement pour ce groupe. Pour les personnes du groupe « b », provenant de l’échantillon des NON, on n’a que les variables du recensement puisque ces unités n’ont pas fait l’objet d’une collecte de l’ECI.

Le fichier de personnes sans incapacité doit être utilisé conjointement avec le fichier de personnes avec incapacité pour deux types d’analyses : 1) le calcul de taux d’incapacité, puisque le dénominateur doit inclure à la fois les personnes avec et sans incapacité ; 2) la comparaison des caractéristiques du recensementNote des personnes avec et sans incapacité.

Pour être en mesure de différencier chaque groupe de personnes dans les fichiers, on a créé une variable dérivée, CSDPOPFL, qui prend la valeur 1 pour les personnes avec incapacité, la valeur 2 pour les personnes sans incapacité du groupe « a » (les faux positifs), et la valeur 3 pour les personnes sans incapacité du groupe « b » (l’échantillon des NON).

Le tableau suivant résume le contenu de chaque fichier pour chacun des groupes de personnes. On constate que les deux fichiers comprennent différents ensembles de variables. Le fichier analytique sur les personnes AVEC une incapacité comporte un ensemble complet de variables. Pour ce qui est du fichier analytique sur les personnes SANS incapacité, certaines des variables seront absentes du fichier. Les variables manquantes seront légèrement différentes pour chacun des deux groupes de population inclus dans ce fichier. Par conséquent, lors de l’utilisation conjointe du fichier analytique sur les personnes AVEC une incapacité et du fichier analytique sur les personnes SANS incapacité, certaines variables afficheront des valeurs manquantes pour les personnes SANS incapacité.


Tableau 6.3
Contenu disponible selon différents groupes de personnes dans les fichiers analytiques de l’Enquête canadienne sur l’incapacité
Sommaire du tableau
Le tableau montre les résultats de Contenu disponible selon différents groupes de personnes dans les fichiers analytiques de l’Enquête canadienne sur l’incapacité. Les données sont présentées selon Fichier analytique (titres de rangée) et Groupe de population, CSDPOPFL, Variables
démographiques, QII, Contenu thématique ECI, Variables du recensement et Poids-personne final(figurant comme en-tête de colonne).
Fichier analytique Groupe de population CSDPOPFL Variables
démographiques
QII Contenu thématique ECI Variables du recensement Poids-personne finaltbl6-3 Contenu Note 1
Fichier des personnes AVEC une incapacité Personnes AVEC une incapacité 1 Note : contenu disponible Note : contenu disponible Note : contenu disponible Note : contenu disponible Note : contenu disponible
Fichier des personnes SANS incapacité Personnes SANS incapacité
(groupe (a))
2 Note : contenu disponible Note : contenu disponible Note : contenu disponible Note : contenu disponible
Personnes SANS incapacité
(groupe (b))
3 Note : contenu disponible Note : contenu disponible Note : contenu disponible

Note sur les périodes de référence

Lorsqu’on calcule des taux d’incapacité ou qu’on cherche à comparer les caractéristiques des personnes avec et sans incapacité, la date de référence est le 10 mai 2016, soit le jour du Recensement. Il s’agit de la date à laquelle le plan d’échantillonnage de l’ECI a été défini et où les indicateurs de recensement comparatifs ont été recueillis pour les personnes avec et sans incapacité. En revanche, lorsqu’on s’intéresse uniquement aux caractéristiques des personnes avec incapacité, on a recours aux données recueillies et mesurées dans le cadre de l’ECI au printemps et à l’été 2017. La période de référence est donc du 1er mars au 30 août 2017.

En d’autres mots, les personnes avec incapacité de l’ECI sont des personnes qui ont déclaré avoir de la difficulté parfois, souvent ou toujours à la question sur les activités de la vie quotidienne du questionnaire détaillé du Recensement de 2016, et qui, en 2017, ont déclaré une incapacité à l’ECI. Les caractéristiques de l’ECI pour les personnes avec incapacité représentent donc des informations de 2017 au sujet d’une population définie en 2016.

6.3 Ensembles de données finaux et dictionnaires de données

Les fichiers de données finaux comprennent :

Les fichiers analytiques sont des fichiers de diffusion avec protection accrue de la confidentialité des répondants aux fins de diffusion et de distribution dans les CDR partout au Canada. Ils sont aussi utilisés à Statistique Canada pour produire des tableaux de données en réponse aux demandes des clients. Les poids des personnes sont inclus dans les fichiers. La pondération est décrite de façon plus détaillée à la section 6.1.  Enfin, toutes les variables temporaires ou les variables utilisées exclusivement à des fins de traitement ont été supprimées des fichiers analytiques.

Voici les documents complémentaires qui accompagnent les fichiers analytiques de l’ECI de 2017 :

Les fichiers de données de l’ADTR sont hébergés à Statistique Canada afin que les abonnés puissent les utiliser et exécuter à distance des programmes statistiques sur les données. Ces fichiers sont des fichiers de données analytiques, mais ont fait l’objet de plus amples traitements. Toutes les géographies infraprovinciales ont été retirées, permettant une analyse uniquement aux niveaux national, provincial et territorial.

Pour les utilisateurs de l’ADTR, des dictionnaires de données sont fournis, lesquels comprennent des descriptions complètes de toutes les variables, mais sans fréquences de données, ce que l’on appelle les versions « zéro fréquence ».

6.4 Lignes directrices pour l’analyse

On a élaboré un guide de l’utilisateur pour les fichiers analytiques. Ce guide décrit étape par étape la façon d’utiliser les fichiers de données de l’ECI. Le guide de l’utilisateur comprend des lignes directrices pour la mise en tableau et l’analyse statistique, la marche à suivre pour appliquer les poids nécessaires aux données, de l’information concernant des progiciels disponibles, et des lignes directrices pour la diffusion des données, comme les règles d’arrondissement. La procédure permettant d’estimer la fiabilité des estimations quantitatives et qualitatives est décrite de façon détaillée.

Pour les utilisateurs de l’ADTR, les règles de confidentialité et les normes de fiabilité sont appliquées à toutes les demandes de totalisation de façon automatisée par le système d’ADTR.

Le Guide de l’utilisateur de l’ECI doit être utilisé en complément du Guide des concepts et des méthodes et des dictionnaires de données.

 


Date de modification :