Guide des concepts et méthodes
6. Pondération

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Passer au texte

Début du texte

6.1 Poids initiaux

Le poids initial d’une unité donnée dans une strate de l’EAPA correspond au produit de deux composantes : l’inverse de la fraction de sondage dans la strate et le poids corrigé du recensement pour l’unité en question. La fraction de sondage dans la strate est calculée comme étant le nombre de personnes sélectionnées pour l’EAPA dans chaque strate, divisé par le nombre total de répondants au recensement disponibles pour cette strate. Le poids du recensement utilisé est le poids de sondage du recensement corrigé pour la non-réponse et pour le chevauchement avec d’autres enquêtes (voir la sous-section 3.2.4).

6.2 Ajustement pour les unités non envoyées à la collecte

Pour différentes raisons, certaines unités échantillonnées n’ont pas été envoyées à la collecte. Ces unités comprenaient entre autres:

  1. les unités pour lesquelles déjà trois membres de leur même ménage avaient été sélectionnés;
  2. les unités sélectionnées pour l’échantillon additionnel (voir la sous-section 3.2.3) faisant partie d’un ménage dont certains des membres avaient déjà été sélectionnés (en raison d’exigences opérationnelles, les membres de ces ménages, sélectionnés pour l’échantillon additionnel, n’étaient pas éligibles pour la collecte);
  3. les unités sans nom ni date de naissance;
  4. les enregistrements en double repérés par les chevauchements de noms, de dates de naissance et d’adresses à la suite de la sélection de l’échantillon;
  5. les unités de la réserve de Whapmagoostui sélectionnées par erreur, tel que mentionné à la sous-section 3.2.3.

Dans les premier, deuxième et troisième cas, un ajustement par ratio a été effectué selon la région, le groupe autochtone et le groupe d’âge. Les poids des unités retirées des premier, deuxième et troisième cas ont été mis à zéro et les poids des unités restantes ont été augmentés proportionnellement (ajustement par ratio) à l’intérieur d’une région, d’un groupe autochtone et d’un groupe d’âge. Les poids des enregistrements en double et des unités de la réserve de Whapmagoostui ont simplement été mis à zéro. En tout, ce sont 405 unités qui n’ont pas été envoyées à la collecte.

6.3 Ajustement pour tenir compte de la non-réponse

Deux ajustements ont été effectués pour deux types différents de non-réponse : les personnes sélectionnées pour lesquelles aucun contact n’avait été établi (« non-contact » : 3 994 personnes) et les personnes contactées qui n’ont pas fourni (ou qui n’ont pas pu fournir) de renseignements sur elles-mêmes (« non-réponse avec contact » : 5 874 personnes). Cette seconde forme de non-réponse est principalement associée aux refus ou aux refus par omission. Un exemple de refus par omission pourrait être une personne contactée à plusieurs reprises qui repousse continuellement l’entrevue à plus tard. Deux ajustements ont été effectués puisque les caractéristiques des gens qu’on ne réussit pas à contacter sont souvent différentes des caractéristiques des gens qui refusent de répondre, une fois contactés.

Les poids ont d’abord été ajustés pour tenir compte des cas de « non-contact », puis des cas de « non-réponse avec contact ». Dans ce qui suit, le terme « non-réponse » sera utilisé pour les deux types de non-réponse.

Chaque ajustement pour tenir compte de la non-réponse a été effectué en trois étapes. À la première étape, un modèle de régression logistique a été utilisé pour prédire la probabilité de répondre (probabilité d’obtenir une réponse) pour chaque unité (à la fois pour les unités répondantes et non répondantes), à partir d’une série de variables explicatives. Ces variables explicatives sont scindées en deux groupes. Dans le premier groupe, on trouve les caractéristiques « personnes » ou « ménages » provenant du Recensement de 2016 pour la personne sélectionnée (p. ex. groupe autochtone de la personne sélectionnée, nombre de personnes dans le ménage de la personne sélectionnée, etc.). Dans le second groupe de variables explicatives, on trouve les variables de collecte appelées « paradonnées ». Le nombre de tentatives entreprises pour entrer en contact avec une personne ou le fait que des tentatives de dépistage aient été requises ou non sont des exemples de paradonnées. Les paradonnées ont été considérées comme des variables utiles pour prédire la réponse ou la non-réponse puisque plusieurs de ces variables mesurent les efforts déployés pour contacter une personne ou pour obtenir une réponse d’une personne contactée. Par exemple, les personnes pour lesquelles un nombre important de tentatives de contacts ont été nécessaires pour établir un premier contact peuvent être considérées comme très semblables aux personnes qui n’ont pas été contactées malgré de nombreuses tentatives.

Dans le cadre de la deuxième étape, les répondants et non-répondants ayant des probabilités prédites de réponse semblables ont été répartis en classes d’ajustement en se servant de l’analyse de classification. Une simulation a été effectuée pour déterminer de façon approximative le nombre optimal de classes ainsi que le nombre de répondants minimum par classe. Le taux de réponse a été calculé pour chacune des classes en fonction du nombre de répondants et de non-répondants dans la classe. Le taux de réponse calculé a ensuite été pondéré à partir des poids obtenus à l’étape d’ajustement précédente.

Dans le cadre de la troisième étape, les poids des unités répondantes à l’intérieur de chaque classe ont été ajustés à l’aide de l’inverse du taux de réponse pondéré de cette catégorie. Les poids des unités non-répondantes ont été mis à zéro.

Il est important de noter qu’à cette étape, toutes les unités considérées comme étant hors du champ de l’enquête ont été classées comme étant des répondants. En effet, tous les renseignements nécessaires pour déterminer qu’elles étaient hors du champ de l’enquête ont été obtenus de ces personnes. Les poids de ces unités ont été mis à zéro à l’étape de la deuxième poststratification (présentée à la section 6.5) et ces unités ont été retirées du fichier analytique. Le fait de les conserver jusqu’à cette étape permettra de produire à l’interne des estimations pondérées de différents groupes d’unités hors de la population cible. Cela sera, entre autres, très utile pour l’estimation de certains paramètres lors d’une prochaine enquête.

6.4 Ajustement pour les répondants partiels

Les répondants partiels correspondent aux personnes ayant déclaré une identité autochtone dans l’EAPA mais qui n’ont pas fourni suffisamment de renseignements pour satisfaire à la définition de répondant tel que décrite à la section 5. Les répondants partiels sont au nombre de 362, ce qui devrait avoir peu d’incidence sur les estimations.

Un ajustement par ratio a été effectué selon la région, le groupe autochtone et le groupe d’âge mesurés dans le cadre du Recensement de 2016. Sachant que ces répondants partiels ont déclaré une identité autochtone, seuls les poids des répondants d’identité autochtone ont été augmentés pour tenir compte du retrait des répondants partiels (les poids des unités hors champ, y compris les personnes s’étant déclarées non-Autochtones à l’EAPA, n’ont pas été modifiés). Les poids des répondants partiels ont alors été mis à zéro.

6.5 Poststratification

La poststratification (aussi appelée ajustement par stratification a posteriori) fait en sorte que la somme des poids ajustés des unités répondantes corresponde aux estimations du recensement, selon différents groupes appelés poststrates.

Dans le cas de l’EAPA, deux poststratifications distinctes ont été effectuées. La première poststratification visait à ajuster, par poststrate, les poids à la population d’identité ou d’ascendance autochtone estimée par le recensement en utilisant les variables d’identité et d’ascendance qui ont été prises de la BDR (voir la sous-section 3.1.3) lors de la sélection de l’échantillon (et non les variables mesurées à l’EAPA qui ont plutôt fait l’objet de la 2e poststratification). Les poststrates ont été définies à partir de certaines combinaisons de la région, du type d’Autochtone (identité autochtone ou ascendance autochtone seulement), du groupe autochtone (Première Nation avec statut, Première Nation sans statut, Métis, Inuit, autre) et du groupe d’âge. La distinction pour les groupes Première Nation avec et sans statut a été faite uniquement pour les provinces entre l’Ontario et la Colombie-Britannique. Les estimations du recensement à partir desquelles les poids de l’EAPA ont été ajustés correspondent exactement à la couverture de l’EAPA, c’est-à-dire à la population d’identité ou d’ascendance autochtone âgée de 15 ans et plus au 15 janvier 2017, excluant celle vivant dans les réserves et certaines communautés de Premières Nations dans les territoires.

Les poids ont été ajustés selon le ratio de l’estimation pondérée du recensement et de l’estimation pondérée de l’échantillon de l’EAPA pour chaque poststrate. Cela fait en sorte que l’échantillon ne sous-représentait ou ne surreprésentait pas certaines combinaisons de groupes autochtones, régions et groupes d’âge du recensement.

Étant donné que les réponses aux questions définissant la population d’identité autochtone (présentées à la sous-section 3.1.1) pouvaient différer entre l’EAPA et le recensement, une seconde poststratification a été effectuée. Il est à noter que les questions de l’EAPA définissant la population d’identité autochtone étaient légèrement différentes de celles posées dans le cadre du recensement (voir le tableau 1 à la section 2 et la sous-section 3.1.1). La seconde poststratification faisait en sorte que la population d’identité autochtone, estimée à partir des questions de l’EAPA, correspondait à celle définie dans le cadre du recensement à l’intérieur de chaque poststrate. Contrairement à la première poststratification, la deuxième n’était pas une poststratification classique au cours de laquelle les poids étaient réajustés pour tenir compte de la sous-représentation ou surreprésentation de certains groupes dans l’échantillon. En effet, les réponses aux questions sur l’identité autochtone de l’EAPA pouvaient être différentes de celles obtenues dans le cadre du recensement pour diverses raisons (section 8.1). Il s’agissait plutôt d’une poststratification effectuée pour faire en sorte que les comptes de population d’identité autochtone selon l’EAPA soient les mêmes que ceux obtenus dans le cadre du recensement. Après cette étape, seuls les répondants ayant une identité autochtone selon l’EAPA avaient des poids positifs. Les poids des unités hors champ avaient été mis à zéro.

Les secondes poststrates étaient formées de certaines combinaisons spécifiques de la région, du groupe d’identité autochtone (Première Nation avec statut, Première Nation sans statut, Métis, Inuit) ainsi que du groupe d’âge. Puisqu’il était impossible de préserver les comptes d’identité multiples entre l’EAPA et les estimations du recensement (comptes trop petits et écarts trop grands), les personnes ayant déclaré une identité de Première Nation et Métis, Première Nation et Inuit ou Première Nation, Métis et Inuit ont été combinées à celles ayant déclaré une identité de Première Nation lors de la seconde poststratification. Les personnes ayant déclaré une identité de Métis et d’Inuit ont été combinées aux Métis. De plus, contrairement à l’EAPA de 2012, l’EAPA de 2017 n’impute pas les répondants du groupe « Indien avec statut ou membre d’une Première Nation/bande indienne seulement » comme faisant partie du groupe Première Nation. Les personnes qui ont déclaré être Indien avec statut ou membre d’une Première Nation sans avoir déclaré s’identifier à un groupe autochtone ont été conservées dans un quatrième groupe d’identité distinct (réponses autochtones non incluses ailleurs), ce qui permet d’être en ligne avec les concepts du recensement. Cependant, lors de la seconde poststratification, les personnes de ce groupe ont été combinées avec le groupe Première Nation. En effet, ce groupe comptait peu d’unités et leur regroupement avec le groupe Première Nation permettra une meilleure comparabilité entre les estimations de l’EAPA de 2017 et celles de l’EAPA de 2012.

6.6 Ajustement des poids extrêmes — méthode de l’écart-sigma

Une fois les ajustements de poids précédents effectués, certains poids pouvaient avoir de très grandes valeurs comparativement aux autres. Cela aurait pu créer des problèmes lors de l’estimation si, en plus d’avoir de très grands poids, ces unités avaient aussi des caractéristiques très différentes des unités avec de plus petits poids. Une méthode appelée « écart-sigma » a été utilisée pour détecter les poids extrêmes à l’intérieur de chaque poststrate, les poststrates étant étroitement liées aux domaines d’estimation de l’enquête (voir la sous-section 3.2.1). Un exemple d’application de la méthode de l’écart-sigma est décrit dans Bernier et Nobrega (1998).Note La méthode de l’écart-sigma, telle qu’utilisée ici, visait à détecter les poids extrêmes en calculant la différence entre deux poids successifs, après que ceux-ci aient été triés en ordre décroissant. Cette différence a été comparée à n*l’écart type des poids à l’intérieur de chaque poststrate. Si la différence dépassait n*l’écart type des poids, le plus grand des deux poids était déclaré extrême. Lorsqu’un poids était déclaré extrême, tous les autres qui lui étaient supérieurs, dans sa poststrate, étaient automatiquement considérés comme extrêmes eux aussi. Ces poids étaient alors tronqués à la valeur du premier poids n’étant pas extrême. Ensuite, la masse des poids tronqués était redistribuée à l’intérieur des poststrates par un ajustement par ratio. Après avoir étudié plusieurs scénarios, une valeur de 2,5 a finalement été choisie pour n. Cette valeur particulière de n permettait d’identifier un nombre acceptable de poids extrêmes. En effet, la majorité des poids qui auraient intuitivement été identifiés comme étant extrêmes après une revue manuelle ont été identifiés par la méthode de l’écart-sigma utilisée avec cette valeur de n de 2,5. De plus, un petit nombre de poids par poststrate ont été identifiés comme étant extrêmes, permettant ainsi de conserver inchangés la grande majorité des poids calculés lors des étapes précédentes.

6.7 Ajout des unités non inscrites en vertu de l’Accord sur le Nunavut

À la dernière étape de la pondération, un total de 274 unités répondantes a été ajouté à l’échantillon de l’EAPA. Il s’agit d’unités ayant été sélectionnées pour l’EAPA — Supplément sur les Inuits du Nunavut qui se sont finalement révélées hors du champ de cette enquête parce qu’elles n’étaient pas inscrites en vertu de l’Accord sur le Nunavut. Ces unités ont par conséquent été exclues de l’échantillon de l’EAPA — Supplément sur les Inuits du Nunavut. Puisqu’elles ont tout de même rempli le questionnaire de l’EAPA, il aurait été dommage de ne pas utiliser leurs renseignements. Ces 274 unités ont donc été ajoutées à l’échantillon de l’EAPA avec un poids de un. Les unités de l’échantillon de l’EAPA au Nunavut qui n’étaient pas inscrites en vertu de l’Accord sur le Nunavut ont été pondérées de nouveau à l’intérieur des groupes d’ajustement de la deuxième poststratification afin de conserver les totaux de contrôle atteints précédemment.


Date de modification :