Série de documents de recherche sur les dépenses des ménages
Note technique de l’Enquête sur les dépenses des ménages, 2017

Date de diffusion : Le 12 décembre 2018

Sommaire

L’Enquête sur les dépenses des ménages (EDM) menée par Statistique Canada fournit des renseignements détaillés sur les dépenses ainsi que certaines données sur les caractéristiques des logements et l’équipement ménager.

Les données de l’EDM sont un intrant important pour l’Indice des prix à la consommation (IPC) produit par Statistique Canada, et sont utilisées dans le calcul du produit intérieur brut (PIB). Les données de l’EDM sont aussi utilisées par différents ministères fédéraux et provinciaux pour développer des politiques et programmes économiques et sociaux, et par le secteur privé, des organismes de recherche et des universitaires pour étudier différents sujets liés à la consommation des ménages et au bien-être, tels que l’abordabilité des logements, des soins pour enfants et des soins de santé, la consommation d’énergie et les habitudes de dépenses de divers groupes de population.

Dans le but de fournir ces renseignements, on demande aux ménages sélectionnés pour l’enquête de participer à une interview. De plus, on demande à la moitié de ces ménages de remplir un journal de dépenses, dans lequel sont déclarées presque toutes les dépenses faites par les membres du ménage pendant la période de deux semaines qui suit l’interview. En 2017, le taux de réponse s’est établi à 67 % pour la composante de l’interview et à 41 % pour le journal.

Statistique Canada utilise des méthodes statistiques rigoureuses et des pratiques de validation exhaustives dans la production et la diffusion des estimations de l’EDM pour réduire les risques de biais statistique. De par certains ajustements et techniques statistiques, Statistique Canada s’assure que les données sont adaptées à leur utilisation. Les utilisateurs de données doivent cependant tenir compte du fait que les estimations relatives aux dépenses détaillées déclarées par une plus petite partie de l’échantillon, ou relatives aux régions géographiques plus petites, peuvent être assujetties à une erreur d’échantillonnage plus élevée et à des risques plus élevés de biais.

Introduction

L’Enquête sur les dépenses des ménages (EDM) recueille des renseignements détaillés sur les dépenses des ménages. Elle permet également de recueillir des données sur les caractéristiques démographiques des membres des ménages (p. ex. âge, sexe, niveau de scolarité), ainsi que certaines caractéristiques du logement (p. ex. type, âge et mode d’occupation), et certains renseignements sur l’équipement ménager (p. ex. équipement électronique et de communication).

L’EDM diffuse des estimations sur les dépenses détaillées des ménages à l’échelle nationale, régionale et provinciale. À l’échelle nationale, elle diffuse les dépenses des ménages selon le type de ménage, le mode d’occupation du logement, l’âge de la personne de référence du ménage, et la taille de la région de résidence. Les dépenses par quintile de revenu du ménage, ainsi que les dépenses alimentaires détaillées, sont diffusées à l’échelle nationale, régionale et provinciale. En raison des petites tailles des échantillons, les dépenses détaillées ne sont accessibles que pour chacune des capitales territoriales (et non en fonction de caractéristiques des ménages).

La présente note technique fournit de l’information sur la qualité des données de l’EDM de 2017 et sur les diverses méthodes d’ajustement et stratégies de validation utilisées par Statistique Canada afin d’assurer que ces données soient adaptées à leur utilisation.

Collecte de données

L’EDM de 2017 était une enquête volontaire qui a permis de recueillir des renseignements directement auprès des répondants en recourant à deux modes de collecte : un questionnaire administré dans le cadre d’une interview sur place à l’aide de périodes de rappel adaptées aux types de dépenses, et d’un journal de dépenses quotidiennes que les ménages sélectionnés remplissaient pendant une période de deux semaines.

L’échantillon de l’EDM 2017 était composé de 17 792 ménages dans les 10 provinces et de 929 ménages dans les trois capitales des territoires (Whitehorse, Yellowknife et Iqaluit). Les données de l’EDM de 2017 ont été recueillies de façon continue de janvier à décembre 2017, à partir d’un échantillon de ménages répartis sur 12 mois de collecte.

À la suite de l’interview, on a demandé aux répondants sélectionnés pour remplir le journal de dépenses (50 % de l’échantillon d’interview) d’enregistrer les dépenses de tous les membres du ménage pendant la période de deux semaines débutant le lendemain de l’interview. Les ménages avaient la possibilité de fournir les reçus des achats effectués pendant la période de deux semaines en vue de réduire la quantité de renseignements transcrits manuellement dans le journal. Pour l’EDM de 2017, les dépenses estimées à partir de la composante du journal représentaient 27 % de la consommation courante totale, le reste provenant de l’interview.

Le modèle de collecte utilisé pour l’enquête est conforme avec les modèles internationaux standards en matière d’enquête sur le budget des ménages. La vaste majorité de ces programmes utilisent une combinaison d’une interview et d’un journal. Les différentes périodes de rappel utilisées dans l’interview et l’utilisation d’un journal facilitent le rappel ou la déclaration des dépenses pour les répondants. Bien que l’on estime que cette combinaison est la méthode la plus efficace pour la collecte de données fiables au sujet des dépenses, elle impose un fardeau élevé aux répondants. En 2017, la durée médiane de l’interview était de 63 minutes. La durée de l’interview dépend de plusieurs facteurs comme le type ou la taille du ménage et la variété des dépenses réalisées (propriétaires ou locataires, réparations et rénovations du logement, propriétaires de voitures, etc.).

Taux de réponse

Taux de réponse de l’EDM de 2017

En 2017, le taux de réponse global pour les interviews était de 66,9 %, le taux plus élevé provenant du Québec (71,1 %) et le plus faible, de l’Ontario (63,9 %). La moitié des ménages sélectionnés pour l’interview ont aussi été sélectionnés pour compléter le journal. Certains des ménages sélectionnés pour le journal ne l’ont pas complété ou ont fourni un journal considéré inutilisable. Parmi les ménages répondants à l’interview qui ont été sélectionnés pour remplir un journal, le taux de réponse au journal était de 62,9 %. Par conséquent, le taux de réponse final pour le journal (défini comme le pourcentage de journaux utilisables par rapport au nombre de ménages ayant été sélectionnés pour remplir le journal) était de 41,3 % à l’échelle nationale, le taux le plus élevé provenant de la Saskatchewan (45,5 %) et le plus faible, de la Colombie-Britannique (36,8 %).

Taux de réponse à l’EDM au fil du temps

Les taux de réponse aux enquêtes auprès des ménages au Canada, comme dans d’autres pays, ont généralement baissé au fil du temps. L’EDM n’est pas épargnée par ces tendances. Bien que le taux de réponse pour l’interview ait été très stable à environ 65 % depuis son remaniement en 2010, il est passablement plus faible qu’il ne l’était à la fin des années 1990 et au début des années 2000 (de 70 % à 75 %). Le maintien d’un taux de réponse stable au cours des dernières années a nécessité une quantité accrue d’efforts de collecte, étant donné l’augmentation, pendant cette période, du nombre de contacts par ménage requis pour compléter une interview. Le recours aux interviews sur place pour l’EDM offre toutefois un certain niveau de protection contre la baisse des taux de réponse observée pour les enquêtes téléphoniques de l’organisme, lesquelles peuvent être influencées par les techniques d’évitement (blocage d’appels, afficheur) et les ménages plus difficiles à joindre (ceux qui ne disposent que de téléphones cellulaires).

Quant au journal, bien que des mesures aient été mises en place pour tenter d’améliorer, ou au moins maintenir les taux de réponse, la participation des ménages a diminué depuis le remaniement de 2010, comme il est démontré ci-dessous. Tel qu’il a déjà été mentionné, les dépenses estimées à partir de la composante du journal représentent environ le quart de la consommation courante totale.

Graphique 1 Taux de réponse final au journal de l'EDM, Canada (provinces seulement), 2010-2017

Tableau de données du graphique 1
Tableau de données du graphique 1
Plus haut niveau de scolarité atteint des exploitants agricoles selon l’âge, Canada, 2016
Sommaire du tableau
Le tableau montre les résultats de Plus haut niveau de scolarité atteint des exploitants agricoles selon l’âge. Les données sont présentées selon Année de référence (titres de rangée) et Pourcentage(figurant comme en-tête de colonne).
Année de référence Pourcentage
2010 46,4
2011 42,9
2012 43,3
2013 46,1
2014 43,6
2015 39,9
2016 42,9
2017 41,3

Taux de réponse à l’échelle internationale

Les enquêtes sur les dépenses sont communément effectuées par les organismes statistiques nationaux partout dans le monde. Bien que certaines différences puissent exister entre les méthodologies de collecte (mode de collecte, durée de l’interview, utilisation d’incitatifs), la comparaison de ces programmes a permis de montrer que parmi 35 pays, le taux de réponse à l’EDM se situait au milieu de la distribution. On constate une baisse continuelle des taux de réponse pour un grand nombre de ces programmes.

Données manquantes ou invalides

Malgré le fardeau de réponse élevé associé à l’EDM, seulement une partie minime de l’information donnée à l’interview est jugée manquante ou considérée non valide. En 2017, à peu près 95 % des ménages ont fourni moins de 10 réponses manquantes ou invalides parmi près de 200 questions liées aux dépenses. En plus, une grande portion de cette information manquante provient du fait que les ménages ne sont pas capables de rapporter des dépenses séparées pour les composantes d’un service combiné, telles que pour les services d’accès à Internet, de téléphonie, et de télévision ou satellite.

L’information manquante est plus importante pour les dépenses recueillies via le journal. Certains ménages répondants ne complètent pas le journal en entier pour la période de deux semaines. En plus, ils pourraient plus facilement oublier certains types de dépenses. Aussi, malgré qu’un nombre important de ménages fournissent les reçus pour des dépenses telles que les achats d’épicerie, lorsque les reçus ne sont pas fournis, les ménages ne fournissent que le total des dépenses en l’inscrivant au journal sans mention des détails sur les items achetés et les montants dépensés. La fréquence de ces cas a augmenté à travers le temps ce qui demande une réallocation de ces totaux à des catégories de dépenses détaillées au moment du traitement des données.

Réduire au minimum les erreurs et les biais

Comme toutes les enquêtes, l’EDM peut présenter deux types d’erreurs : des erreurs d’échantillonnage et des erreurs non dues à l’échantillonnage. Les erreurs d’échantillonnage se produisent parce que les inférences au sujet de la population entière sont fondées sur les données obtenues à partir d’un échantillon de la population seulement. Les erreurs non dues à l’échantillonnage sont des erreurs attribuables à la non-réponse, des erreurs de couverture, des erreurs de réponse et des erreurs de traitement, lesquelles peuvent introduire un biais dans les estimations. Plus précisément, la non-réponse peut occasionner un biais dans les estimations si les caractéristiques des non-répondants sont différentes de celles des répondants au point d’entraîner des répercussions sur les dépenses étudiées.

Statistique Canada met tout en œuvre pour réduire au minimum les biais dans les enquêtes. Pendant les premières étapes de planification de l’enquête, des techniques d’essais qualitatifs sont utilisées pour s’assurer que le matériel de collecte soit bien compris par les répondants et pour évaluer le fardeau imposé. En cours de collecte, on assure un suivi auprès des ménages qui n’ont pas répondu initialement à l’enquête. On produit régulièrement des rapports sur le processus de collecte afin de pouvoir réagir rapidement et de prendre les mesures correctives appropriées, au besoin. Un processus de surveillance des interviews est en place au moyen duquel les enregistrements d’un sous-échantillon de cas sont examinés en vue de fournir une rétroaction aux intervieweurs. De plus, les intervieweurs assurent un suivi auprès des répondants au journal pour leur rappeler les items fréquemment oubliés dans le journal.

De plus, des méthodes statistiques rigoureuses sont utilisées aux étapes de traitement et de l’estimation des données afin de réduire le risque de biais attribuable à la non-réponse et/ou les erreurs d’échantillonnage.

Non-réponse totale et calage

En vue d’atténuer le biais que pourrait entraîner la non-réponse dans l’EDM, les poids de sondage ont été ajustés afin que les poids des répondants représentent l’ensemble de la population cible. Pour ce faire, il a été nécessaire de regrouper les répondants et les non-répondants qui ont des caractéristiques semblables et d’allouer les poids des non-répondants aux répondants dans chaque groupe. Pour créer ces groupes, l’information auxiliaire est nécessaire, tant pour les répondants que pour les non-répondants. Afin que cette méthode soit efficace pour réduire le biais, il doit exister une corrélation entre l’information auxiliaire et la probabilité de répondre à l’enquête, ainsi que les variables de dépenses. Des études ont montré que les variables auxiliaires qui sont actuellement utilisées pour ajuster les poids des répondants à l’EDM, comme le revenu du ménage, la taille du ménage et la présence d’une personne âgée, contribuent à réduire le biais attribuable à la non-réponse, puisqu’il existe une corrélation entre celles-ci et, à la fois, la probabilité de réponse et les dépenses.

Après avoir appliqué les ajustements pour la non-réponse, les poids de sondage ont également été ajustés au moyen du calage, ce qui a permis de s’assurer que certaines estimations coïncident avec les totaux de population provenant de sources externes. Le calage contribue à réduire les erreurs non attribuables à l’échantillonnage, comme les erreurs de non-réponse et de couverture. Lorsqu’il existe une corrélation entre les totaux de contrôle du calage et les variables d’intérêt, la précision des estimations peut également s’en trouver améliorée. Dans le cas de l’EDM, la méthode de calage utilisée pour les poids de sondage dans les provinces comporte des variables comme les groupes d’âge, la taille du ménage et les groupes de revenu, qui sont toutes des variables fortement corrélées aux dépenses. Elle contribue alors à réduire la variance des estimations et pourrait également permettre de réduire les erreurs non attribuables à l’échantillonnage. Dans les trois capitales des territoires, on utilise une méthode de calage selon les groupes d’âge et la taille du ménage pour les poids de sondage.

Non-réponse partielle

Pour résoudre les problèmes d’information manquante ou invalide à certaines questions de l’interview, on a généralement recours à l’imputation par enregistrement donneur selon la technique du plus proche voisin. Les données d’un autre répondant ayant des caractéristiques semblables (le donneur) sont donc utilisées aux fins d’imputation. Les caractéristiques utilisées pour identifier le donneur sont sélectionnées de telle façon qu’il existe une corrélation entre elles et les variables à imputer. Le revenu du ménage, le type de logement et le nombre d’adultes et d’enfants sont des caractéristiques souvent utilisées. Ceci contribue à la réduction du biais attribuable à la non-réponse partielle.

L’imputation par donneur est également utilisée lorsque certains renseignements sont manquants dans le journal des dépenses quotidiennes ou lorsque le niveau de détail fourni par le répondant est insuffisant. L’imputation est effectuée au niveau des articles déclarés dans le journal et les caractéristiques souvent retenues pour identifier le donneur sont le coût, le code partiel disponible pour l’item, le revenu et la taille du ménage. L’imputation se fait par province et trimestre pour tenir compte des différences provinciales et de la saisonnalité des dépenses.

Des facteurs d’ajustement sont également calculés afin de tenir compte des jours non remplis dans le journal en vue d’éviter la sous-estimation des dépenses. Pour chaque journal, un facteur d’ajustement est calculé selon le nombre de jours non remplis dans le journal et les caractéristiques du journal. Des études ont montré que ce facteur d’ajustement contribue à réduire le biais dans les estimations du journal.

Valeurs influentes

Après les vérifications et l’imputation, toutes les variables de dépenses de l’enquête sont annualisées. Elles sont multipliées par un facteur approprié selon la période de référence afin de produire des estimations des dépenses annuelles. Le processus d’annualisation peut faire gonfler les valeurs des dépenses qui sont déjà importantes et amplifier leur incidence sur les estimations. En général, il est conseillé d’identifier ces unités et de réduire possiblement leur incidence sur les estimations. Le traitement des valeurs influentes dans l’EDM est fondé sur la contribution de l’unité, qui est définie comme le produit du poids de l’enquête et de la dépense annualisée. Les unités dont la contribution est excessive par rapport aux autres unités sont alors ajustées. Ce processus de correction n’affecte pas un grand nombre d’unités, mais peut grandement contribuer à réduire la variance.

Variabilité d’échantillonnage

Les estimations de l’EDM sont fondées sur un échantillon et sont donc assujetties aux erreurs attribuables à l’échantillonnage. L’une des mesures des erreurs d’échantillonnage est le coefficient de variation (CV). Un CV élevé indique une forte variabilité des estimations. Généralement, les CV sont plus élevés pour les dépenses déclarées par une plus petite partie de l’échantillon ou lorsque les différences entre les dépenses des ménages sont plus importantes. Les estimations pour les catégories de dépenses plus détaillées sont ainsi plus variables, en général, que celles pour les catégories de dépenses au niveau sommaire. Les estimations de l’EDM dont le CV est égal ou supérieur à 35 % sont jugées trop peu fiables et par conséquent, elles sont supprimées.

Pour les estimations nationales, la majorité des catégories de dépenses sommaires (p. ex. les dépenses alimentaires) ont un CV de moins de 4 %. Presque toutes les catégories de dépenses intermédiaires (p. ex. les aliments achetés au magasin) sont considérées comme fiables (la valeur de leur CV est inférieure à 35 %). La grande majorité des dépenses détaillées (p. ex. les œufs) sont également considérées comme fiables.

En général, les CV augmentent également lorsque la région géographique est plus petite. À l’échelle provinciale, à l’exception de l’Île-du-Prince-Édouard, les estimations de la consommation courante totale ont toutes un CV de 2 % ou moins. Presque toutes les catégories de dépenses sommaires ont un CV inférieur à 13 % et la grande majorité des catégories de dépenses intermédiaires sont jugées fiables. La majorité des dépenses détaillées sont également considérées comme fiables.

Le principal objectif du plan de sondage de l’EDM est d’assurer un équilibre entre la qualité des données aux échelles nationale et provinciale. Pour certaines régions géographiques plus petites comme les régions métropolitaines de recensement (RMR), une grande majorité des catégories de dépenses sommaires ont des CV inférieurs à 35 %, par contre une proportion considérable des estimations pour des catégories de dépenses plus détaillées ne sont plus considérées fiables. Ceci est aussi vrai pour les capitales territoriales.

Enfin, alors que l’EDM est une enquête transversale conçue pour fournir des estimations pour une seule période dans le temps (l’année de référence), les utilisateurs des données peuvent s’intéresser aux comparaisons dans le temps. Les utilisateurs sont avisés que les différences entre les estimations de deux années de référence sont affectées par la variabilité d’échantillonnage de chacune des deux estimations comparées. Par conséquent, la variabilité d’échantillonnage associée à une différence entre deux estimations est généralement plus élevée que la variabilité de l’estimation d’une année donnée. Par exemple, même si la majorité des estimations de dépenses détaillées au niveau provincial ont un CV inférieur à 35 % et sont donc considérées de qualité suffisante pour être diffusées, les différences entre les estimations de deux années peuvent ne pas être statistiquement significatives en raison de la variabilité de l’estimation de chaque année.

Validation des données

Dans le cadre d’un processus statistique, la validation constitue l’ensemble des activités qui permettent d’assurer que les estimations pondérées et les statistiques agrégées sont fiables, solides et défendables. Elle comprend les processus utilisés pour déceler et corriger les incohérences dans les microdonnées et les estimations agrégées grâce aux recours à des outils de diagnostic et à l’expertise de spécialistes. Statistique Canada a validé les estimations de l’EDM de 2017, tel que requis, et conformément aux normes de l’organisme relatives à la validation des données. Avant la diffusion de l’enquête, un processus rigoureux de certification et d’analyse des données s’est traduit par une série de vérifications détaillées afin de veiller à ce que l’EDM produise des estimations de qualité.

Le processus de certification couvre quatre principaux aspects :

Adaptation des données de l’Enquête sur les dépenses des ménages de 2017 à leur utilisation

La collecte des données sur les dépenses des ménages au moyen d’une combinaison d’une interview et d’un journal impose un lourd fardeau aux répondants. Bien que plusieurs organismes statistiques internationaux aient recherché des moyens de réduire ce fardeau, personne n’a identifié une approche de collecte alternative qui permettrait d’obtenir une représentation exhaustive de toutes les dépenses (des moins fréquentes aux plus fréquentes) de chaque ménage sélectionné. À l’échelle internationale, le journal est toujours considéré comme l’outil le plus approprié pour recueillir les dépenses fréquentes, comme les achats de nourriture. Toutefois, les non-réponses totales et partielles ne sont pas négligeables pour cette composante, qui est utilisée pour estimer environ le quart des dépenses.

Statistique Canada a appliqué et élaboré des méthodes statistiques rigoureuses qui sont utilisées aux étapes du traitement et de l’estimation afin de réduire le risque de biais attribuable à la non-réponse et les erreurs d’échantillonnage. Un processus de validation exhaustif est également appliqué. Les utilisateurs de données doivent cependant tenir compte du fait que les estimations relatives aux dépenses détaillées déclarées par une plus petite partie de l’échantillon, ou aux régions géographiques plus petites, peuvent être assujetties à une erreur d’échantillonnage plus élevée et à des risques plus élevés de biais.

Date de modification :