Séries chronologiques

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre

Résultats

Tout (50)

Tout (50) (0 à 10 de 50 résultats)

  • Articles et rapports : 12-001-X201800154927
    Description :

    L’étalonnage des séries mensuelles et trimestrielles à des données annuelles est une pratique courante adoptée par de nombreux instituts nationaux de statistique. Le problème de l’étalonnage se pose quand des données temporelles pour une même variable cible sont mesurées à différentes fréquences et qu’il est nécessaire d’éliminer les différences entre les sommes des valeurs infra-annuelles et les valeurs annuelles de référence. Plusieurs méthodes d’étalonnage sont décrites dans la littérature. La procédure d’étalonnage avec préservation des taux de croissance (PTC) est souvent considérée comme étant la meilleure. Il est généralement soutenu qu’elle a pour fondement un principe idéal de préservation du mouvement. Toutefois, nous montrons que l’étalonnage PTC présente des inconvénients appréciables qui importent pour les applications pratiques et qui ne sont pas décrits dans la littérature. Nous considérons d’autres modèles d’étalonnage qui ne souffrent pas de certains des effets indésirables de la PTC.

    Date de diffusion : 2018-06-21

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2018-03-27

  • Articles et rapports : 82-003-X201800254908
    Description :

    Cette étude a examiné neuf enquêtes nationales menées auprès de la population à domicile dont les données sur la consommation de drogues ont été recueillies au cours de la période de 1985 à 2015. Ces enquêtes sont examinées aux fins de comparabilité, et leurs données sont utilisées pour estimer la consommation de cannabis (totale et selon le sexe et l'âge) au cours de l'année précédente, désignée comme la consommation courante. Au moyen des données qui se prêtent le mieux à la comparaison, les tendances en matière de consommation de 2004 à 2015 sont estimées.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 12-001-X201700254871
    Description :

    L’article aborde la question de savoir comment utiliser des sources de données de rechange, telles que les données administratives et les données des médias sociaux, pour produire les statistiques officielles. Puisque la plupart des enquêtes réalisées par les instituts nationaux de statistique sont répétées au cours du temps, nous proposons une approche de modélisation de séries chronologiques structurelle multivariée en vue de modéliser les séries observées au moyen d’une enquête répétée avec les séries correspondantes obtenues à partir de ces sources de données de rechange. En général, cette approche améliore la précision des estimations directes issues de l’enquête grâce à l’utilisation de données d’enquête observées aux périodes précédentes et de données provenant de séries auxiliaires connexes. Ce modèle permet aussi de profiter de la plus grande fréquence des données des médias sociaux pour produire des estimations plus précises en temps réel pour l’enquête par sondage, au moment où les statistiques pour les médias sociaux deviennent disponibles alors que les données d’enquête ne le sont pas encore. Le recours au concept de cointégration permet d’examiner dans quelle mesure la série de rechange représente les mêmes phénomènes que la série observée au moyen de l’enquête répétée. La méthodologie est appliquée à l’Enquête sur la confiance des consommateurs des Pays-Bas et à un indice de sentiments dérivé des médias sociaux.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700114819
    Description :

    La modélisation de séries chronologiques structurelle est une puissante technique de réduction des variances pour les estimations sur petits domaines (EPD) reposant sur des enquêtes répétées. Le bureau central de la statistique des Pays-Bas utilise un modèle de séries chronologiques structurel pour la production des chiffres mensuels de l’Enquête sur la population active (EPA) des Pays-Bas. Cependant, ce type de modèle renferme des hyperparamètres inconnus qui doivent être estimés avant que le filtre de Kalman ne puisse être appliqué pour estimer les variables d’état du modèle. Le présent article décrit une simulation visant à étudier les propriétés des estimateurs des hyperparamètres de tels modèles. La simulation des distributions de ces estimateurs selon différentes spécifications de modèle viennent compléter les diagnostics types pour les modèles espace-état. Une autre grande question est celle de l’incertitude entourant les hyperparamètres du modèle. Pour tenir compte de cette incertitude dans les estimations d’erreurs quadratiques moyennes (EQM) de l’EPA, différents modes d’estimation sont pris en compte dans une simulation. En plus de comparer les biais EQM, cet article examine les variances et les EQM des estimateurs EQM envisagés.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 13-604-M2015077
    Description :

    Le nouvel ensemble de données accroît l’information disponible pour comparer les résultats des provinces et des territoires selon toute une gamme de mesures. Il combine les séries de données chronologiques provinciales souvent fragmentées qui, comme telles, sont d’une utilité limitée pour examiner l’évolution des économies des provinces sur de longues périodes. Des méthodes statistiques plus poussées et des modèles de plus grande ampleur et profondeur sont difficiles à appliquer aux données canadiennes fragmentées existantes. La nature longitudinale du nouvel ensemble de données provinciales pallie cet inconvénient. Le présent document explique la création de la dernière version de l’ensemble de données. Cette version contient l’information la plus à jour disponible.

    Date de diffusion : 2015-02-12

  • Articles et rapports : 12-001-X201400214110
    Description :

    Quand nous élaborons le plan de sondage d’une enquête, nous essayons de produire un bon plan compte tenu du budget disponible. L’information sur les coûts peut être utilisée pour établir des plans de sondage qui minimisent la variance d’échantillonnage d’un estimateur du total pour un coût fixe. Les progrès dans le domaine des systèmes de gestion d’enquête signifient qu’aujourd’hui, il est parfois possible d’estimer le coût d’inclusion de chaque unité dans l’échantillon. Le présent article décrit l’élaboration d’approches relativement simples pour déterminer si les avantages pouvant découler de l’utilisation de cette information sur les coûts au niveau de l’unité sont susceptibles d’avoir une utilité pratique. Nous montrons que le facteur important est le ratio du coefficient de variation du coût sur le coefficient de variation de l’erreur relative des coefficients de coût estimés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 11-010-X201000311141
    Géographie : Canada
    Description :

    Un examen de la désaisonnalisation et de la manière dont elle peut aider les analystes à se concentrer sur les mouvements récents de la tendance sous-jacente des données économiques.

    Date de diffusion : 2010-03-18

  • Articles et rapports : 12-001-X200900211040
    Description :

    L'article décrit un modèle de séries chronologiques structurel multivarié qui tient compte du plan de sondage avec renouvellement de panel de l'Enquête sur la population active des Pays-Bas et qui est appliqué pour estimer les taux mensuels de chômage. Comparativement à l'estimateur par la régression généralisée, cette approche accroît considérablement la précision des estimations, grâce à la réduction de l'erreur-type et à la modélisation explicite du biais entre les vagues subséquentes de l'enquête.

    Date de diffusion : 2009-12-23

  • Enquêtes et programmes statistiques — Documentation : 12-001-X200900110885
    Description :

    La présence de pics dans le spectre d'un processus stationnaire signale l'existence de phénomènes périodiques stochastiques, tels que l'effet saisonnier. Nous proposons une mesure de ces pics spectraux et un test de détection de leur présence qui s'appuient sur l'évaluation de leur pente et de leur convexité agrégées. Notre méthode est élaborée de manière non paramétrique et peut donc être utile durant l'analyse préliminaire d'une série. Elle peut aussi servir à détecter la présence d'une saisonnalité résiduelle dans les données désaisonnalisées. Nous étudions le test diagnostique au moyen d'une simulation et d'une étude de cas à grande échelle portant sur des données provenant du U.S. Census Bureau et de l'Organisation de coopération et de développement économiques (OCDE).

    Date de diffusion : 2009-06-22
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (42)

Analyses (42) (0 à 10 de 42 résultats)

  • Articles et rapports : 12-001-X201800154927
    Description :

    L’étalonnage des séries mensuelles et trimestrielles à des données annuelles est une pratique courante adoptée par de nombreux instituts nationaux de statistique. Le problème de l’étalonnage se pose quand des données temporelles pour une même variable cible sont mesurées à différentes fréquences et qu’il est nécessaire d’éliminer les différences entre les sommes des valeurs infra-annuelles et les valeurs annuelles de référence. Plusieurs méthodes d’étalonnage sont décrites dans la littérature. La procédure d’étalonnage avec préservation des taux de croissance (PTC) est souvent considérée comme étant la meilleure. Il est généralement soutenu qu’elle a pour fondement un principe idéal de préservation du mouvement. Toutefois, nous montrons que l’étalonnage PTC présente des inconvénients appréciables qui importent pour les applications pratiques et qui ne sont pas décrits dans la littérature. Nous considérons d’autres modèles d’étalonnage qui ne souffrent pas de certains des effets indésirables de la PTC.

    Date de diffusion : 2018-06-21

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2018-03-27

  • Articles et rapports : 82-003-X201800254908
    Description :

    Cette étude a examiné neuf enquêtes nationales menées auprès de la population à domicile dont les données sur la consommation de drogues ont été recueillies au cours de la période de 1985 à 2015. Ces enquêtes sont examinées aux fins de comparabilité, et leurs données sont utilisées pour estimer la consommation de cannabis (totale et selon le sexe et l'âge) au cours de l'année précédente, désignée comme la consommation courante. Au moyen des données qui se prêtent le mieux à la comparaison, les tendances en matière de consommation de 2004 à 2015 sont estimées.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 12-001-X201700254871
    Description :

    L’article aborde la question de savoir comment utiliser des sources de données de rechange, telles que les données administratives et les données des médias sociaux, pour produire les statistiques officielles. Puisque la plupart des enquêtes réalisées par les instituts nationaux de statistique sont répétées au cours du temps, nous proposons une approche de modélisation de séries chronologiques structurelle multivariée en vue de modéliser les séries observées au moyen d’une enquête répétée avec les séries correspondantes obtenues à partir de ces sources de données de rechange. En général, cette approche améliore la précision des estimations directes issues de l’enquête grâce à l’utilisation de données d’enquête observées aux périodes précédentes et de données provenant de séries auxiliaires connexes. Ce modèle permet aussi de profiter de la plus grande fréquence des données des médias sociaux pour produire des estimations plus précises en temps réel pour l’enquête par sondage, au moment où les statistiques pour les médias sociaux deviennent disponibles alors que les données d’enquête ne le sont pas encore. Le recours au concept de cointégration permet d’examiner dans quelle mesure la série de rechange représente les mêmes phénomènes que la série observée au moyen de l’enquête répétée. La méthodologie est appliquée à l’Enquête sur la confiance des consommateurs des Pays-Bas et à un indice de sentiments dérivé des médias sociaux.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700114819
    Description :

    La modélisation de séries chronologiques structurelle est une puissante technique de réduction des variances pour les estimations sur petits domaines (EPD) reposant sur des enquêtes répétées. Le bureau central de la statistique des Pays-Bas utilise un modèle de séries chronologiques structurel pour la production des chiffres mensuels de l’Enquête sur la population active (EPA) des Pays-Bas. Cependant, ce type de modèle renferme des hyperparamètres inconnus qui doivent être estimés avant que le filtre de Kalman ne puisse être appliqué pour estimer les variables d’état du modèle. Le présent article décrit une simulation visant à étudier les propriétés des estimateurs des hyperparamètres de tels modèles. La simulation des distributions de ces estimateurs selon différentes spécifications de modèle viennent compléter les diagnostics types pour les modèles espace-état. Une autre grande question est celle de l’incertitude entourant les hyperparamètres du modèle. Pour tenir compte de cette incertitude dans les estimations d’erreurs quadratiques moyennes (EQM) de l’EPA, différents modes d’estimation sont pris en compte dans une simulation. En plus de comparer les biais EQM, cet article examine les variances et les EQM des estimateurs EQM envisagés.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 13-604-M2015077
    Description :

    Le nouvel ensemble de données accroît l’information disponible pour comparer les résultats des provinces et des territoires selon toute une gamme de mesures. Il combine les séries de données chronologiques provinciales souvent fragmentées qui, comme telles, sont d’une utilité limitée pour examiner l’évolution des économies des provinces sur de longues périodes. Des méthodes statistiques plus poussées et des modèles de plus grande ampleur et profondeur sont difficiles à appliquer aux données canadiennes fragmentées existantes. La nature longitudinale du nouvel ensemble de données provinciales pallie cet inconvénient. Le présent document explique la création de la dernière version de l’ensemble de données. Cette version contient l’information la plus à jour disponible.

    Date de diffusion : 2015-02-12

  • Articles et rapports : 12-001-X201400214110
    Description :

    Quand nous élaborons le plan de sondage d’une enquête, nous essayons de produire un bon plan compte tenu du budget disponible. L’information sur les coûts peut être utilisée pour établir des plans de sondage qui minimisent la variance d’échantillonnage d’un estimateur du total pour un coût fixe. Les progrès dans le domaine des systèmes de gestion d’enquête signifient qu’aujourd’hui, il est parfois possible d’estimer le coût d’inclusion de chaque unité dans l’échantillon. Le présent article décrit l’élaboration d’approches relativement simples pour déterminer si les avantages pouvant découler de l’utilisation de cette information sur les coûts au niveau de l’unité sont susceptibles d’avoir une utilité pratique. Nous montrons que le facteur important est le ratio du coefficient de variation du coût sur le coefficient de variation de l’erreur relative des coefficients de coût estimés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 11-010-X201000311141
    Géographie : Canada
    Description :

    Un examen de la désaisonnalisation et de la manière dont elle peut aider les analystes à se concentrer sur les mouvements récents de la tendance sous-jacente des données économiques.

    Date de diffusion : 2010-03-18

  • Articles et rapports : 12-001-X200900211040
    Description :

    L'article décrit un modèle de séries chronologiques structurel multivarié qui tient compte du plan de sondage avec renouvellement de panel de l'Enquête sur la population active des Pays-Bas et qui est appliqué pour estimer les taux mensuels de chômage. Comparativement à l'estimateur par la régression généralisée, cette approche accroît considérablement la précision des estimations, grâce à la réduction de l'erreur-type et à la modélisation explicite du biais entre les vagues subséquentes de l'enquête.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 11-522-X200600110398
    Description :

    L'étude de données longitudinales est essentielle si l'on veut observer correctement l'évolution des variables d'intérêt chez les personnes, les collectivités et les populations plus importantes au cours du temps. Les modèles linéaires à effets mixtes (pour les réponses continues observées au fil du temps), ainsi que les modèles linéaires généralisés à effets mixtes et les équations d'estimation généralisées (pour les réponses plus générales, telles que les données binaires ou les dénombrements observés au fil du temps) sont les méthodes les plus répandues pour analyser les données longitudinales provenant d'études sur la santé, même si, comme toute méthode de modélisation, elles ont leurs limites, dues en partie aux hypothèses sous jacentes. Dans le présent article, nous discutons de certains progrès, dont l'utilisation de méthodes fondées sur des courbes, qui rendent la modélisation des données longitudinales plus souple. Nous présentons trois exemples d'utilisation de ces méthodes plus souples tirés de la littérature sur la santé, dans le but de démontrer que certaines questions par ailleurs difficiles peuvent être résolues raisonnablement lors de l'analyse de données longitudinales complexes dans les études sur la santé des populations.

    Date de diffusion : 2008-03-17
Références (9)

Références (9) ((9 résultats))

  • Enquêtes et programmes statistiques — Documentation : 12-001-X200900110885
    Description :

    La présence de pics dans le spectre d'un processus stationnaire signale l'existence de phénomènes périodiques stochastiques, tels que l'effet saisonnier. Nous proposons une mesure de ces pics spectraux et un test de détection de leur présence qui s'appuient sur l'évaluation de leur pente et de leur convexité agrégées. Notre méthode est élaborée de manière non paramétrique et peut donc être utile durant l'analyse préliminaire d'une série. Elle peut aussi servir à détecter la présence d'une saisonnalité résiduelle dans les données désaisonnalisées. Nous étudions le test diagnostique au moyen d'une simulation et d'une étude de cas à grande échelle portant sur des données provenant du U.S. Census Bureau et de l'Organisation de coopération et de développement économiques (OCDE).

    Date de diffusion : 2009-06-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015648
    Description :

    On estime les paramètres d'un modèle stochastique des carrières au sein de la population active tenant compte de la répartition des périodes corrélées d'emploi, de chômage (avec et sans recherche d'emploi) et de non appartenance à la population active. Aucune source unique de données n'est complètement satisfaisante si l'on veut que le modèle refléte les tendances infra-annuelles de l'emploi, ainsi que la progression vers l'âge de la retraite. Par contre, on peut calculer une approximation d'après plusieurs sources de données distinctes.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015656
    Description :

    Les études de séries chronologiques montrent qu'il existe une association entre la concentration des polluants atmosphériques, d'une part, et la morbidité et la mortalité, d'autre part. En général, ces études sont réalisées dans une seule ville, en appliquant diverses méthodes. Les critiques concernant ces études ont trait à la validité des ensembles de données utilisés et aux méthodes statistiques qui leur sont appliquées, ainsi qu'au manque de cohérence des résultats des études menées dans des villes différentes et même des nouvelles analyses indépendantes des données d'une ville particulière. Dans le présent article, nous examinons certaines des méthodes statistiques utilisées pour analyser un sous-ensemble de données nationales sur la pollution atmosphérique, la mortalité et les conditions météorologiques recueillies durant la National Morbidity and Mortality Air Pollution Study (NMMAPS).

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015688
    Description :

    Des données de sources multiples sont couplées pour examiner les liens géographique et temporel entre la pollution atmosphérique et l'asthme. Ces sources incluent les dossiers administratifs établis par 59 cabinets de médecins généralistes répartis à travers l'Angleterre et le Pays de Galles au sujet d'un demi million de patients venus à la consultation pour cause d'asthme, ainsi que des renseignements socioéconomiques recueillis dans le cadre d'une enquête par interview. Les codes postaux permettent de coupler ces données à celles sur i) la densité routière calculée pour les routes locales, ii) les émissions estimatives de dioxyde de soufre et d'oxydes d'azote, iii) la concentration de fumée noire, de dioxyde de soufre, de dioxyde d'azote et d'autres polluants mesurée ou interpolée aux emplacements des cabinets de médecins. Parallèlement, on analyse des séries chronologiques de Poisson, en tenant compte des variations entre cabinets de médecins, pour examiner les corrélations quotidiennes dans le cas des cabinets situés près des stations de surveillance de la qualité de l'air. Les analyses préliminaires montrent une association faible, en général non significative, entre les taux de consultations et les marqueurs de pollution. On examine les problèmes méthodologiques que posent la combinaison de données de ce genre et l'interprétation des résultats.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015031
    Description :

    La U.S. Third National Health and Nutrition Examination Survey (NHANES III) a été réalisée de 1988 à 1994. Cette enquête visait avant tout à fournir des estimations de paramètres transversaux considérés comme pratiquement constants durant la période de collecte des données de six ans. Cependant, dans le cas de certaines variables (p. ex., la concentration sérique du plomb, l'indice de masse corporelle et le comportement concernant l'usage du tabac), des considérations importantes donnent à penser que des changements de niveau non négligeables pourraient être survenus entre 1988 et 1994. Pour ces variables, la NHANES III pourrait être une source de renseignements sur les tendances temporelles plus précieuse que d'autres études portant sur des populations et des échantillons plus restreints. Deux difficultés compliquent l'étude des tendances temporelles possibles. Premièrement, il existe un certain déséquilibre en ce qui a trait à l'attribution des interviews et des calendriers d'examen dans les diverses régions. Cette situation pose un problème pratique, car on note des écarts considérables d'une région à l'autre, dans le cas de certaines variables. Deuxièmement, des variations non négligeables des niveaux au fil du temps peuvent entacher d'un biais non négligeable certains estimateurs habituels de la variance NHANES III. Dans la présente communication, nous nous penchons sur ces deux inconvénients et présentons quelques-unes de leurs conséquences relativement à l'établissement de politiques en matière de statistique.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015033
    Description :

    Les incidents de victimisation ne sont pas distribués aléatoirement de façon uniforme à travers la population, mais ont plutôt tendance à se limiter à un nombre relativement faible de personnes. Nous utilisons des données tirées de la U.S. National Crime Victimization Survey (NCVS), qui est une enquête par panel avec renouvellement à plusieurs degrés, pour estimer les probabilités conditionnelles d'être la victime d'un crime à un temps t, compte tenu de son état de victimisation lors d'interviews antérieures. Nous présentons et ajustons des modèles qui permettent l'utilisation d'informations partielles provenant de ménages qui emménagent dans l'unité de logement ou qui la quittent durant la période d'étude. Nous avons constaté que la probabilité estimée d'être la victime d'un crime de l'interview t, compte tenu de la situation à l'interview (t-l) diminue avec (t). Nous examinons également les conséquences éventuelles sur l'estimation des taux transversaux de victimisation.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19980024351
    Description :

    Pour calculer les indices de prix, il faut recueillir des données relatives à un même article (en fait, un ensemble d'articles définis avec précision) durant diverses périodes. La question qu'on se pose est celle de savoir si de telles données quasi-longitudinales peuvent être modélisées de manière à expliquer ce qu'est un indice des prix. Des chercheurs de pointe spécialisés dans les questions relatives aux indices de prix ont émis des doutes quant à la possibilité d'utiliser la modélisation statistique pour caractériser de tels indices. Dans la présente communications, on propose un simple modèle à espace d'états relatif aux données sur les prix qui donne un indice des prix à la consommation exprimé d'après les paramètres du modèle.

    Date de diffusion : 1999-01-14

  • Avis et consultations : 62-010-X19970023422
    Description :

    La période de base officielle de l'indice des prix à la consommation (IPC) est actuellement 1986=100. Cette période de base a été utilisée pour la première fois au moment de la diffusion des données de l'IPC pour juin 1990. Statistique Canada s'apprête à convertir toutes les séries des indices de prix à la période de base 1992=100. Par conséquent, toutes les séries en dollars constants seront aussi converties en dollars de 1992. L'IPC adoptera la nouvelle période de base lorsque paraîtront les données de l'indice pour janvier 1998 dès le 27 février 1998.

    Date de diffusion : 1997-11-17

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19960022979
    Description :

    Dans cet article, les auteurs comparent empiriquement trois méthodes d'estimation - par régression, par régression restreinte au moyen de la méthode dite de la personne principale - utilisées dans une enquête-ménage sur les dépenses de consommation. Les trois méthodes sont appliquées à la stratification a posteriori, qui est importante dans de nombreuses enquêtes-ménages afin de corriger le sous-dénombrement de la population cible. Dans les recensements externes, on dispose habituellement de chiffres de population pour des strates a posteriori pour les personnes, mais non pour les ménages. Si on a besoin d'estimations par ménage, on doit assigner un facteur de pondération unique à chaque ménage, tout en utilisant le nombre de personnes pour la stratification a posteriori. On y parvient facilement en employant des estimateurs de régression pour les totaux ou les moyennes, et en utilisant le nombre de personnes dans les données auxiliaires de chaque ménage. L'estimation par régression restreinte permet de mieux calculer les facteurs de pondération, car on contrôle les valeurs extrêmes et l'on peut obtenir des estimateurs présentant une variance moindre que les estimateurs de Horvitz-Thompson, tout en respectant les totaux de contrôle de la population. Les méthodes de régression permettent également d'utiliser des contrôles pour les chiffres au niveau des personnes et des ménages et pour les données auxiliaires quantitatives. Avec la méthode dite de la personne principale, les personnes sont classées dans les strates a posteriori, et les facteurs de pondération pour les personnes font l'objet d'un rajustement par quotient afin d'obtenir des totaux de contrôle de la population. De la sorte, chaque personne dans un ménage peut se voir attribuer un facteur de pondération différent. Le facteur de pondération associé à la "personne principale" est alors choisi comme facteur de pondération pour le ménage. Nous comparerons les moyennes calculées à partir des trois méthodes, ainsi que leurs erreurs-types estimées, pour un certain nombre de dépenses tirées de l'enquête sur les dépenses de consommation parrainée par le Bureau of Labor Statistics.

    Date de diffusion : 1997-01-30
Date de modification :