Recherche par mot-clé

Aide à l'ordre
entrées

Résultats

Tout (17)

Tout (17) (0 à 10 de 17 résultats)

  • Enquêtes et programmes statistiques — Documentation : 75F0002M1998005
    Description :

    Dans cet article, on donne un aperçu des principaux objectifs de l'Enquête sur la dynamique du travail et du revenu (EDTR) et de la méthodologie utilisée.

    Date de diffusion : 1998-12-30

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013913
    Description :

    On émet l'hypothèse que la mobilité temporaire contribue à l'erreur de couverture au sein des ménages, car cette mobilité pourrait avoir une incidence sur la détermination du "lieu de résidence habituel", notion qui est couramment appliquée lorsqu'on dresse une liste de personnes dans le cadre d'enquêtes ou de recensements portant sur les ménages. Dans la présente communication, nous analysons divers types de mobilité temporaire, ainsi que les rapports existant entre ceux-ci et la détermination du lieu de résidence habituel. La mobilité temporaire est définie par le type de déplacement effectué à partir d'un seul lieu de résidence (où normalement on revient), au cours d'une période de référence de deux à trois mois. La typologie est établie à partir de deux aspects: la diversité des endroits visités et la fréquence des visites. À l'aide de données tirées de la U.S. Living Situation Survey (LSS), qui a été effectuée en 1993, on a identifié quatre types de mobilité temporaire. Dans le cas de deux catégories, on a constaté un comportement associé à des visites répétées et la présence d'un plus grand nombre de personnes qui ont tendance à échapper au dénombrement lors d'enquêtes et de recensements. La modélisation log-linéaire indique que les types de mobilité temporaire constituent une variable prédictive importante liée à la détermination du lieu de résidence habituel, même lorsqu'on tient compte du temps passé loin du ménage et des caractéristiques démographiques.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023614
    Description :

    En 1993, Statistique Canada introduisait l'Interview assistée par ordinateur (IAO) pour certaines enquêtes-ménages menées dans un environnement décentralisé. Cette technologie a été utilisée avec succès pendant quelques années et la plupart des enquêtes-ménages sont maintenant converties à cette méthode de collecte. Le présent document fait un résumé de l'expérience acquise et des leçons apprises depuis le début de la recherche sur le sujet. Il décrit certains des essais qui ont mené à l'adoption de cette technologie et quelques-unes des nouvelles possibilités qui sont nées de sa mise en oeuvre. Il présente aussi un certain nombre d'enjeux qui se sont posés lors de l'adoption de l'IAO (certains existant encore aujourd'hui) et se termine sur un bref survol de ce que nous réserve l'avenir.

    Date de diffusion : 1998-03-12
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (16)

Analyses (16) (0 à 10 de 16 résultats)

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013913
    Description :

    On émet l'hypothèse que la mobilité temporaire contribue à l'erreur de couverture au sein des ménages, car cette mobilité pourrait avoir une incidence sur la détermination du "lieu de résidence habituel", notion qui est couramment appliquée lorsqu'on dresse une liste de personnes dans le cadre d'enquêtes ou de recensements portant sur les ménages. Dans la présente communication, nous analysons divers types de mobilité temporaire, ainsi que les rapports existant entre ceux-ci et la détermination du lieu de résidence habituel. La mobilité temporaire est définie par le type de déplacement effectué à partir d'un seul lieu de résidence (où normalement on revient), au cours d'une période de référence de deux à trois mois. La typologie est établie à partir de deux aspects: la diversité des endroits visités et la fréquence des visites. À l'aide de données tirées de la U.S. Living Situation Survey (LSS), qui a été effectuée en 1993, on a identifié quatre types de mobilité temporaire. Dans le cas de deux catégories, on a constaté un comportement associé à des visites répétées et la présence d'un plus grand nombre de personnes qui ont tendance à échapper au dénombrement lors d'enquêtes et de recensements. La modélisation log-linéaire indique que les types de mobilité temporaire constituent une variable prédictive importante liée à la détermination du lieu de résidence habituel, même lorsqu'on tient compte du temps passé loin du ménage et des caractéristiques démographiques.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023614
    Description :

    En 1993, Statistique Canada introduisait l'Interview assistée par ordinateur (IAO) pour certaines enquêtes-ménages menées dans un environnement décentralisé. Cette technologie a été utilisée avec succès pendant quelques années et la plupart des enquêtes-ménages sont maintenant converties à cette méthode de collecte. Le présent document fait un résumé de l'expérience acquise et des leçons apprises depuis le début de la recherche sur le sujet. Il décrit certains des essais qui ont mené à l'adoption de cette technologie et quelques-unes des nouvelles possibilités qui sont nées de sa mise en oeuvre. Il présente aussi un certain nombre d'enjeux qui se sont posés lors de l'adoption de l'IAO (certains existant encore aujourd'hui) et se termine sur un bref survol de ce que nous réserve l'avenir.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023615
    Description :

    Le présent article montre l'utilité d'un plan de sondage à plusieurs degrés pour obtenir le dénombrement total des établissements de santé et de la population de clients éventuels dans une région. La plan décrit a été utilisé pour effectuer une enquête à l'échelle de l'État d'Uttar Pradesh, en Inde, au milieu de 1995. Il comprend la sélection d'un échantillon aréolaire en grappes à plusieurs degrés où l'unité primaire d'échantillonnage est soit un îlot urbain, soit un village rural. On a fait le relevé cartographique, dressé la liste et sélectionné tous les points de fourniture de services de santé, qu'il s'agisse d'établissements autonomes ou d'agents de distribution, situés dans les unités primaires d'échantillonnage ou assignés officiellement à ces dernières. On a tiré un échantillon systématique de ménages et interviewé toutes les femmes faisant partie de ces ménages qui satisfaisaient les critères prédéterminés d'admissibilité. On a appliqué des poids d'échantillonnage aux établissements ainsi qu'aux personnes. Pour les établissements, les poids sont corrigés pour tenir compte du fait que certains établissements desservent plusieurs unités secondaires d'échantillonnage. Pour les personnes, on a corrigé les poids pour tenir compte des taux de réponse à l'enquête. L'estimation par sondage du nombre total d'^établissements publics concorde bien avec les totaux publiés. Pareillement, l'estimation de la population de clientes calculée d'après l'enquête concorde avec le chiffre total du Recensement de 1991.

    Date de diffusion : 1998-03-12
Références (1)

Références (1) ((1 résultat))

Date de modification :