Recherche par mot-clé
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Sujet
Type
Résultats
Tout (9)
Tout (9) ((9 résultats))
- 1. Questionnaire de l'EDTR de 1997 : modules sur le contact et les caractéristiques démographiques ArchivéEnquêtes et programmes statistiques — Documentation : 75F0002M1997001Description :
Dans ce document, on présente les questions, les réponses et l'enchaînement de l'interview pour les modules « contact » et « démographie » de l'Enquête sur la dynamique du travail et du revenu (EDTR) de 1997.
Date de diffusion : 1997-12-31 - Articles et rapports : 91F0015M1997004Géographie : CanadaDescription :
L'estimation des effectifs de population par âge, sexe, état matrimonial par provinces, est une entreprise difficile surtout à cause des migrations. En effet, on ne peut caractériser le migrant que par ses déclarations au recensement. Jusqu'en 1991, le recensement ne comportait que la question sur le lieu de résidence cinq ans auparavant. Ainsi, l'individu qui avait cinq ans auparavant une résidence différente était considéré comme un migrant et en tant que tel on lui attribuait au moment de sa migration les caractéristiques qu'il déclarait au recensement. Or, il avait eu cinq ans pour en changer, en particulier son état matrimonial.
Depuis 1991, le recensement pose la question sur la résidence un an auparavant. La même démarche fait attribuer au migrant, au moment de sa migration, des caractéristiques qui selon toute vraisemblance risque davantage d'être les mêmes que celles qu'il déclare. Il n'a eu qu'une seule année pour en changer.L'article décrit en détail les méthodes utilisées maintenant par Statistique Canada pour estimer les caractéristiques des migrants et mesure les avantages par rapport à l'utilisation de la mobilité sur cinq ans.
Date de diffusion : 1997-12-23 - Articles et rapports : 12-001-X19960022973Description :
Il existe des méthodes bien connues dues à Deville et Sárndal (1992) qui permettent de corriger les poids d'échantillonnage de façon à respecter les contraintes d'étalonnage et les restrictions applicables à la fourchette de valeurs. Les estimateurs qui en résultent s'appellent estimateurs de calage. Il existe également une méthode antérieure, peut-être moins bien connue, due à Huang et Fuller (1978). De plus, d'autres méthodes ont été élaborées par Singh (1993), qui a montré que, comme les résultats de Deville-Sárndal l'indiquent, toutes ces méthodes sont asymptotiquement équivalentes à la méthode de régression. Le présent article comporte trois objectifs: i) fournir une justification heuristique simple pour tous les estimateurs de calage, y compris ceux qui sont bien connus et moins bien connus, en adoptant une stratégie non traditionnelle; il s'agit d'abord de choisir un modèle (au lieu de la fonction de distance) pour le coefficient de correction des poids, et, ensuite, de montrer qu'une méthode appropriée d'ajustement des modèles correspond à la solution de minimisation de la distance; ii) offrir aux praticiens des algorithmes de calcul rapide; iii) comparer différentes méthodes du point de vue de la distribution des coefficients de correction des poids, des estimations ponctuelles, de la précision estimée et du nombre de calculs à effectuer en citant des exemples numériques fondés sur un ensemble de données réelles. Il est possible de formuler des observations intéressantes à l'aide d'une analyse descriptive de résultats numériques indiquant que, même si toutes les méthodes de calage ressemblent à la méthode de régression en ce qui concerne les limites larges, elles comportent des différences pour ce qui est des limites étroites.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022978Description :
L'utilisation de données auxiliaires dans les méthodes d'estimation des enquêtes complexes, notamment l'Enquête sur la population active de Statistique Canada, ne cesse de se perfectionner. L'estimation par régression et l'estimation par itération du quotient étaient naguère les méthodes les plus courantes pour intégrer les données auxiliaires à l'estimation. Il arrivait toutefois que les poids associés à l'estimateur soient négatifs ou hautement positifs. Les progrès théoriques réalisés récemment par Deville et Sárndal (1992) en vue de la construction de poids "restrictifs" que l'on peut assujettir à une valeur positive et à un plafond nous ont incités à étudier les propriétés des estimateurs en résultant. Nous examinons ici les propriétés de diverses méthodes servant à engendrer des poids de ce genre et la variance estimative correspondante. Nous nous intéresserons en particulier à deux méthodes d'estimation de la variance en recourant à une simulation de Monte Carlo articulée sur les données de l'Enquête sur la population active. Il s'agit en l'occurrence des méthodes du jackknife et de la linéarisation de Taylor. On en conclut que les estimateurs ponctuels et les estimateurs de la variance n'entraînent qu'un biais minime, même avec l'application de sérieuses "restrictions" aux poids finals.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022979Description :
Dans cet article, les auteurs comparent empiriquement trois méthodes d'estimation - par régression, par régression restreinte au moyen de la méthode dite de la personne principale - utilisées dans une enquête-ménage sur les dépenses de consommation. Les trois méthodes sont appliquées à la stratification a posteriori, qui est importante dans de nombreuses enquêtes-ménages afin de corriger le sous-dénombrement de la population cible. Dans les recensements externes, on dispose habituellement de chiffres de population pour des strates a posteriori pour les personnes, mais non pour les ménages. Si on a besoin d'estimations par ménage, on doit assigner un facteur de pondération unique à chaque ménage, tout en utilisant le nombre de personnes pour la stratification a posteriori. On y parvient facilement en employant des estimateurs de régression pour les totaux ou les moyennes, et en utilisant le nombre de personnes dans les données auxiliaires de chaque ménage. L'estimation par régression restreinte permet de mieux calculer les facteurs de pondération, car on contrôle les valeurs extrêmes et l'on peut obtenir des estimateurs présentant une variance moindre que les estimateurs de Horvitz-Thompson, tout en respectant les totaux de contrôle de la population. Les méthodes de régression permettent également d'utiliser des contrôles pour les chiffres au niveau des personnes et des ménages et pour les données auxiliaires quantitatives. Avec la méthode dite de la personne principale, les personnes sont classées dans les strates a posteriori, et les facteurs de pondération pour les personnes font l'objet d'un rajustement par quotient afin d'obtenir des totaux de contrôle de la population. De la sorte, chaque personne dans un ménage peut se voir attribuer un facteur de pondération différent. Le facteur de pondération associé à la "personne principale" est alors choisi comme facteur de pondération pour le ménage. Nous comparerons les moyennes calculées à partir des trois méthodes, ainsi que leurs erreurs-types estimées, pour un certain nombre de dépenses tirées de l'enquête sur les dépenses de consommation parrainée par le Bureau of Labor Statistics.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022980Description :
Dans le présent article, nous présentons une méthode qui permet d'estimer l'intervalle de confiance de la moyenne d'une population finie quand on dispose de certaines données auxiliaires. Comme l'ont montré Royall et Cumberland grâce à une série d'études empiriques, l'application naïve des méthodes existantes de construction des intervalles de confiance de la moyenne d'une population aboutit parfois à de très médiocres probabilités conditionnelles de couverture subordonnées à la moyenne d'échantillon de la covariable. Le cas échéant, nous proposons de transformer les données pour améliorer la précision de l'approximation normale. Puis, d'après les données transformées, nous faisons une inférence quant à la moyenne de la population originale et intégrons les données auxiliaires à l'inférence soit directement, soit par calage au moyen d'une fonction empirique de vraisemblance. Nous appliquons notre méthode, qui est basée sur le plan de sondage, à six populations réelles et constatons que, dans les cas où la transformation est nécessaire, elle donne de bons résultats comparativement à la méthode de régression habituelle.
Date de diffusion : 1997-01-30 - 7. Application des tests de McNemar à l'étude du panel partiel de la Current Population Survey ArchivéArticles et rapports : 12-001-X19960022981Description :
Les résultats des études du panel partiel de la Current Population Survey révèlent que l'interview téléphonique assistée par ordinateur centralisée (ITAOC) a un effet sur l'estimation de la population active. Une hypothèse est que l'ITAOC accroît la probabilité que le répondant modifie sa déclaration au sujet de sa situation vis-à-vis de l'activité. Le test de McNemar à double échantillon permet de tester cette hypothèse: celle qui nous intéresse est que les changements marginaux relevés dans les tableaux des deux échantillons indépendants sont égaux. Les auteurs présentent deux variantes du test adaptées aux données d'enquêtes complexes, ainsi que leur application aux données du panel partiel de l'enquête parallèle à la Current Population Survey et à celles du projet d'intégration de l'ITAOC à la Current Population Survey.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022982Description :
Les travaux sur les enquêtes par échantillonnage exigent souvent qu'on recoure aux estimateurs des composantes de la variance associés à l'échantillonnage, à l'intérieur des unités primaires d'échantillonnage et entre celles-ci. Dans ce genre de travail, il peut s'avérer important d'avoir une idée de la stabilité des estimateurs des composantes de la variance, bref de savoir si ces estimateurs présentent une variance relativement faible. Nous examinerons ici plusieurs façons de mesurer la stabilité des estimateurs des composantes de la variance reposant sur le plan d'échantillonnage et des quantités connexes, d'après les données. Dans le développement, on mettra en relief les méthodes applicables aux enquêtes caractérisées par un nombre moyen ou important de strates et un petit nombre d'unités primaires d'échantillonnage par strate. Nous attirons principalement l'attention sur la variance intrinséque d'un estimateur de la variance intra-UPÉ et sur deux termes connexes se rapportant aux degés de liberté. Une méthode de simulation permet d'établir si la stabilité observée est cohérente avec les hypothèses types sur la stabilité de l'estimateur de la variance. Nous présentons aussi deux séries de mesures de stabilité pour les estimateurs des composantes de la variance inter-UPÉ reposant sur le plan d'échantillonnage et le ratio de la variance globale avec la variance intra-UPÉ. Les méthodes proposées sont appliquées aux données venant des interviews et des examens de la U.S. Third National Health and Nutrition Examination Survey (NHANES III). Les résultats montrent que les propriétés de la stabilité véritable peuvent changer sensiblement d'une variable à l'autre. Par ailleurs, pour certaines variables, les estimateurs de la variance intra-UPÉ semblent considérablement moins stables qu'on aurait pu s'y attendre consécutivement à un simple dénombrement des unités secondaires de chaque strate.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022983Description :
Nous proposons une approximation des probabilités d'inclusion d'ordre deux pour le plan de Chao (1982) en vue d'obtenir un estimateur de variance approché pour l'estimateur de Horvitz et Thompson. Ensuite, nous comparerons cette variance à d'autres approximations données pour le plan systématique randomisé (Hartley et Rao 1962), le plan réjectif (Hájek 1964) et le plan de Rao-Sampford (Rao 1965 et Sampford 1967). Nous conclurons que ces approximations sont équivalentes si les probabilités d'inclusion d'ordre un sont petites et si taille de l'échantillon est grande.
Date de diffusion : 1997-01-30
Données (0)
Données (0) (0 résultat)
Aucun contenu disponible actuellement
Analyses (8)
Analyses (8) ((8 résultats))
- Articles et rapports : 91F0015M1997004Géographie : CanadaDescription :
L'estimation des effectifs de population par âge, sexe, état matrimonial par provinces, est une entreprise difficile surtout à cause des migrations. En effet, on ne peut caractériser le migrant que par ses déclarations au recensement. Jusqu'en 1991, le recensement ne comportait que la question sur le lieu de résidence cinq ans auparavant. Ainsi, l'individu qui avait cinq ans auparavant une résidence différente était considéré comme un migrant et en tant que tel on lui attribuait au moment de sa migration les caractéristiques qu'il déclarait au recensement. Or, il avait eu cinq ans pour en changer, en particulier son état matrimonial.
Depuis 1991, le recensement pose la question sur la résidence un an auparavant. La même démarche fait attribuer au migrant, au moment de sa migration, des caractéristiques qui selon toute vraisemblance risque davantage d'être les mêmes que celles qu'il déclare. Il n'a eu qu'une seule année pour en changer.L'article décrit en détail les méthodes utilisées maintenant par Statistique Canada pour estimer les caractéristiques des migrants et mesure les avantages par rapport à l'utilisation de la mobilité sur cinq ans.
Date de diffusion : 1997-12-23 - Articles et rapports : 12-001-X19960022973Description :
Il existe des méthodes bien connues dues à Deville et Sárndal (1992) qui permettent de corriger les poids d'échantillonnage de façon à respecter les contraintes d'étalonnage et les restrictions applicables à la fourchette de valeurs. Les estimateurs qui en résultent s'appellent estimateurs de calage. Il existe également une méthode antérieure, peut-être moins bien connue, due à Huang et Fuller (1978). De plus, d'autres méthodes ont été élaborées par Singh (1993), qui a montré que, comme les résultats de Deville-Sárndal l'indiquent, toutes ces méthodes sont asymptotiquement équivalentes à la méthode de régression. Le présent article comporte trois objectifs: i) fournir une justification heuristique simple pour tous les estimateurs de calage, y compris ceux qui sont bien connus et moins bien connus, en adoptant une stratégie non traditionnelle; il s'agit d'abord de choisir un modèle (au lieu de la fonction de distance) pour le coefficient de correction des poids, et, ensuite, de montrer qu'une méthode appropriée d'ajustement des modèles correspond à la solution de minimisation de la distance; ii) offrir aux praticiens des algorithmes de calcul rapide; iii) comparer différentes méthodes du point de vue de la distribution des coefficients de correction des poids, des estimations ponctuelles, de la précision estimée et du nombre de calculs à effectuer en citant des exemples numériques fondés sur un ensemble de données réelles. Il est possible de formuler des observations intéressantes à l'aide d'une analyse descriptive de résultats numériques indiquant que, même si toutes les méthodes de calage ressemblent à la méthode de régression en ce qui concerne les limites larges, elles comportent des différences pour ce qui est des limites étroites.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022978Description :
L'utilisation de données auxiliaires dans les méthodes d'estimation des enquêtes complexes, notamment l'Enquête sur la population active de Statistique Canada, ne cesse de se perfectionner. L'estimation par régression et l'estimation par itération du quotient étaient naguère les méthodes les plus courantes pour intégrer les données auxiliaires à l'estimation. Il arrivait toutefois que les poids associés à l'estimateur soient négatifs ou hautement positifs. Les progrès théoriques réalisés récemment par Deville et Sárndal (1992) en vue de la construction de poids "restrictifs" que l'on peut assujettir à une valeur positive et à un plafond nous ont incités à étudier les propriétés des estimateurs en résultant. Nous examinons ici les propriétés de diverses méthodes servant à engendrer des poids de ce genre et la variance estimative correspondante. Nous nous intéresserons en particulier à deux méthodes d'estimation de la variance en recourant à une simulation de Monte Carlo articulée sur les données de l'Enquête sur la population active. Il s'agit en l'occurrence des méthodes du jackknife et de la linéarisation de Taylor. On en conclut que les estimateurs ponctuels et les estimateurs de la variance n'entraînent qu'un biais minime, même avec l'application de sérieuses "restrictions" aux poids finals.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022979Description :
Dans cet article, les auteurs comparent empiriquement trois méthodes d'estimation - par régression, par régression restreinte au moyen de la méthode dite de la personne principale - utilisées dans une enquête-ménage sur les dépenses de consommation. Les trois méthodes sont appliquées à la stratification a posteriori, qui est importante dans de nombreuses enquêtes-ménages afin de corriger le sous-dénombrement de la population cible. Dans les recensements externes, on dispose habituellement de chiffres de population pour des strates a posteriori pour les personnes, mais non pour les ménages. Si on a besoin d'estimations par ménage, on doit assigner un facteur de pondération unique à chaque ménage, tout en utilisant le nombre de personnes pour la stratification a posteriori. On y parvient facilement en employant des estimateurs de régression pour les totaux ou les moyennes, et en utilisant le nombre de personnes dans les données auxiliaires de chaque ménage. L'estimation par régression restreinte permet de mieux calculer les facteurs de pondération, car on contrôle les valeurs extrêmes et l'on peut obtenir des estimateurs présentant une variance moindre que les estimateurs de Horvitz-Thompson, tout en respectant les totaux de contrôle de la population. Les méthodes de régression permettent également d'utiliser des contrôles pour les chiffres au niveau des personnes et des ménages et pour les données auxiliaires quantitatives. Avec la méthode dite de la personne principale, les personnes sont classées dans les strates a posteriori, et les facteurs de pondération pour les personnes font l'objet d'un rajustement par quotient afin d'obtenir des totaux de contrôle de la population. De la sorte, chaque personne dans un ménage peut se voir attribuer un facteur de pondération différent. Le facteur de pondération associé à la "personne principale" est alors choisi comme facteur de pondération pour le ménage. Nous comparerons les moyennes calculées à partir des trois méthodes, ainsi que leurs erreurs-types estimées, pour un certain nombre de dépenses tirées de l'enquête sur les dépenses de consommation parrainée par le Bureau of Labor Statistics.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022980Description :
Dans le présent article, nous présentons une méthode qui permet d'estimer l'intervalle de confiance de la moyenne d'une population finie quand on dispose de certaines données auxiliaires. Comme l'ont montré Royall et Cumberland grâce à une série d'études empiriques, l'application naïve des méthodes existantes de construction des intervalles de confiance de la moyenne d'une population aboutit parfois à de très médiocres probabilités conditionnelles de couverture subordonnées à la moyenne d'échantillon de la covariable. Le cas échéant, nous proposons de transformer les données pour améliorer la précision de l'approximation normale. Puis, d'après les données transformées, nous faisons une inférence quant à la moyenne de la population originale et intégrons les données auxiliaires à l'inférence soit directement, soit par calage au moyen d'une fonction empirique de vraisemblance. Nous appliquons notre méthode, qui est basée sur le plan de sondage, à six populations réelles et constatons que, dans les cas où la transformation est nécessaire, elle donne de bons résultats comparativement à la méthode de régression habituelle.
Date de diffusion : 1997-01-30 - 6. Application des tests de McNemar à l'étude du panel partiel de la Current Population Survey ArchivéArticles et rapports : 12-001-X19960022981Description :
Les résultats des études du panel partiel de la Current Population Survey révèlent que l'interview téléphonique assistée par ordinateur centralisée (ITAOC) a un effet sur l'estimation de la population active. Une hypothèse est que l'ITAOC accroît la probabilité que le répondant modifie sa déclaration au sujet de sa situation vis-à-vis de l'activité. Le test de McNemar à double échantillon permet de tester cette hypothèse: celle qui nous intéresse est que les changements marginaux relevés dans les tableaux des deux échantillons indépendants sont égaux. Les auteurs présentent deux variantes du test adaptées aux données d'enquêtes complexes, ainsi que leur application aux données du panel partiel de l'enquête parallèle à la Current Population Survey et à celles du projet d'intégration de l'ITAOC à la Current Population Survey.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022982Description :
Les travaux sur les enquêtes par échantillonnage exigent souvent qu'on recoure aux estimateurs des composantes de la variance associés à l'échantillonnage, à l'intérieur des unités primaires d'échantillonnage et entre celles-ci. Dans ce genre de travail, il peut s'avérer important d'avoir une idée de la stabilité des estimateurs des composantes de la variance, bref de savoir si ces estimateurs présentent une variance relativement faible. Nous examinerons ici plusieurs façons de mesurer la stabilité des estimateurs des composantes de la variance reposant sur le plan d'échantillonnage et des quantités connexes, d'après les données. Dans le développement, on mettra en relief les méthodes applicables aux enquêtes caractérisées par un nombre moyen ou important de strates et un petit nombre d'unités primaires d'échantillonnage par strate. Nous attirons principalement l'attention sur la variance intrinséque d'un estimateur de la variance intra-UPÉ et sur deux termes connexes se rapportant aux degés de liberté. Une méthode de simulation permet d'établir si la stabilité observée est cohérente avec les hypothèses types sur la stabilité de l'estimateur de la variance. Nous présentons aussi deux séries de mesures de stabilité pour les estimateurs des composantes de la variance inter-UPÉ reposant sur le plan d'échantillonnage et le ratio de la variance globale avec la variance intra-UPÉ. Les méthodes proposées sont appliquées aux données venant des interviews et des examens de la U.S. Third National Health and Nutrition Examination Survey (NHANES III). Les résultats montrent que les propriétés de la stabilité véritable peuvent changer sensiblement d'une variable à l'autre. Par ailleurs, pour certaines variables, les estimateurs de la variance intra-UPÉ semblent considérablement moins stables qu'on aurait pu s'y attendre consécutivement à un simple dénombrement des unités secondaires de chaque strate.
Date de diffusion : 1997-01-30 - Articles et rapports : 12-001-X19960022983Description :
Nous proposons une approximation des probabilités d'inclusion d'ordre deux pour le plan de Chao (1982) en vue d'obtenir un estimateur de variance approché pour l'estimateur de Horvitz et Thompson. Ensuite, nous comparerons cette variance à d'autres approximations données pour le plan systématique randomisé (Hartley et Rao 1962), le plan réjectif (Hájek 1964) et le plan de Rao-Sampford (Rao 1965 et Sampford 1967). Nous conclurons que ces approximations sont équivalentes si les probabilités d'inclusion d'ordre un sont petites et si taille de l'échantillon est grande.
Date de diffusion : 1997-01-30
Références (1)
Références (1) ((1 résultat))
- 1. Questionnaire de l'EDTR de 1997 : modules sur le contact et les caractéristiques démographiques ArchivéEnquêtes et programmes statistiques — Documentation : 75F0002M1997001Description :
Dans ce document, on présente les questions, les réponses et l'enchaînement de l'interview pour les modules « contact » et « démographie » de l'Enquête sur la dynamique du travail et du revenu (EDTR) de 1997.
Date de diffusion : 1997-12-31
- Date de modification :