Recherche par mot-clé

Résultats

Tout (53)

Tout (53) (40 à 50 de 53 résultats)

41. Bootstrap à demi-échantillon répété et répliques équilibrées répétées en cas d'imputation aléatoire de données Archivé
Articles et rapports : 12-001-X20010026095
Description :
Nous discutons de l'application du bootstrap avec une étape de réimputation en vue de tenir compte de la variance due à l'imputation (Shao et Sitter 1996) dans le cas d'un échantillonnage stratifié à plusieurs degrès. Nous proposons une méthode bootstrap modifiée qui ne nécessite pas de rééchelonnement si bien que la méthode de Shao et Sitter peut être appliquée au cas de l'imputation aléatoire lorsque la taille de l'échantillon de strate de premier degré est très petite. La méthode que nous proposons est une méthode unifiée, applicable quelle que soit la méthode d'imputation (aléatoire on non aléatoire), la taille de la strate (petite ou grande), le genre d'estimateur (lisse ou non lisse) ou le genre de problème (estimation de la variance ou estimation de la distribution d'échantillonnage). En outre, nous discutons de l'approximation de Monte Carlo qu'il convient d'utiliser pour la variance bootstrap lorsque l'on conjugue la réimputation à des méthodes de rééchantillonnage. Dans ces conditions, on doit agir plus prudemment qu'à l'ordinaire. Nous obtenons des résultats comparables pour la méthode des répliques équilibrées répétées qui est souvent utilisée dans le contexte des enquêtes et peut être considérée comme une approximation analytique du bootstrap. Enfin, nous présentons certains résultats d'étude en simulation afin d'examiner les propriétés de l'échantillon de taille finie et divers estimateurs de la variance applicables en cas d'imputation des données.
Date de diffusion : 2002-02-28
42. Estimation de la variance après imputation Archivé
Articles et rapports : 12-001-X20010015856
Description :
On recourt fréquemment à l'imputation pour compenser la non-réponse partielle. L'estimation de la variance après imputation a suscité de nombreux débats et plusieurs estimateurs ont été proposés. Nous proposons un estimateur de la variance fondé sur un ensemble de pseudo-données créé uniquement pour estimer la variance. L'application des estimateurs type de la variance de données complètes à l'ensemble de pseudo-données produit des estimateurs cohérents dans le cas des estimateurs linéaires pour diverses méthodes d'imputation, y compris l'imputation par la méthode hot deck sans remise et avec remise. Nous illustrons l'équivalence asymptotique de la méthode proposée et de la méthode corrigée du jackknife de Rao et Sitter (1995). La méthode proposée s'applique directement à l'estimation de la variance en cas d'échantillonnage à deux phases.
Date de diffusion : 2001-08-22
43. Mieux comprendre la transformation des poids à l'aide d'une mesure de changement Archivé
Articles et rapports : 12-001-X20010015858
Description :
L'objectif de cet article consiste à étudier et à mesurer le changement (du poids initial au poids final) qui est produit par la procédure de modification des poids. Une décomposition des poids finaux est proposée pour évaluer l'incidence relative de l'ajustement de non-réponse, la correction pour la poststratification et l'interaction entre ces deux ajustements. On utilise cette mesure de changement comme outil pour comparer l'efficacité de diverses méthodes d'ajustement pour la non-réponse, notamment les méthodes reposant sur la formation de groupes de réponse homogénes. La mesure de changement est étudiée par l'entremise d'une étude de simulation utilisant les données d'une enquête longitudinale de Statistique Canada, soit l'Enquête sur la dynamique du travail et du revenu. La mesure de changement est également appliquée aux données d'une deuxième enquête longitudinale, c'est-à-dire à l'Enquête nationale longitudinale sur les enfants et les jeunes.
Date de diffusion : 2001-08-22
44. Échantillonnage et pondération d'une enquête auprès de personnes sans domicile : un exemple français Archivé
Articles et rapports : 12-001-X20010015859
Description :
L'INSEE a réalisé en 2001 une enquête destinée à mieux connaître la population sans domicile. En l'absence de base de sondage permettant d'atteindre directement les personnes sans domicile, le principe de l'enquête est d'échantillonner des prestations qui leur sont destinées et d'interroger les individus qui bénéficient de ces prestations. Lorsque l'on désire pondérer les observations individuelles issues de l'enquête, une difficulté surgit du fait qu'un individu peut bénéficier de plusieurs prestations pendant la période de référence considérée. Cet article montre comment il est possible d'appliquer la méthode du partage des poids pour résoudre ce problème. Dans ce type d'enquête, une même variable peut donner lieu à plusieurs paramètres d'intérêt, correspondant à des populations variant avec le temps. À chaque définition des paramètres correspond un jeu de poids. L'article insiste particulièrement sur le calcul de poids un jour moyen et une semaine moyenne. On donne également des éléments sur les données de fréquentation à collecter et la correction de la non-réponse.
Date de diffusion : 2001-08-22
45. Estimation de la taille et des chiffres de population pour des échantillons tirés de listes incomplètes avec probabilités d'inclusion hétérogènes Archivé
Articles et rapports : 12-001-X20000025531
Description :
Les informations tirées de bases de sondage aréolaires et de listes sont combinés de façon à fournir des estimations efficaces de la taille et des chiffres de population. Les auteurs examinent le cas où les probabilités d'inclusion dans les listes sont hétérogènes et modélisées en fonction de covariables. Ils adaptent et modifient la méthode employés par Huggins (1989) et par Albo (1990) pour la modélisation de variables auxiliaires dans des études de type saisir-ressaisir faisant appel à un modèle de régression logistique. Les auteurs présentent les résultats d'une étude de simulation qui permet de comparer divers estimateurs de la taille des bases de sondage et des chiffres de population en ayant recours à la stratégie de régression logistique pour modéliser des probabilités d'inclusion hétérogènes.
Date de diffusion : 2001-02-28
46. Couverture (produits de référence : rapports techniques, Recensement de la population de 1996) Archivé
Enquêtes et programmes statistiques — Documentation : 92-370-X
Description :
Description de la série
Cette série comprend cinq produits de référence générale - l'Avant-goût des produits et services; le Catalogue; le Dictionnaire; Le recensement en bref et les Rapports techniques - ainsi que des produits de référence géographique - GéoSuite et les Cartes de référence.
Description du produit
Les rapports techniques traitent de la qualité des données du recensement de 1996, une entreprise vaste et complexe. Bien que tous les efforts possibles aient été déployés pour maintenir les normes de qualité élevées à toutes les étapes du recensement, il existe néanmoins un certain degré d'erreur dans les résultats. Chaque rapport examine les opérations de collecte et de traitement et fournit les résultats relatifs à l'évaluation de la qualité des données, de même que des notes relatives à la comparabilité historique des données.
Les rapports techniques s'adressent aux utilisateurs déjà familiers avec les données du recensement, ainsi qu'aux spécialistes : ils sont cependant rédigés de façon à être utiles à tous les utilisateurs de données du recensement. La plupart des rapports techniques ont été annulés, sauf Âge, sexe, état matrimonial et union libre, Couverture et Échantillonnage et pondération. En plus d'être disponibles comme publications bilingues, vous les retrouverez gratuitement dans Internet, dans les deux langues officielles.
Ce rapport porte sur les erreurs de couverture, qui sont survenues lorsque des personnes, des ménages, des logements ou des familles ont été omis lors du recensement ou dénombrés par erreur. Les erreurs de couverture constituent l'un des plus importants types d'erreur lors du recensement, étant donné qu'elles touchent non seulement la précision des chiffres des divers univers du recensement mais aussi la précision de toutes les données du recensement portant sur les caractéristiques de ces univers. À l'aide de ces renseignements, les utilisateurs peuvent évaluer les risques entourant des conclusions ou des décisions fondées sur les données du recensement.
Date de diffusion : 1999-12-14
47. Enquête sur l'alphabétisation des adultes en Ontario Archivé
Microdonnées à grande diffusion : 89M0018X
Description :
Cette une produit CD-ROM de l'Enquête sur l'alphabétisation des adultes en Ontario (EAAO) qui a été menée au printemps 1998. Cette enquête avait comme objectif de fournir de l'information sur : les capacités des immigrants de l'Ontario à parler soit anglais ou français durant leurs activités quotidiennes; et la façon dont les immigrants perçoivent leurs capacités de lecture et d'écriture, leurs besoins de formation et les obstacles auxquels ils font face concernant la formation.
Afin de couvrir la majorité des immigrants de l'Ontario, les régions métropolitaines de recensement (RMR) de Toronto, Hamilton, Ottawa, Kitchener, London et St. Catharines étaient comprises dans l'échantillon. Avec ces six RMR, environ 83 % des immigrants faisaient partie de la base de sondage. Cet échantillon de 7 107 ménages couvre la population des immigrants de l'Ontario en général de même qu'une partie plus spécifique de ces derniers, c'est-à-dire les immigrants dont la langue maternelle est l'italien, le chinois, le portugais, le polonais et l'espagnol, et les immigrants nés dans les petites Caraïbes dont la langue maternelle est l'anglais.
Chaque interview durait environ une heure et demie et consistait en un questionnaire d'une demi-heure (questions à caractère démographique et concernant les capacités de lecture et d'écriture) et un test de mesure de l'alphabétisme d'une heure. Le test était dérivé de celui qui a été utilisé pour l'Enquête internationale de l'alphabétisation des adultes (EIAA) de 1994, et couvrait les domaines des textes schématiques et au contenu quantitatif. Un taux de réponse de 76 % a été atteint, c'est-à-dire 4 648 répondants.
Date de diffusion : 1999-10-29
48. Sélection de produits et variation de qualité dans l'Indice des prix à la consommation canadien Archivé
Articles et rapports : 62F0014M1998012
Géographie : Canada
Description :
Le présent document examine les méthodes d'ajustement utilisées pour tenir compte de la variation de qualité dans l'Indice des Prix à la Consommation canadien pour la période 1989-1994. On y constate que, dans la plupart des cas, la pratique canadienne actuelle fait en sorte que le remplacement d'un produit par un autre, d'une variété de produit par une autre ou d'un point de vente par un autre n'ait aucune répercussion sur l'indice global. Les principales exceptions à ce résultat surviennent au moment du remplacement des variétés de produits qui ne sont achetés qu'occasionnellement, et lorsqu'à la suite d'un choix au jugé, il est établi que le ratio de qualité de l'ancienne variété par rapport à la nouvelle ne correspond pas au ratio de leurs prix. Dans ces cas, il y a sur l'indice un effet ascendant ou descendant, selon que la variation de prix signalée est plus élevée ou plus basse que la variation de qualité. Au cours de ces six années visées par cette étude, il y a eu une corrélation entre le rapport des prix d'une variété et ses remplacements et le mouvement de l'indice qui résulte du choix au jugé. Le sens et l'ampleur de la répercussion sur l'indice dépend en grande partie du fait qu'un article est remplacé par un autre dont le prix est plus élevé ou plus bas. Pour ces raisons, le papier conclut que plus d'attention devrait être consacrée à faire en sorte que la sélection de produits soit plus représentative des ventes actuelles que dans le passé.
Date de diffusion : 1999-05-13
49. Enquête sur les voyages des Canadiens Archivé
Revues et périodiques : 87-504-X
Description :
Cette publication présente des tableaux, graphiques et analyses sur les caractéristiques des voyages et des Canadiens voyageant au Canada. Les caractéristiques de voyage présentées comprennent entre autres le but, les activités de loisirs, les moyens de transport, la durée, l'origine et la destination, et les dépenses. En plus de fournir de l'information au niveau national, la publication présente également certains tableaux au niveau des provinces et des régions métropolitaines.
Date de diffusion : 1998-04-17
50. Comparaison des données d'absence entre l'EDTR et l'Enquête sur l'absence du travail (EAT) Archivé
Articles et rapports : 75F0002M1996010
Description :
Dans cette étude, on détermine dans quelle mesure l'Enquête sur la dynamique du travail et du revenu (EDTR) peut produire les mêmes données que l'Enquête sur l'absence du travail (EAT), et, si tel est le cas, d'évaluer comment les estimations se comparent entre les deux enquêtes.
Date de diffusion : 1997-12-31

Données (1)

Données (1) ((1 résultat))

1. Enquête sur l'alphabétisation des adultes en Ontario Archivé
Microdonnées à grande diffusion : 89M0018X
Description :
Cette une produit CD-ROM de l'Enquête sur l'alphabétisation des adultes en Ontario (EAAO) qui a été menée au printemps 1998. Cette enquête avait comme objectif de fournir de l'information sur : les capacités des immigrants de l'Ontario à parler soit anglais ou français durant leurs activités quotidiennes; et la façon dont les immigrants perçoivent leurs capacités de lecture et d'écriture, leurs besoins de formation et les obstacles auxquels ils font face concernant la formation.
Afin de couvrir la majorité des immigrants de l'Ontario, les régions métropolitaines de recensement (RMR) de Toronto, Hamilton, Ottawa, Kitchener, London et St. Catharines étaient comprises dans l'échantillon. Avec ces six RMR, environ 83 % des immigrants faisaient partie de la base de sondage. Cet échantillon de 7 107 ménages couvre la population des immigrants de l'Ontario en général de même qu'une partie plus spécifique de ces derniers, c'est-à-dire les immigrants dont la langue maternelle est l'italien, le chinois, le portugais, le polonais et l'espagnol, et les immigrants nés dans les petites Caraïbes dont la langue maternelle est l'anglais.
Chaque interview durait environ une heure et demie et consistait en un questionnaire d'une demi-heure (questions à caractère démographique et concernant les capacités de lecture et d'écriture) et un test de mesure de l'alphabétisme d'une heure. Le test était dérivé de celui qui a été utilisé pour l'Enquête internationale de l'alphabétisation des adultes (EIAA) de 1994, et couvrait les domaines des textes schématiques et au contenu quantitatif. Un taux de réponse de 76 % a été atteint, c'est-à-dire 4 648 répondants.
Date de diffusion : 1999-10-29

Analyses (48)

Analyses (48) (10 à 20 de 48 résultats)

11. À propos de l'efficacité de l'échantillonnage à probabilité proportionnelle à la taille aléatoire Archivé
Articles et rapports : 12-001-X201100111450
Description :
Dans le présent document, on examine l'efficacité de l'estimateur Horvitz-Thompson au moyen d'un échantillon systématique de probabilité proportionnelle à la taille (PPT) tiré d'une liste en ordre aléatoire. Plus précisément, l'efficacité est comparée avec celle d'un estimateur par quotient ordinaire. Les résultats théoriques sont confirmés d'une manière empirique à l'aide d'une étude de simulation basée sur des données hollandaises de l'Indice des prix à la production.
Date de diffusion : 2011-06-29
12. Estimation par calage en utilisant l'inclinaison exponentielle dans les enquêtes par sondage Archivé
Articles et rapports : 12-001-X201000211377
Description :
Nous considérons le problème de l'estimation des paramètres au moyen d'information auxiliaire, quand celle-ci prend la forme de moments connus. L'estimation par calage est un exemple type de l'utilisation des conditions des moments dans les enquêtes par sondage. Étant donné la forme paramétrique de la distribution originale des observations de l'échantillon, nous utilisons l'échantillonnage préférentiel avec distribution d'échantillonnage estimée de Henmi, Yoshida et Eguchi (2007) pour obtenir un estimateur amélioré. Si nous nous servons de la densité normale pour calculer les poids d'échantillonnage préférentiel, l'estimateur résultant prend la forme d'un estimateur par inclinaison exponentielle en une étape. Nous montrons que l'estimateur par inclinaison exponentielle proposé est asymptotiquement équivalent à l'estimateur par la régression, mais qu'il permet d'éviter les poids extrêmes et offre des avantages du point de vue des calculs par rapport à l'estimateur de la vraisemblance empirique. Nous discutons également de l'estimation de la variance et présentons les résultats d'une étude par simulation limitée.
Date de diffusion : 2010-12-21
13. Estimateurs de variance par linéarisation pour les paramètres de modèles à partir de données d'enquêtes complexes Archivé
Articles et rapports : 12-001-X201000211381
Description :
Les méthodes de linéarisation de Taylor sont souvent utilisées pour obtenir des estimateurs de la variance d'estimateurs par calage de totaux et de paramètres de population finie (ou de recensement) non linéaires, tels que des ratios ou des coefficients de régression et de corrélation, qui peuvent être exprimés sous forme de fonctions lisses de totaux. La linéarisation de Taylor s'applique généralement à tout plan d'échantillonnage, mais elle peut produire de multiples estimateurs de la variance qui sont asymptotiquement sans biais par rapport au plan en cas d'échantillonnage répété. Le choix parmi les estimateurs de variance doit donc s'appuyer sur d'autres critères, tels que i) l'absence approximative de biais dans la variance par rapport au modèle de l'estimateur obtenu sous un modèle hypothétique et ii) la validité sous échantillonnage répété conditionnel. Demnati et Rao (2004) ont proposé une méthode unifiée de calcul des estimateurs de variance par linéarisation de Taylor produisant directement un estimateur de variance unique qui satisfait aux critères susmentionnés pour des plans de sondage généraux. Dans l'analyse des données d'enquête, on suppose généralement que les populations finies sont générées au moyen de modèles de superpopulation et l'on s'intéresse aux inférences analytiques concernant les paramètres de ces modèles. Si les fractions d'échantillonnage sont faibles, la variance d'échantillonnage reflète presque toute la variation due aux processus aléatoires liés au plan de sondage et au modèle. Par contre, si les fractions d'échantillonnage ne sont pas négligeables, il faut tenir compte de la variance du modèle pour construire des inférences valides concernant les paramètres du modèle sous le processus combiné de génération de la population finie à partir du modèle hypothétique de superpopulation et de sélection de l'échantillon conformément au plan de l'échantillonnage spécifié. Dans le présent article, nous obtenons un estimateur de la variance totale selon l'approche de Demnati-Rao en supposant que les caractéristiques d'intérêt sont des variables aléatoires générées au moyen d'un modèle de superpopulation. Nous illustrons la méthode à l'aide d'estimateurs par le ratio et d'estimateurs définis comme des solutions d'équations d'estimation pondérées par calage. Nous présentons aussi les résultats de simulations en vue de déterminer la performance de l'estimateur de variance proposé pour les paramètres du modèle.
Date de diffusion : 2010-12-21
14. Une propriété intéressante de l'entropie de certains plans d'échantillonnage Archivé
Articles et rapports : 12-001-X201000211385
Description :
Dans cette note brève, nous montrons que l'échantillonnage aléatoire sans remise et l'échantillonnage de Bernoulli ont à peu près la même entropie quand la taille de la population est grande. Nous donnons un exemple empirique en guise d'illustration.
Date de diffusion : 2010-12-21
15. Estimation de la composition sur petits domaines en présence de données manquantes informatives Archivé
Articles et rapports : 12-001-X200900211041
Description :
L'estimation de la composition sur petits domaines peut poser un problème de données manquantes informatives, si la probabilité que les données manquent varie d'une catégorie d'intérêt à l'autre, ainsi que d'un petit domaine à l'autre. Nous élaborons une approche de modélisation mixte double qui combine un modèle mixte à effets aléatoires pour les données complètes sous-jacentes et un modèle mixte à effets aléatoires du mécanisme de création différentielle de données manquantes. L'effet du plan d'échantillonnage peut être intégré au moyen d'un modèle d'échantillonnage sous quasi-vraisemblance. L'erreur quadratique moyenne conditionnelle de prédiction associée est approximée sous forme d'une décomposition en trois parties, correspondant à une variance de prédiction naïve, une correction positive qui tient compte de l'incertitude hypothétique de l'estimation des paramètres basée sur les données complètes latentes et une autre correction positive pour la variation supplémentaire due aux données manquantes. Nous illustrons notre approche en l'appliquant à l'estimation de la composition des ménages des municipalités au moyen des données sur les ménages tirées des registres norvégiens, qui présentent un sous-enregistrement informatif du numéro d'identification du logement.
Date de diffusion : 2009-12-23
16. Utilisation des variances à l'intérieur des unités primaires d'échantillonnage pour évaluer la stabilité d'un estimateur classique de variance fondé sur le plan de sondage Archivé
Articles et rapports : 12-001-X200900211045
Description :
Dans l'analyse de données d'enquête, on se sert souvent du nombre de degrés de liberté pour évaluer la stabilité des estimateurs de variance fondé sur le plan de sondage. Par exemple, ce nombre de degrés de liberté est utilisé pour construire les intervalles de confiances fondés sur des approximations de la loi t, ainsi que des tests t connexes. En outre, un petit nombre de degrés de liberté donne une idée qualitative des limites possibles d'un estimateur de variance particulier dans une application. Parfois, le calcul du nombre de degrés de liberté s'appuie sur des formes de l'approximation de Satterthwaite. Ces calculs fondés sur l'approche de Satterthwaite dépendent principalement des grandeurs relatives des variances au niveau de la strate. Cependant, pour des plans de sondage comportant la sélection d'un petit nombre d'unités primaires par strate, les estimateurs de variance au niveau de la strate classiques ne fournissent que des renseignements limités sur les variances réelles de strate. Le cas échéant, les calculs habituels fondés sur l'approche de Satterthwaite peuvent poser des problèmes, surtout dans les analyses portant sur des sous-populations concentrées dans un nombre relativement faible de strates. Pour résoudre ce problème, nous utilisons dans le présent article les estimations des variances à l'intérieur des unités primaires d'échantillonnage (variances intra-UPE) pour fournir de l'information auxiliaire sur les grandeurs relatives des variances globales au niveau de la strate. Les résultats des analyses indiquent que l'estimateur du nombre de degrés de liberté résultant est meilleur que les estimateurs de type Satterthwaite modifiés, à condition que : a) les variances globales au niveau de la strate soient approximativement proportionnelles aux variances intra-strate correspondantes et b) les variances des estimateurs de variance intra-UPE soient relativement faibles. En outre, nous élaborons des méthodes à erreurs sur les variables qui permettent de vérifier empiriquement les conditions a) et b). Pour ces vérifications de modèle, nous établissons des distributions de référence fondées sur des simulations qui diffèrent considérablement des distributions de référence fondées sur les approximations normales en grand échantillon habituelles. Nous appliquons les méthodes proposées à quatre variables de la troisième National Health and Nutrition Examination Survey (NHANES III) réalisée aux États-Unis.
Date de diffusion : 2009-12-23
17. Modèle de régression semiparamétrique pour les données d'enquêtes complexes Archivé
Articles et rapports : 12-001-X200900211046
Description :
Nous élaborons un modèle de régression semiparamétrique pour les enquêtes complexes. Dans ce modèle, les variables explicatives sont représentées séparément sous forme d'une partie non paramétrique et d'une partie linéaire paramétrique. Les méthodes d'estimation combinent l'estimation par la régression polynomiale locale non paramétrique et l'estimation par les moindres carrés. Nous élaborons également des résultats asymptotiques, tels que la convergence et la normalité des estimateurs des coefficients de régression et des fonctions de régression. Nous recourrons à la simulation et à des exemples empiriques tirés de l'Enquête sur la santé en Ontario de 1990 pour illustrer la performance de la méthode et les propriétés des estimations.
Date de diffusion : 2009-12-23
18. Sélection de modèles pour l'évaluation des hypothèses qui soutiennent les méthodes permettant de compenser pour les valeurs manquantes dans les enquêtes par sondage Archivé
Articles et rapports : 11-522-X200800010951
Description :
Les valeurs manquantes attribuables à la non-réponse constituent un type d'erreur non due à l'échantillonnage. Le rejet de cas comportant des valeurs manquantes dans des analyses statistiques peut entraîner des estimations biaisées en raison des différences entre les répondants pour lesquels des valeurs sont manquantes et les autres. De plus, lorsque des variables présentent différentes structures de valeurs manquantes parmi les cas échantillonnés et lorsque les cas comportant des valeurs manquantes sont rejetés des analyses statistiques, celles-ci peuvent produire des résultats incohérents puisqu'elles reposent sur des sous-ensembles différents de cas échantillonnés pouvant ne pas être comparables. Cependant, les analyses qui rejettent des cas avec valeurs manquantes peuvent être valides à la condition que ces valeurs soient manquantes entièrement au hasard. Or, est-ce bien le cas?
En guise de compensation, les valeurs manquantes sont souvent imputées ou les poids de l'enquête sont ajustés à l'aide de méthodes de catégories de poids. Les analyses subséquentes peuvent être valides à condition que les valeurs soient manquantes au hasard dans chaque catégorie de données que supposent les variables indépendantes des modèles qui reposent sur des techniques d'ajustement. Or, peut-on dire que les valeurs sont manquantes au hasard?
Comme les valeurs manquantes ne sont pas observées, les hypothèses sur les valeurs manquantes entièrement au hasard et les valeurs manquantes au hasard formulées dans les analyses ne sont pas souvent examinées. La communication décrit un modèle de sélection à partir duquel des tests d'hypothèse concernant les valeurs manquantes entièrement au hasard et les valeurs manquantes au hasard peuvent être réalisés même si les valeurs manquantes ne sont pas observées. Les données de la National Immunization Survey menée par le Department of Health and Human Services des États-Unis sont utilisées pour illustrer ces méthodes.
Date de diffusion : 2009-12-03
19. Inférence par maximum de vraisemblance pseudo-empirique pour enquêtes multiples et à bases multiples Archivé
Articles et rapports : 11-536-X200900110806
Description :
Les travaux récents qui utilisent la méthode du maximum de vraisemblance pseudo-empirique pour des inférences pour populations finies avec données d'enquêtes complexes se sont d'abord concentrées sur un échantillon d'enquête simple, non stratifié ou stratifié, avec de considérables efforts sur les procédures de calcul. Dans cet exposé, nous présentons une approche d'inférence par maximum de vraisemblance pseudo-empirique pour des enquêtes multiples et des enquêtes à bases multiples, deux problèmes souvent rencontrés en pratique dans les enquêtes. Nous montrons qu'il est possible de faire l'inférence à propos du paramètre d'intérêt commum et d'utiliser efficacement les divers types d'information auxiliaire de façon pratique par la maximisation sous contrainte de la fonction du maximum de vraisemblance pseudo-empirique. Nous obtenons les résultats asymptotiques qui sont utilisés pour construire des intervalles de confiance de ratio de maximum de vraisemblance pseudo-empiriques, soit en utilisant une approximation du chi-deux, soit en utilisant une calibration bootstrap. Tous les problèmes de calcul reliés peuvent être résolus en utilisant des algorithmes d'échantillonnage stratifié existants après avoir reformulé le problème de façon appropriée.
Date de diffusion : 2009-08-11
20. Estimation par régression pour une procédure d'échantillonnage axée sur le rejet Archivé
Articles et rapports : 11-536-X200900110808
Description :
Supposons que de l'information auxiliaire puisse être utilisée pour concevoir une enquête par échantillon. Supposons en outre que la procédure de sélection de l'échantillon consiste à sélectionner un échantillon probabiliste, à rejeter l'échantillon si la moyenne de l'échantillon d'une variable auxiliaire ne se situe pas à une distance précise de la moyenne de la population, et à continuer jusqu'à ce qu'un échantillon soit accepté. Il est prouvé que les propriétés d'un grand échantillon associées à l'estimateur de régression pour l'échantillon axé sur le rejet sont les mêmes que celles de l'estimateur de régression pour la procédure de sélection initiale. De même, l'estimateur habituel de la variance pour l'estimateur de régression est approprié pour l'échantillon axé sur le rejet. Dans une expérience de Monte Carlo, les propriétés d'un grand échantillon se maintiennent dans le cas des échantillons relativement petits. Par ailleurs, les résultats du test de Monte Carlo concordent avec les principes d'approximation théoriques. L'effet d'efficacité de l'échantillonnage axé sur le rejet, tel qu'il est décrit, correspond à o(n-1) par rapport à l'estimation par régression sans rejet, mais l'effet peut s'avérer important pour certains échantillons.
Date de diffusion : 2009-08-11

Références (3)

Références (3) ((3 résultats))

1. Méthodologie de l'Enquête sur la population active du Canada
Enquêtes et programmes statistiques — Documentation : 71-526-X
Description :
L'Enquête sur la population active du Canada (EPA) est la source officielle d'estimations mensuelles de l'emploi total et du chômage. Suite au recensement de 2011, l'EPA a connu un remaniement pour tenir compte de l’évolution des caractéristiques de la population et du marché du travail, pour s’adapter aux besoins actuels et prévus des utilisateurs de données et pour mettre à jour l’information géographique requise pour mener l’enquête. Le programme de remaniement qui a suivi le recensement de 2011 a mené à l'introduction d'un nouvel échantillon au début de l'année 2015. Cette publication est un ouvrage de référence sur les aspects méthodologiques de l'EPA, y compris la stratification, l'échantillonnage, la collecte, le traitement, la pondération, l'estimation, l'estimation de la variance et la qualité des données.
Date de diffusion : 2017-12-21
2. Couverture (produits de référence : rapports techniques, Recensement de la population de 1996) Archivé
Enquêtes et programmes statistiques — Documentation : 92-370-X
Description :
Description de la série
Cette série comprend cinq produits de référence générale - l'Avant-goût des produits et services; le Catalogue; le Dictionnaire; Le recensement en bref et les Rapports techniques - ainsi que des produits de référence géographique - GéoSuite et les Cartes de référence.
Description du produit
Les rapports techniques traitent de la qualité des données du recensement de 1996, une entreprise vaste et complexe. Bien que tous les efforts possibles aient été déployés pour maintenir les normes de qualité élevées à toutes les étapes du recensement, il existe néanmoins un certain degré d'erreur dans les résultats. Chaque rapport examine les opérations de collecte et de traitement et fournit les résultats relatifs à l'évaluation de la qualité des données, de même que des notes relatives à la comparabilité historique des données.
Les rapports techniques s'adressent aux utilisateurs déjà familiers avec les données du recensement, ainsi qu'aux spécialistes : ils sont cependant rédigés de façon à être utiles à tous les utilisateurs de données du recensement. La plupart des rapports techniques ont été annulés, sauf Âge, sexe, état matrimonial et union libre, Couverture et Échantillonnage et pondération. En plus d'être disponibles comme publications bilingues, vous les retrouverez gratuitement dans Internet, dans les deux langues officielles.
Ce rapport porte sur les erreurs de couverture, qui sont survenues lorsque des personnes, des ménages, des logements ou des familles ont été omis lors du recensement ou dénombrés par erreur. Les erreurs de couverture constituent l'un des plus importants types d'erreur lors du recensement, étant donné qu'elles touchent non seulement la précision des chiffres des divers univers du recensement mais aussi la précision de toutes les données du recensement portant sur les caractéristiques de ces univers. À l'aide de ces renseignements, les utilisateurs peuvent évaluer les risques entourant des conclusions ou des décisions fondées sur les données du recensement.
Date de diffusion : 1999-12-14
3. Classement de la population active selon les données de l'EDTR : évaluation des résultats du test 3A Archivé
Enquêtes et programmes statistiques — Documentation : 75F0002M1993014
Description :
Dans ce document, on présente les résultats du test 3A de l'Enquête sur la dynamique du travail et du revenu (EDTR), réalisé en janvier 1993, afin de déterminer les changements nécessaires à apporter aux questions ou aux algorithmes utilisés pour établir la situation vis-à-vis de l'activité.
Date de diffusion : 1995-12-30

Signaler un problème ou une erreur sur cette page

Date de modification :: 2024-10-10

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.

Sélection de la langue

Recherche et menus

Rechercher

Recherche par mot-clé

Filtrer les résultats par

Mot(s)-clé(s)

Sujet

Type

Année de publication

Géographie

Enquête ou programme statistique

Contenu

Résultats

Tout (53) (40 à 50 de 53 résultats)

Données (1) ((1 résultat))

Analyses (48) (10 à 20 de 48 résultats)

Références (3) ((3 résultats))

Recherche par mot-clé

Filtrer les résultats par

Mot(s)-clé(s)

Sujet

Type

Année de publication

Géographie

Enquête ou programme statistique

Contenu

Résultats

Tout (53) (40 à 50 de 53 résultats)

Données (1) ((1 résultat))

Analyses (48) (10 à 20 de 48 résultats)

Références (3) ((3 résultats))

Comment utiliser les filtres et le champ de recherche

Comment préciser ma recherche

Comment fonctionne la recherche

De quelle façon les résultats seront-ils présentés?

De quelle façon les résultats seront-ils présentés?