Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

1 facets displayed. 1 facets selected.

Enquête ou programme statistique

102 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (817)

Tout (817) (0 à 10 de 817 résultats)

  • Articles et rapports : 12-001-X200800210754
    Description :

    Le contexte de la discussion est la fréquence croissante des enquêtes internationales, dont fait partie l'International Tobacco Control (ITC) Policy Evaluation Project, qui a débuté en 2002. Les enquêtes ITC nationales, qui sont longitudinales, ont pour but d'évaluer les effets des mesures stratégiques adoptées dans divers pays en vertu de la Convention-cadre pour la lutte antitabac de l'OMS. Nous examinons et illustrons les défis que posent l'organisation, la collecte des données et l'analyse des enquêtes internationales. L'analyse est une raison qui motive de plus en plus la réalisation d'enquêtes transculturelles à grande échelle. La difficulté fondamentale de l'analyse est de discerner la réponse réelle (ou le manque de réponse) aux changements de politiques et de la séparer des effets du mode de collecte des données, de la non­réponse différentielle, des événements extérieurs, de la durée de la présence dans l'échantillon, de la culture et de la langue. Deux problèmes ayant trait à l'analyse statistique sont examinés. Le premier est celui de savoir quand et comment analyser des données regroupées provenant de plusieurs pays, afin de renforcer des conclusions qui pourraient être généralement valides. Bien que cela paraisse simple, dans certains cas les avis sont partagés quant à la mesure dans laquelle ce regroupement est possible et raisonnable. Selon certains, les modèles à effets aléatoires sont conceptuellement utiles pour les comparaisons formelles. Le deuxième problème consiste à trouver des modèles de mesure applicables à diverses cultures et à divers modes de collecte de données qui permettent l'étalonnage des réponses continues, binaires et ordinales, ainsi que la production de comparaisons dont ont été éliminés les effets extérieurs. Nous constatons que les modèles hiérarchiques offrent un moyen naturel de relâcher les exigences d'invariance du modèle entre les groupes.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210755
    Description :

    L'interview avec rétroinformation (IRI) est utilisée dans de nombreuses enquêtes longitudinales pour « reporter » les données d'une vague à la suivante. Bien qu'il s'agisse d'une technique prometteuse qui a permis d'améliorer la qualité des données à certains égards, on en sait assez peu sur la façon dont elle est effectivement appliquée sur le terrain. La présente étude a pour but d'aborder cette question par la voie du codage du comportement. Divers styles d'IRI ont été employés dans l'English Longitudinal Study of Ageing (ELSA) de janvier 2006 et les interviews pilotes sur le terrain ont été enregistrées. Les enregistrements ont été analysés afin de déterminer si les questions (particulièrement les éléments d'IRI) étaient administrées convenablement et d'explorer la réaction des répondants à l'égard des données reportées. Un des objectifs était de déterminer si les répondants confirmaient ou contestaient l'information déclarée antérieurement, si les données de la vague précédente jouaient un rôle quand les répondants fournissaient les réponses à la vague courante et la façon dont toute discordance était négociée par l'intervieweur et le répondant. Un autre objectif était d'examiner l'efficacité de divers styles d'IRI. Par exemple, dans certains cas, les données de la vague précédente ont été reportées et on a demandé aux répondants de les confirmer explicitement ; dans d'autres, les données antérieures ont été lues et ont a demandé aux répondants si la situation était encore la même. Les résultats révèlent divers niveaux de conformité en ce qui a trait à la lecture initiale de la question et donnent à penser que certains styles d'IRI pourraient être plus efficaces que d'autres.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210756
    Description :

    Dans les enquêtes longitudinales, la non-réponse survient souvent selon un schéma non monotone. Nous considérons l'estimation des moyennes dépendantes du temps sous l'hypothèse que le mécanisme de non-réponse dépend de la dernière valeur. Puisque cette dernière valeur peut elle-même manquer quand la non-réponse est non monotone, le mécanisme de non-réponse examiné est non ignorable. Nous proposons une méthode d'imputation qui consiste à établir d'abord certains modèles d'imputation par la régression en fonction du mécanisme de non-réponse, puis à appliquer l'imputation par la régression non paramétrique. Nous supposons que les données longitudinales suivent une chaîne de Markov admettant des moments finis de deuxième ordre. Aucune autre contrainte n'est imposée à la distribution conjointe des données longitudinales et à leurs indicateurs de non-réponse. La variance est estimée par une méthode du bootstrap. Nous présentons certains résultats de simulation et un exemple concernant une enquête sur l'emploi.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210757
    Description :

    Les poids d'échantillonnage peuvent être calés de manière à refléter les totaux connus de population d'un ensemble de variables auxiliaires. Le biais des prédicteurs des totaux de population finie calculés en utilisant ces poids est faible si ces variables sont reliées à la variable d'intérêt, mais leur variance peut être élevée si l'on utilise un trop grand nombre de variables auxiliaires. Dans le présent article, nous élaborons une approche de « calage adaptatif » où les variables auxiliaires qu'il convient d'utiliser dans la pondération sont sélectionnées en se servant de données d'échantillon. Nous montrons que, dans de nombreux cas, les estimateurs calés adaptativement ont une erreur quadratique moyenne plus faible et de meilleures propriétés de couverture que les estimateurs non adaptatifs.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210758
    Description :

    Nous proposons une méthode pour estimer la variance des estimateurs des évolutions qui prend en compte toutes les composantes de ceux-ci : le plan de sondage, le traitement des non-réponses, le traitement des grosses entreprises, la corrélation de la non-réponse d'une vague à l'autre, l'effet dû à l'utilisation d'un panel, la robustification et le calage au moyen d'un estimateur par le ratio. Cette méthode, qui permet la détermination d'intervalles de confiance des évolutions, est ensuite appliquée à l'enquête suisse sur la valeur ajoutée.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210759
    Description :

    L'analyse des données recueillies auprès d'un échantillon stratifié à plusieurs degrés requiert de l'information sur le plan de sondage, telle que les identificateurs de strate et d'unité primaire d'échantillonnage (UPE), ou les poids de rééchantillonnage connexes, pour l'estimation de la variance. Dans certains fichiers de données à grande diffusion, l'information sur le plan de sondage est masquée en vue d'éviter le risque de divulgation, tout en permettant à l'utilisateur d'obtenir des estimations valides des variances. Par exemple, dans le cas des enquêtes aréolaires comptant un nombre limité d'UPE, les UPE originales sont divisées et (ou) recombinées pour construire des pseudo UPE dans lesquelles sont permutées les unités d'échantillonnage de deuxième degré et de degré subséquent. Cependant, ces méthodes de masquage des UPE faussent manifestement la structure de mise en grappes du plan d'échantillonnage, ce qui donne des estimations de variance biaisées pouvant présenter un rapport systématique entre les deux estimations de variance obtenues avec et sans masquage des identificateurs d'UPE. Certains travaux antérieurs ont révélé certaines tendances du ratio des estimations de la variance obtenues avec et sans masquage si on représente ce ratio graphiquement en fonction de l'effet de plan sans masquage. Le présent article traite de l'effet du masquage des UPE sur les estimations de la variance sous échantillonnage en grappes en fonction de divers aspects, dont la structure de mise en grappes et le degré de masquage. En outre, nous tâchons d'établir une stratégie de masquage des UPE par permutation des unités d'échantillonnage du degré subséquent qui réduit le biais résultant des estimations de la variance. En guise d'illustration, nous utilisons des données provenant de la National Health Interview Survey (NHIS) auxquelles nous avons apporté certaines modifications artificielles. La stratégie proposée permet de bien réduire le biais des estimations de la variance. Les résultats tant théoriques qu'empiriques indiquent que l'effet du masquage des UPE sur les estimations de la variance est modeste si la permutation des unités d'échantillonnage de degré subséquent est minimale. Nous avons appliqué la stratégie de masquage proposée aux données diffusées de la National Health and Nutrition Examination Survey (NHANES) de 2003 2004.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210760
    Description :

    Pour concevoir un échantillon aléatoire simple stratifié sans remise à partir d'une population finie, il faut résoudre deux grandes questions : définir une règle de partition de la population en strates et répartir les unités d'échantillonnage entre les strates sélectionnées. Dans le présent article, nous examinons une stratégie arborescente en vue d'aborder conjointement ces deux questions quand l'enquête est polyvalente et que de l'information multivariée, quantitative ou qualitative, est disponible. Nous formons les strates à l'aide d'un algorithme divisif hiérarchique qui sélectionne des partitions de plus en plus fines en minimisant, à chaque étape, la répartition d'échantillon requise pour atteindre les niveaux de précision établis pour chaque variable étudiée. De cette façon, nous pouvons satisfaire un grand nombre de contraintes sans augmenter fortement la taille globale d'échantillon et sans écarter certaines variables sélectionnées pour la stratification ni diminuer le nombre de leurs intervalles de classe. En outre, l'algorithme a tendance à ne pas définir de strate vide ou presque vide, ce qui évite de devoir regrouper certaines strates. Nous avons appliqué la méthode au remaniement de l'Enquête sur la structure des exploitations agricoles en Italie. Les résultats indiquent que le gain d'efficacité réalisé en utilisant notre stratégie n'est pas trivial. Pour une taille d'échantillon donnée, cette méthode permet d'obtenir la précision requise en exploitant un nombre de strates qui est habituellement égal à une fraction très faible du nombre de strates disponibles quand on combine toutes les classes possibles provenant de n'importe quelle covariable.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210761
    Description :

    La stratification optimale est la méthode qui consiste à choisir les meilleures bornes qui rendent les strates intérieurement homogènes, étant donné la répartition de l'échantillon. Afin de rendre les strates intérieurement homogènes, celles ci doivent être construites de façon que les variances de strate de la caractéristique étudiée soient aussi faibles que possible. Un moyen efficace d'y arriver, si l'on connaît la distribution de la principale variable étudiée, consiste à créer des strates en découpant l'étendue de la distribution à des points appropriés. Si la distribution des fréquences de la variable étudiée est inconnue, on peut l'approximer en se fondant sur l'expérience passée ou sur certains renseignements a priori obtenus au cours d'une étude récente. Dans le présent article, le problème de la détermination des bornes optimales de strate (BOS) est considéré comme étant le problème de la détermination des largeurs optimales de strate (LOS). Il est formulé comme un problème de programmation mathématique (PPM) consistant à minimiser la variance du paramètre de population estimé sous la répartition de Neyman en imposant que la somme des largeurs des strates soit égale à l'étendue totale de la distribution. La variable étudiée est considérée comme suivant un loi continue dont la densité de probabilité est triangulaire ou normale standard. Les PPM formulés, qui s'avèrent être des problèmes de décision à plusieurs degrés, peuvent alors être résolus en utilisant la méthode de programmation dynamique proposée par Bühler et Deutler (1975). Des exemples numériques sont présentés pour illustrer les calculs. Les résultats obtenus sont également comparés à ceux donnés par la méthode de Dalenius et Hodges (1959) dans le cas d'une distribution normale.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210762
    Description :

    Le présent article porte sur le traitement de la répartition optimale dans l'échantillonnage stratifié multivarié comme une optimisation matricielle non linéaire en nombres entiers. Un problème non linéaire d'optimisation multi-objectifs en nombres entiers est étudié à titre de cas particulier. Enfin, un exemple détaillé, y compris certaines méthodes proposées, est donné à la fin de l'exposé.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210763
    Description :

    Le présent article décrit une stratégie d'échantillonnage utile pour obtenir une taille d'échantillon planifiée pour des domaines appartenant à différentes partitions de la population et pour garantir que les erreurs d'échantillonnage des estimations de domaine soient inférieures à un seuil donné. La stratégie d'échantillonnage, qui englobe le cas multidomaine multivarié, est avantageuse quand la taille globale d'échantillon est bornée et que, par conséquent, la solution standard consistant à utiliser un échantillon stratifié dont les strates sont obtenues par le recoupement des variables qui définissent les diverses partitions n'est pas faisable, puisque le nombre de strates est plus grand que la taille globale d'échantillon. La stratégie d'échantillonnage proposée est fondée sur l'utilisation d'une méthode d'échantillonnage équilibré et sur une estimation de type GREG. Le principal avantage de la solution est la faisabilité des calculs, laquelle permet de mettre en oeuvre facilement une stratégie globale d'estimation pour petits domaines qui tient compte simultanément du plan d'échantillonnage et de l'estimateur, et qui améliore l'efficacité des estimateurs directs de domaine. Les propriétés empiriques de la stratégie d'échantillonnage étudiée sont illustrées au moyen d'une simulation portant sur des données de population réelles et divers estimateurs de domaine.

    Date de diffusion : 2008-12-23
Données (370)

Données (370) (40 à 50 de 370 résultats)

  • Tableau : 97-555-X2006053
    Description :

    Ce tableau montre les données sur les langues pour le Canada, les provinces, les territoires, les régions métropolitaines de recensement et les agglomérations de recensement.

    Ce tableau fait partie du thème « Langues » qui présente des données sur la composition linguistique du Canada, selon la langue maternelle et d'autres variables, ainsi que sur les langues parlées à la maison et la connaissance du français, de l'anglais et des langues non officielles. Ce thème présente également des données sur la langue que les personnes utilisent le plus souvent dans leur emploi, de même que sur les autres langues qu'elles utilisent régulièrement dans leur emploi, selon leur langue maternelle et d'autres caractéristiques socioculturelles.

    Il s'agit de données recueillies auprès d'un échantillon de 20 % de la population canadienne. Seules les données sur la langue maternelle ont été recueillies pour l'ensemble de la population.

    Ce tableau est offert gratuitement dans Internet, numéro 97-555-XWF2006053 au catalogue.

    Date de diffusion : 2008-10-28

  • Tableau : 97-555-X2006054
    Description :

    Ce tableau montre les données sur les langues pour le Canada, les provinces, les territoires, les divisions de recensement et les subdivisions de recensement.

    Ce tableau fait partie du thème « Langues » qui présente des données sur la composition linguistique du Canada, selon la langue maternelle et d'autres variables, ainsi que sur les langues parlées à la maison et la connaissance du français, de l'anglais et des langues non officielles. Ce thème présente également des données sur la langue que les personnes utilisent le plus souvent dans leur emploi, de même que sur les autres langues qu'elles utilisent régulièrement dans leur emploi, selon leur langue maternelle et d'autres caractéristiques socioculturelles.

    Il s'agit de données recueillies auprès d'un échantillon de 20 % de la population canadienne. Seules les données sur la langue maternelle ont été recueillies pour l'ensemble de la population.

    Ce tableau est offert gratuitement dans Internet, numéro 97-555-XWF2006054 au catalogue.

    Date de diffusion : 2008-10-28

  • Tableau : 97-555-X2006055
    Description :

    Ce tableau montre les données sur les langues pour le Canada, les provinces, les territoires, les régions métropolitaines de recensement et les agglomérations de recensement.

    Ce tableau fait partie du thème « Langues » qui présente des données sur la composition linguistique du Canada, selon la langue maternelle et d'autres variables, ainsi que sur les langues parlées à la maison et la connaissance du français, de l'anglais et des langues non officielles. Ce thème présente également des données sur la langue que les personnes utilisent le plus souvent dans leur emploi, de même que sur les autres langues qu'elles utilisent régulièrement dans leur emploi, selon leur langue maternelle et d'autres caractéristiques socioculturelles.

    Il s'agit de données recueillies auprès d'un échantillon de 20 % de la population canadienne. Seules les données sur la langue maternelle ont été recueillies pour l'ensemble de la population.

    Ce tableau est offert gratuitement dans Internet, numéro 97-555-XWF2006055 au catalogue.

    Date de diffusion : 2008-10-28

  • Tableau : 97-555-X2006056
    Description :

    Ce tableau montre les données sur les langues pour le Canada, les provinces, les territoires, les régions métropolitaines de recensement et les agglomérations de recensement.

    Cet ensemble fait partie du thème « Langue » qui présente des données sur la composition linguistique du Canada, selon la langue maternelle et d'autres variables, ainsi que sur les langues parlées à la maison et la connaissance du français, de l'anglais et des langues non officielles. Ce thème présente également des données sur la langue que les personnes utilisent le plus souvent dans leur emploi, de même que sur les autres langues qu'elles utilisent régulièrement dans leur emploi, selon leur langue maternelle et d'autres caractéristiques socioculturelles.

    Il s'agit de données recueillies auprès d'un échantillon de 20 % de la population canadienne. Seules les données sur la langue maternelle ont été recueillies pour l'ensemble de la population.

    Il est possible de s'abonner à tous les ensembles thématiques préparés à partir des tableaux offerts le jour de la diffusion officielle. Voir le numéro 97-569-XCB au catalogue pour obtenir plus de renseignements.

    Ce tableau est offert gratuitement dans Internet, numéro 97-555-XWF2006056 au catalogue.

    Date de diffusion : 2008-10-28

  • Tableau : 97-560-X
    Description :

    Les tableaux faisant partie du thème « Éducation » présentent des données sur les certificats, diplômes ou grades complétés. Des données portant sur le principal domaine d'études du plus haut certificat, diplôme ou grade complété ainsi que sur la province ou le pays où il a été complété sont également disponibles. Ces données servent à déterminer la distribution du plus haut niveau de scolarité atteint pour la population canadienne en général, et pour les groupes particuliers comme les jeunes, les femmes et les immigrants. Elles servent également à mesurer le lien entre le niveau de scolarité atteint, la participation sur le marché du travail et le revenu.

    Date de diffusion : 2008-10-28

  • Tableau : 26-201-X
    Description :

    La revue présente des statistiques complètes et récentes des industries minières, y compris des données sur la production et la valeur des minéraux par espèce et par province. Elle présente également des tableaux chronologiques de leur valeur par groupes principaux, les prix moyens des minéraux les plus importants ainsi que les principales statistiques par grand groupe et par province et les forages des dépôts autres que combustibles. Elle comprend des notes explicatives et une bibliographie.

    Date de diffusion : 2008-10-23

  • Tableau : 89-633-X
    Géographie : Province ou territoire
    Description :

    En 2007, le Cycle 21 de L'Enquête sociale générale (ESG) portait sur « La famille, le soutien social et la retraite ». Les données ont été recueillies sur une période de 9 mois, soit de mars à décembre 2007, avec un échantillon d'environ 25 000 répondants représentant la population hors-établissement des 10 provinces. Les tableaux contiennent des données sur la prévalence des soins formels et informels que reçoivent les aînés en raison de problèmes de santé à long terme et sur les conséquences que ces soins comportent, ainsi que sur le stress autoévalué des aidants. Tous les tableaux sont disponibles selon le sexe et les groupes d'âge, ainsi que pour le Canada et les provinces ou les régions.

    Date de diffusion : 2008-10-21

  • Tableau : 82-224-X
    Description :

    Ce produit regroupe des données sur les naissances vivantes, les avortements provoqués et les pertes foetales (mortinaissances et avortements spontanés) en vue de fournir des données complètes sur les issues de la grossesse.

    Les nombres et les taux pour les trois issues de la grossesse, ainsi que pour le total des grossesses, sont présentés selon la province ou le territoire de résidence et selon le groupe d'âge de la femme.

    Date de diffusion : 2008-10-20

  • Tableau : 26-223-X
    Description :

    Cette publication annuelle présente des données sur les établissements, les salariés, les rémunérations, les matières utilisées, les fournitures et les services des entrepreneurs. Elle montre aussi des données sur la production, les livraisons et les forages complétés. Elle comprend une liste des établissements par tranche d'emploi, une liste de termes et définitions et une bibliographie.

    Date de diffusion : 2008-10-16

  • Tableau : 89-628-X2008011
    Description : L'Enquête sur la participation et les limitations d'activités (EPLA) est une enquête nationale qui recueille de l'information sur les adultes et les enfants au Canada dont les activités quotidiennes peuvent être limitées par un état ou un problème de santé.

    Ce rapport présente une série de tableaux tel que; Revenue Total; Pension de la sécurité de la vieillesse et supplément de revenue garantie; Régime de rentes du Québec et Canada; Prestation d'assurance emploi; Prestation fiscale canadienne; Autres revenue gouvernementaux; Revenue d'emploie; Revenue de placement; Revenue de retraite.

    Date de diffusion : 2008-10-14
Analyses (394)

Analyses (394) (0 à 10 de 394 résultats)

  • Articles et rapports : 12-001-X200800210754
    Description :

    Le contexte de la discussion est la fréquence croissante des enquêtes internationales, dont fait partie l'International Tobacco Control (ITC) Policy Evaluation Project, qui a débuté en 2002. Les enquêtes ITC nationales, qui sont longitudinales, ont pour but d'évaluer les effets des mesures stratégiques adoptées dans divers pays en vertu de la Convention-cadre pour la lutte antitabac de l'OMS. Nous examinons et illustrons les défis que posent l'organisation, la collecte des données et l'analyse des enquêtes internationales. L'analyse est une raison qui motive de plus en plus la réalisation d'enquêtes transculturelles à grande échelle. La difficulté fondamentale de l'analyse est de discerner la réponse réelle (ou le manque de réponse) aux changements de politiques et de la séparer des effets du mode de collecte des données, de la non­réponse différentielle, des événements extérieurs, de la durée de la présence dans l'échantillon, de la culture et de la langue. Deux problèmes ayant trait à l'analyse statistique sont examinés. Le premier est celui de savoir quand et comment analyser des données regroupées provenant de plusieurs pays, afin de renforcer des conclusions qui pourraient être généralement valides. Bien que cela paraisse simple, dans certains cas les avis sont partagés quant à la mesure dans laquelle ce regroupement est possible et raisonnable. Selon certains, les modèles à effets aléatoires sont conceptuellement utiles pour les comparaisons formelles. Le deuxième problème consiste à trouver des modèles de mesure applicables à diverses cultures et à divers modes de collecte de données qui permettent l'étalonnage des réponses continues, binaires et ordinales, ainsi que la production de comparaisons dont ont été éliminés les effets extérieurs. Nous constatons que les modèles hiérarchiques offrent un moyen naturel de relâcher les exigences d'invariance du modèle entre les groupes.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210755
    Description :

    L'interview avec rétroinformation (IRI) est utilisée dans de nombreuses enquêtes longitudinales pour « reporter » les données d'une vague à la suivante. Bien qu'il s'agisse d'une technique prometteuse qui a permis d'améliorer la qualité des données à certains égards, on en sait assez peu sur la façon dont elle est effectivement appliquée sur le terrain. La présente étude a pour but d'aborder cette question par la voie du codage du comportement. Divers styles d'IRI ont été employés dans l'English Longitudinal Study of Ageing (ELSA) de janvier 2006 et les interviews pilotes sur le terrain ont été enregistrées. Les enregistrements ont été analysés afin de déterminer si les questions (particulièrement les éléments d'IRI) étaient administrées convenablement et d'explorer la réaction des répondants à l'égard des données reportées. Un des objectifs était de déterminer si les répondants confirmaient ou contestaient l'information déclarée antérieurement, si les données de la vague précédente jouaient un rôle quand les répondants fournissaient les réponses à la vague courante et la façon dont toute discordance était négociée par l'intervieweur et le répondant. Un autre objectif était d'examiner l'efficacité de divers styles d'IRI. Par exemple, dans certains cas, les données de la vague précédente ont été reportées et on a demandé aux répondants de les confirmer explicitement ; dans d'autres, les données antérieures ont été lues et ont a demandé aux répondants si la situation était encore la même. Les résultats révèlent divers niveaux de conformité en ce qui a trait à la lecture initiale de la question et donnent à penser que certains styles d'IRI pourraient être plus efficaces que d'autres.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210756
    Description :

    Dans les enquêtes longitudinales, la non-réponse survient souvent selon un schéma non monotone. Nous considérons l'estimation des moyennes dépendantes du temps sous l'hypothèse que le mécanisme de non-réponse dépend de la dernière valeur. Puisque cette dernière valeur peut elle-même manquer quand la non-réponse est non monotone, le mécanisme de non-réponse examiné est non ignorable. Nous proposons une méthode d'imputation qui consiste à établir d'abord certains modèles d'imputation par la régression en fonction du mécanisme de non-réponse, puis à appliquer l'imputation par la régression non paramétrique. Nous supposons que les données longitudinales suivent une chaîne de Markov admettant des moments finis de deuxième ordre. Aucune autre contrainte n'est imposée à la distribution conjointe des données longitudinales et à leurs indicateurs de non-réponse. La variance est estimée par une méthode du bootstrap. Nous présentons certains résultats de simulation et un exemple concernant une enquête sur l'emploi.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210757
    Description :

    Les poids d'échantillonnage peuvent être calés de manière à refléter les totaux connus de population d'un ensemble de variables auxiliaires. Le biais des prédicteurs des totaux de population finie calculés en utilisant ces poids est faible si ces variables sont reliées à la variable d'intérêt, mais leur variance peut être élevée si l'on utilise un trop grand nombre de variables auxiliaires. Dans le présent article, nous élaborons une approche de « calage adaptatif » où les variables auxiliaires qu'il convient d'utiliser dans la pondération sont sélectionnées en se servant de données d'échantillon. Nous montrons que, dans de nombreux cas, les estimateurs calés adaptativement ont une erreur quadratique moyenne plus faible et de meilleures propriétés de couverture que les estimateurs non adaptatifs.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210758
    Description :

    Nous proposons une méthode pour estimer la variance des estimateurs des évolutions qui prend en compte toutes les composantes de ceux-ci : le plan de sondage, le traitement des non-réponses, le traitement des grosses entreprises, la corrélation de la non-réponse d'une vague à l'autre, l'effet dû à l'utilisation d'un panel, la robustification et le calage au moyen d'un estimateur par le ratio. Cette méthode, qui permet la détermination d'intervalles de confiance des évolutions, est ensuite appliquée à l'enquête suisse sur la valeur ajoutée.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210759
    Description :

    L'analyse des données recueillies auprès d'un échantillon stratifié à plusieurs degrés requiert de l'information sur le plan de sondage, telle que les identificateurs de strate et d'unité primaire d'échantillonnage (UPE), ou les poids de rééchantillonnage connexes, pour l'estimation de la variance. Dans certains fichiers de données à grande diffusion, l'information sur le plan de sondage est masquée en vue d'éviter le risque de divulgation, tout en permettant à l'utilisateur d'obtenir des estimations valides des variances. Par exemple, dans le cas des enquêtes aréolaires comptant un nombre limité d'UPE, les UPE originales sont divisées et (ou) recombinées pour construire des pseudo UPE dans lesquelles sont permutées les unités d'échantillonnage de deuxième degré et de degré subséquent. Cependant, ces méthodes de masquage des UPE faussent manifestement la structure de mise en grappes du plan d'échantillonnage, ce qui donne des estimations de variance biaisées pouvant présenter un rapport systématique entre les deux estimations de variance obtenues avec et sans masquage des identificateurs d'UPE. Certains travaux antérieurs ont révélé certaines tendances du ratio des estimations de la variance obtenues avec et sans masquage si on représente ce ratio graphiquement en fonction de l'effet de plan sans masquage. Le présent article traite de l'effet du masquage des UPE sur les estimations de la variance sous échantillonnage en grappes en fonction de divers aspects, dont la structure de mise en grappes et le degré de masquage. En outre, nous tâchons d'établir une stratégie de masquage des UPE par permutation des unités d'échantillonnage du degré subséquent qui réduit le biais résultant des estimations de la variance. En guise d'illustration, nous utilisons des données provenant de la National Health Interview Survey (NHIS) auxquelles nous avons apporté certaines modifications artificielles. La stratégie proposée permet de bien réduire le biais des estimations de la variance. Les résultats tant théoriques qu'empiriques indiquent que l'effet du masquage des UPE sur les estimations de la variance est modeste si la permutation des unités d'échantillonnage de degré subséquent est minimale. Nous avons appliqué la stratégie de masquage proposée aux données diffusées de la National Health and Nutrition Examination Survey (NHANES) de 2003 2004.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210760
    Description :

    Pour concevoir un échantillon aléatoire simple stratifié sans remise à partir d'une population finie, il faut résoudre deux grandes questions : définir une règle de partition de la population en strates et répartir les unités d'échantillonnage entre les strates sélectionnées. Dans le présent article, nous examinons une stratégie arborescente en vue d'aborder conjointement ces deux questions quand l'enquête est polyvalente et que de l'information multivariée, quantitative ou qualitative, est disponible. Nous formons les strates à l'aide d'un algorithme divisif hiérarchique qui sélectionne des partitions de plus en plus fines en minimisant, à chaque étape, la répartition d'échantillon requise pour atteindre les niveaux de précision établis pour chaque variable étudiée. De cette façon, nous pouvons satisfaire un grand nombre de contraintes sans augmenter fortement la taille globale d'échantillon et sans écarter certaines variables sélectionnées pour la stratification ni diminuer le nombre de leurs intervalles de classe. En outre, l'algorithme a tendance à ne pas définir de strate vide ou presque vide, ce qui évite de devoir regrouper certaines strates. Nous avons appliqué la méthode au remaniement de l'Enquête sur la structure des exploitations agricoles en Italie. Les résultats indiquent que le gain d'efficacité réalisé en utilisant notre stratégie n'est pas trivial. Pour une taille d'échantillon donnée, cette méthode permet d'obtenir la précision requise en exploitant un nombre de strates qui est habituellement égal à une fraction très faible du nombre de strates disponibles quand on combine toutes les classes possibles provenant de n'importe quelle covariable.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210761
    Description :

    La stratification optimale est la méthode qui consiste à choisir les meilleures bornes qui rendent les strates intérieurement homogènes, étant donné la répartition de l'échantillon. Afin de rendre les strates intérieurement homogènes, celles ci doivent être construites de façon que les variances de strate de la caractéristique étudiée soient aussi faibles que possible. Un moyen efficace d'y arriver, si l'on connaît la distribution de la principale variable étudiée, consiste à créer des strates en découpant l'étendue de la distribution à des points appropriés. Si la distribution des fréquences de la variable étudiée est inconnue, on peut l'approximer en se fondant sur l'expérience passée ou sur certains renseignements a priori obtenus au cours d'une étude récente. Dans le présent article, le problème de la détermination des bornes optimales de strate (BOS) est considéré comme étant le problème de la détermination des largeurs optimales de strate (LOS). Il est formulé comme un problème de programmation mathématique (PPM) consistant à minimiser la variance du paramètre de population estimé sous la répartition de Neyman en imposant que la somme des largeurs des strates soit égale à l'étendue totale de la distribution. La variable étudiée est considérée comme suivant un loi continue dont la densité de probabilité est triangulaire ou normale standard. Les PPM formulés, qui s'avèrent être des problèmes de décision à plusieurs degrés, peuvent alors être résolus en utilisant la méthode de programmation dynamique proposée par Bühler et Deutler (1975). Des exemples numériques sont présentés pour illustrer les calculs. Les résultats obtenus sont également comparés à ceux donnés par la méthode de Dalenius et Hodges (1959) dans le cas d'une distribution normale.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210762
    Description :

    Le présent article porte sur le traitement de la répartition optimale dans l'échantillonnage stratifié multivarié comme une optimisation matricielle non linéaire en nombres entiers. Un problème non linéaire d'optimisation multi-objectifs en nombres entiers est étudié à titre de cas particulier. Enfin, un exemple détaillé, y compris certaines méthodes proposées, est donné à la fin de l'exposé.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800210763
    Description :

    Le présent article décrit une stratégie d'échantillonnage utile pour obtenir une taille d'échantillon planifiée pour des domaines appartenant à différentes partitions de la population et pour garantir que les erreurs d'échantillonnage des estimations de domaine soient inférieures à un seuil donné. La stratégie d'échantillonnage, qui englobe le cas multidomaine multivarié, est avantageuse quand la taille globale d'échantillon est bornée et que, par conséquent, la solution standard consistant à utiliser un échantillon stratifié dont les strates sont obtenues par le recoupement des variables qui définissent les diverses partitions n'est pas faisable, puisque le nombre de strates est plus grand que la taille globale d'échantillon. La stratégie d'échantillonnage proposée est fondée sur l'utilisation d'une méthode d'échantillonnage équilibré et sur une estimation de type GREG. Le principal avantage de la solution est la faisabilité des calculs, laquelle permet de mettre en oeuvre facilement une stratégie globale d'estimation pour petits domaines qui tient compte simultanément du plan d'échantillonnage et de l'estimateur, et qui améliore l'efficacité des estimateurs directs de domaine. Les propriétés empiriques de la stratégie d'échantillonnage étudiée sont illustrées au moyen d'une simulation portant sur des données de population réelles et divers estimateurs de domaine.

    Date de diffusion : 2008-12-23
Références (54)

Références (54) (0 à 10 de 54 résultats)

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2009001
    Géographie : Province ou territoire
    Description :

    Ce guide présente de l'information qui intéresse les utilisateurs des données provenant de l'Enquête sur les dépenses des ménages, nous avons obtenu des renseignements sur les habitudes de dépense, les caractéristiques des logements et de l'équipement ménager des ménages canadiens. L'enquête a porté sur les ménages privés des dix provinces. (Dans le but de réduire le fardeau de réponse pour les ménages du nord, l'EDM est menée dans le nord seulement tous les deux ans, débutant a partir de 1999.)

    Ce guide comprend les définitions des termes et des variables de l'enquête, ainsi que des descriptions de la méthode, la qualité des données, et le contenu de tableaux standards de données. Il contient aussi une section décrivant les différentes statistiques pouvant être créées au moyen des données sur les dépenses (p. ex. part du budget, part du marché, et agrégat de dépenses).

    Date de diffusion : 2008-12-22

  • Enquêtes et programmes statistiques — Documentation : 97-563-G2006003
    Description :

    Ce guide porte sur les variables suivantes : Revenu après impôt, Revenu total et ses composantes, Catégorie de revenu ainsi que sur d'autres variables apparentées de la diffusion Revenu et gains.

    Fournit des renseignements qui permettent aux utilisateurs de se servir des données du Recensement de 2006, de les mettre en application et de les interpréter. Chaque guide renferme des définitions et des explications sur les concepts du recensement, la qualité des données et la comparabilité historique des données. Des renseignements supplémentaires seront inclus pour des variables spécifiques afin d'aider les utilisateurs en général à mieux comprendre les concepts et les questions utilisés dans le recensement.

    Date de diffusion : 2008-12-04

  • Enquêtes et programmes statistiques — Documentation : 97-563-G
    Description :

    Ce guide porte sur les variables suivantes : Revenu après impôt, Revenu total et ses composantes, Catégorie de revenu ainsi que sur d'autres variables apparentées de la diffusion Revenu et gains.

    Fournit des renseignements qui permettent aux utilisateurs de se servir des données du Recensement de 2006, de les mettre en application et de les interpréter. Chaque guide renferme des définitions et des explications sur les concepts du recensement, la qualité des données et la comparabilité historique des données. Des renseignements supplémentaires seront inclus pour des variables spécifiques afin d'aider les utilisateurs en général à mieux comprendre les concepts et les questions utilisés dans le recensement.

    Date de diffusion : 2008-12-04

  • Enquêtes et programmes statistiques — Documentation : 89-634-X2008006
    Description :

    Le présent guide vise à aider les utilisateurs des données à comprendre les concepts et les méthodes utilisés dans le cadre de l'Enquête sur les enfants autochtones (EEA) de 2006, qui s'est déroulée d'octobre 2006 à mars 2007.

    Le guide comprend également des détails techniques sur l'échantillonnage, le traitement et la qualité des données. Par ailleurs, il explique le rapport entre l'EEA et le Recensement de 2006 et comporte des mises en garde à l'intention des utilisateurs quant aux différences importantes dans les données produites à partir de ces deux sources. L'annexe 1 comprend un glossaire des termes liés à l'EEA. L'annexe 2 fournit les réponses à certaines questions fréquentes. Des liens avec les questionnaires de l'EEA de 2006 se trouvent à l'annexe 3.

    Date de diffusion : 2008-11-18

  • Enquêtes et programmes statistiques — Documentation : 92-445-X
    Description :

    Cette trousse fournit aux enseignants de la documentation novatrice à utiliser en classe fondée sur les résultats du Recensement de 2006. Conçues pour les élèves d'intermédiaire et du secondaire, ces activités, prêtes à utiliser en classe, ont été testées en classe par des pédagogues professionnels. Elles exigent très peu de temps de préparation.

    Les activités sont regroupées par sujet, selon la terminologie du recensement.

    On peut utiliser les activités de la Trousse de l'enseignant, Recensement de 2006 dans les cours suivants : français, mathématiques, études sociales, géographie, histoire, économie familiale et informatique. Chaque activité est accompagnée d'une mention indiquant le niveau d'études suggéré, de même que des tableaux, des graphiques et des données requises.

    Date de diffusion : 2008-11-14

  • Avis et consultations : 92-138-X
    Description :

    À chaque recensement, Statistique Canada améliore ses méthodes de diffusion au public en cherchant des moyens de publier les résultats du recensement dans les meilleurs délais et de façon accessible, tout en maintenant des hautes normes de qualité des données.

    Ce guide de consultation a pour objet de vous aider à commenter les produits et services du Recensement de 2006 et à formuler des idées et des suggestions sur la stratégie de diffusion du Recensement de 2011.

    Date de diffusion : 2008-11-05

  • Enquêtes et programmes statistiques — Documentation : 75F0002M199201A
    Description :

    À partir de janvier 1994, l'Enquête sur la dynamique du travail et du revenu (EDTR) va suivre un panel de familles et d'individus durant une période d'au moins six ans afin de cerner leurs expériences de travail ainsi que les changements monétaires et familiaux. Un document intitulé "Contenu de l'Enquête sur la dynamique du travail et du revenu: document de travail " a été distribué en février 1992.

    Ce document servait de base pour consulter les utilisateurs concernés. Lors de ce processus, le contenu a subi plusieurs modifications. Un test à grande échelle de l'EDTR sera effectué en février et mai 1993 pour évaluer le nouveau contenu.

    Ce présent document porte sur le contenu touchant la démographique et le travail qui sera utilisé pour le test.

    Date de diffusion : 2008-10-21

  • Enquêtes et programmes statistiques — Documentation : 12-589-X
    Description :

    Dans cette publication gratuite, on présente les concepts et les critères qui ont servi à déterminer les entités formant le secteur public du Canada.

    La population statistique qui en découle constitue le cadre qui permet d'examiner l'étendue de la participation du gouvernement à la production de biens et de services et le processus connexe d'allocation des ressources au sein de l'économie canadienne.

    Les concepts et les critères contenus dans le guide sont conformes à deux normes de classification reconnues à l'échelon international : le guide du Système de comptabilité nationale de 2008 et le Government Finance Statistics Manual 2001 du Fonds monétaire international (FMI).

    Dans ce guide, on établit également les diverses composantes du secteur public utilisées pour compiler et agréger les données de ce même secteur. Cette structure permet aussi de comparer les finances du gouvernement canadien aux appareils statistiques macroéconomiques internationaux.

    Date de diffusion : 2008-09-26

  • Enquêtes et programmes statistiques — Documentation : 82-582-X
    Description :

    Ce document méthodologique a été conçu pour aider les lecteurs à comprendre et à évaluer les rapports qui classent l'état de santé de la population ou le rendement du système de santé d'un pays, d'une province ou d'une région. Il expose brièvement les composantes et les processus qui sous-tendent les classements relatifs à la santé, explore les raisons pour lesquelles l'interprétation de tels classements peut être difficile et comprend une liste de vérification simple et claire qui sera une ressource d'évaluation indispensable pour lire les rapports de classement relatif à la santé.

    Date de diffusion : 2008-09-16

  • Enquêtes et programmes statistiques — Documentation : 75-512-X
    Description :

    Ce livre fournit la documentation technique des variables, des méthodologies et des listes de références spéciales employées pour développer les constatations de recherche rapportées dans "Nouvelles frontières de recherche au sujet de la retraite". Il sera employé autour du monde par des chercheurs et professeurs, ainsi que par des étudiants préparant des thèses liées aux modèles de la transition à la retraite. Cette documentation est importante parce qu'une grande partie du livre est consacrée aux exposés scientifiques basés sur les fichiers de Statistique Canada et qui nécessitent des innovations substantielles des données et concepts utiles.

    Date de diffusion : 2008-09-08
Date de modification :