Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

9 facets displayed. 0 facets selected.

Géographie

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (37)

Tout (37) (0 à 10 de 37 résultats)

  • Microdonnées à grande diffusion : 81M0011X
    Description :

    Cette enquête vise à déterminer dans quelle mesure les personnes ayant obtenu leur diplôme d'études postsecondaires ont réussi à se trouver un emploi par la suite, le lien entre le programme d'études du diplômé et son emploi subséquent, la satisfaction des diplômés à l'égard de leur emploi et de leurs perspectives de carrière, les taux de sous-emploi et de chômage, le type d'emploi obtenu par rapport aux possibilités de carrière et aux qualifications exigées, et l'incidence des études postsecondaires sur la réussite professionnelle. Cette information vise les responsables de l'élaboration de politiques, les chercheurs, les éducateurs, les employeurs et les jeunes adultes intéressés à l'éducation postsecondaire et à la transition de l'école au travail pour les diplômés des écoles de métiers et de la formation professionnelle, des collèges et des universités.

    Date de diffusion : 2015-01-12

  • Microdonnées à grande diffusion : 89M0017X
    Description :

    Il est maintenant possible de consulter le fichier de microdonnées à grande diffusion de l'Enquête canadienne sur le don, le bénévolat et la participation de 2010. Ce fichier comprend des données recueillies auprès de près de 15 000 répondants âgés de 15 ans et plus résidant dans un ménage privé de l'une des provinces. Le fichier de microdonnées à grande diffusion fournit des renseignements à l'échelon provincial sur la façon dont les Canadiens s'y prennent pour faire des dons d'argent et de biens à des organismes sans but lucratif et de bienfaisance ainsi que du bénévolat au sein de ces organismes et pour offrir de l'aide directe à autrui. Le fichier comprend également des données sociodémographiques ainsi que des données sur le revenu et sur la population active.

    Date de diffusion : 2012-05-04

  • Articles et rapports : 11-522-X200600110424
    Description :

    L'enquête réalisée par la Chine dans le cadre du programme de lutte internationale contre le tabagisme (ITC pour International Tobacco Control) comprend un plan d'échantillonnage à plusieurs degrés avec probabilités inégales où les grappes du niveau supérieur sont sélectionnées par la méthode d'échantillonnage PPT systématique randomisé. Durant l'exécution de l'enquête, il faut résoudre le problème suivant : plusieurs grappes de niveau supérieur échantillonnées refusent de participer et doivent être remplacées par des unités de substitution sélectionnées parmi les unités non incluses dans l'échantillon initial, de nouveau par la méthode d'échantillonnage PPT systématique randomisé. Dans de telles conditions, les probabilités d'inclusion de premier ordre des unités finales sélectionnées sont très difficiles à calculer et la détermination des probabilités d'inclusion de deuxième ordre devient virtuellement impossible. Dans le présent article, nous élaborons une méthode fondée sur la simulation pour calculer les probabilités d'inclusion de premier et de deuxième ordre lorsque le calcul direct est prohibitif ou impossible. Nous démontrons l'efficacité de la méthode que nous proposons en nous appuyant sur des considérations théoriques et des exemples numériques. Nous incluons plusieurs fonctions et codes R/S PLUS pour la procédure proposée. La méthode peut être étendue à des situations de refus/substitution plus complexes susceptibles de survenir en pratique.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110612
    Description :

    Lehtonen et Veijanen (1999) ont proposé un nouvel estimateur par la régression généralisée (GREG) assisté par modèle d'une moyenne de petit domaine sous un modèle à deux niveaux. Ils ont montré que l'estimateur proposé donne de meilleurs résultats que l'estimateur GREG habituel en ce qui concerne le biais relatif absolu moyen et l'erreur relative absolue médiane moyenne. Nous calculons l'erreur quadratique moyenne (EQM) du nouvel estimateur GREG sous le modèle à deux niveaux et nous la comparons à celle de l'estimateur fondé sur le meilleur prédicteur linéaire sans biais (BLUP). Nous présentons aussi des résultats empiriques concernant l'efficacité relative des estimateurs. Nous montrons que le nouvel estimateur GREG a de meilleures propriétés que l'estimateur GREG habituel en ce qui concerne l'EQM moyenne et l'erreur relative absolue moyenne. Nous montrons aussi que, parce qu'il emprunte de l'information aux petits domaines apparentés, l'estimateur EBLUP donne des résultats nettement meilleurs que l'estimateur GREG habituel et que le nouvel estimateur GREG. Nous fournissons les résultats de simulation sous un modèle, ainsi qu'en population finie réelle.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 11-522-X200600110432
    Description :

    L'utilisation de variables discrètes ayant une distribution statistique connue pour le masquage des données de variables discrètes est à l'étude depuis un certain temps. Le présent article fait état de quelques-uns de nos résultats de recherche sur le sujet. Les conséquences du prélèvement, dans des populations finies, d'échantillons avec et sans remise suscitent un intérêt tout particulier. Les estimations des moments de premier ordre et de second ordre qui permettent d'atténuer ou de corriger la variation supplémentaire causée par le masquage d'un type connu sont établies. L'incidence du masquage des données originales sur la structure de corrélation de variables discrètes faisant l'objet de mesures concomitantes est examinée, et la nécessité d'un examen plus poussé des résultats à des fins d'analyse des données multivariées est discutée.

    Date de diffusion : 2008-03-17

  • Articles et rapports : 12-001-X20060019262
    Description :

    Les populations humaines cachées, Internet et d'autres structures en réseau conceptualisées mathématiquement sous forme de graphes sont intrinsèquement difficiles à échantillonner par les moyens conventionnels et les plans d'étude les plus efficaces comportent habituellement des procédures de sélection de l'échantillon par suivi adaptatif des liens reliant un n'ode à un autre. Les données d'échantillon obtenues dans le cadre de telles études ne sont généralement pas représentatives au pied de la lettre de la population d'intérêt dans son ensemble. Cependant, un certain nombre de méthodes fondées sur le plan de sondage ou sur un modèle sont maintenant disponibles pour faire des inférences efficaces à partir d'échantillons de ce type. Les méthodes fondées sur le plan de sondage ont l'avantage de ne pas s'appuyer sur un modèle de population hypothétique, mais dépendent, en ce qui concerne leur validité, de la mise en oeuvre du plan de sondage dans des conditions contrôlées et connues, ce qui est parfois difficile, voire impossible, en pratique. Les méthodes fondées sur un modèle offrent plus de souplesse quant au plan de sondage, mais requièrent que la population soit modélisée au moyen de modèles de graphes stochastiques et que le plan de sondage soit ignorable ou de forme connue, afin qu'il puisse être inclus dans les équations de vraisemblance ou d'inférence bayésienne. Aussi bien pour les méthodes basées sur le plan de sondage que celles fondées sur un modèle, le point faible est souvent le manque de contrôle concernant l'obtention de l'échantillon initial, à partir duquel débute le dépistage des liens. Les plans de sondage décrits dans le présent article offrent une troisième méthode, dans laquelle les probabilités de sélection de l'échantillon deviennent pas à pas moins dépendantes de la sélection de l'échantillon initial. Un modèle de « marche aléatoire » markovienne idéalise au moyen d'un graphe, les tendances d'un plan d'échantillonnage naturel d'une séquence de sélections par dépistage de liens à suivre. Le présent article présente des plans de sondage à marche uniforme ou ciblée dans lesquels la marche aléatoire est ajustée à chaque pas afin de produire un plan de sondage ayant les probabilités stationnaires souhaitées. On obtient ainsi un échantillon qui, à d'importants égards, est représentatif au pied de la lettre de la population d'intérêt dans son ensemble, ou qui ne nécessite que de simples facteurs de pondération pour qu'il en soit ainsi.

    Date de diffusion : 2006-07-20

  • Articles et rapports : 12-002-X20060019253
    Description :

    Avant que des résultats analytiques ne soient diffusés par les Centres de données de recherche (CDR), les analystes de ces centres doivent procéder à une analyse (ou à une vérification) des risques de divulgation. Lorsqu'ils examinent tout produit analytique, ils appliquent les lignes directrices de Statistique Canada sur le contrôle de divulgation comme moyen de sauvegarde de la confidentialité pour les répondants des enquêtes. Dans le cas d'ensembles de données comme ceux de l'Enquête auprès des peuples autochtones (EAPA), de l'Enquête sur la diversité ethnique (EDE), de l'Enquête sur la participation et les limitations d'activités (EPLA) et de l'Enquête longitudinale auprès des immigrants du Canada (ELIC), Statistique Canada a élaboré des lignes directrices complémentaires portant sur l'arrondissement des résultats analytiques pour encore améliorer cette sauvegarde. Dans le présent article, nous exposerons la raison d'être de ce surcroît de procédures applicables à ces ensembles et préciserons ce que sont les lignes directrices en matière d'arrondis. Plus important encore, nous proposerons plusieurs façons d'aider les chercheurs à se conformer aux protocoles en question avec plus d'efficacité et d'efficience.

    Date de diffusion : 2006-07-18

  • Articles et rapports : 75F0002M2006005
    Description :

    L'Enquête sur la dynamique du travail et du revenu (EDTR) est une enquête longitudinale qui date de 1993. Elle se veut un moyen de mesurer les variations du bien-être économique des Canadiens ainsi que les facteurs touchant ces changements.

    Les enquêtes par sondage peuvent comporter des erreurs. Comme dans toutes ses enquêtes, Statistique Canada met un temps et un effort considérable à contrôler ces erreurs à chaque stade de l'Enquête sur la dynamique du travail et du revenu. Mais il y a quand même des erreurs. Statistique Canada a pour politique de fournir des mesures de la qualité des données pour aider ses utilisateurs à bien interpréter les données. Le présent rapport résume les mesures de qualité qui ont pour objet de décrire la qualité des données de l'EDTR. Parmis les mesures incluses dans le rapport nous retrouvons la composition de l'échantillon, le taux d'érosion, les erreurs d'échantillonnage, les erreurs de couverture, le taux de réponse, le taux de permission d'accès au dossier fiscal, le taux de couplage avec le dossier fiscal et le taux d'imputation.

    Date de diffusion : 2006-04-06

  • Articles et rapports : 11-522-X20040018740
    Description :

    L'immigration clandestine est difficile à échantillonner en Italie puisqu'il est habituellement impossible d'obtenir des bases de sondage complètes. L'échantillonnage de centres, est destiné aux enquêtes auprès de la population immigrante.

    Date de diffusion : 2005-10-27

  • Articles et rapports : 11-522-X20040018751
    Description :

    Ce document examine comment, par l'échantillonnage adapté, il est possible d'étendre les enquêtes nationales sur la santé de manière à pouvoir suivre et observer efficacement de nouvelles menaces pour la santé et repérer les gens exposés.

    Date de diffusion : 2005-10-27
Données (10)

Données (10) ((10 résultats))

  • Microdonnées à grande diffusion : 81M0011X
    Description :

    Cette enquête vise à déterminer dans quelle mesure les personnes ayant obtenu leur diplôme d'études postsecondaires ont réussi à se trouver un emploi par la suite, le lien entre le programme d'études du diplômé et son emploi subséquent, la satisfaction des diplômés à l'égard de leur emploi et de leurs perspectives de carrière, les taux de sous-emploi et de chômage, le type d'emploi obtenu par rapport aux possibilités de carrière et aux qualifications exigées, et l'incidence des études postsecondaires sur la réussite professionnelle. Cette information vise les responsables de l'élaboration de politiques, les chercheurs, les éducateurs, les employeurs et les jeunes adultes intéressés à l'éducation postsecondaire et à la transition de l'école au travail pour les diplômés des écoles de métiers et de la formation professionnelle, des collèges et des universités.

    Date de diffusion : 2015-01-12

  • Microdonnées à grande diffusion : 89M0017X
    Description :

    Il est maintenant possible de consulter le fichier de microdonnées à grande diffusion de l'Enquête canadienne sur le don, le bénévolat et la participation de 2010. Ce fichier comprend des données recueillies auprès de près de 15 000 répondants âgés de 15 ans et plus résidant dans un ménage privé de l'une des provinces. Le fichier de microdonnées à grande diffusion fournit des renseignements à l'échelon provincial sur la façon dont les Canadiens s'y prennent pour faire des dons d'argent et de biens à des organismes sans but lucratif et de bienfaisance ainsi que du bénévolat au sein de ces organismes et pour offrir de l'aide directe à autrui. Le fichier comprend également des données sociodémographiques ainsi que des données sur le revenu et sur la population active.

    Date de diffusion : 2012-05-04

  • Microdonnées à grande diffusion : 56M0002G
    Description :

    Ce guide est pour le fichier de microdonnées de l'Enquête sur l'utilisation de l'internet à la maison. L'Enquête sur l'utilisation de l'internet à la maison, menée par Statistique Canada pour le compte de Industrie Canada, permettra au Projet de remaniement des sciences et de la technologie à Statistique Canada de satisfaire aux exigences d'une entente conclue entre celui-ci et la Division de la politique des télécommunications à Industrie Canada. L'Enquête sur l'utilisation de l'internet à la maison est une enquête volontaire qui nous fournira des renseignements sur l'utilisation des ordinateurs à des fins de communication, sur l'accès à l'internet des foyers canadiens et sur l'usage qu'en font ceux-ci.

    L'Enquête vise d'abord à évaluer la demande de services de télécommunications des ménages canadiens. Pour ce faire, on calcule, entre autres, la fréquence et l'intensité d'usage de ce qu'on appelle « l'autoroute de l'information » en demandant aux ménages de détailler leur accès à l'internet à la maison, au travail et ailleurs.

    Les renseignements recueillis serviront à mettre à jour et enrichir les données d'enquêtes antérieures menées par Statistique Canada au sujet de l'autoroute de l'information.

    Date de diffusion : 2004-09-28

  • Microdonnées à grande diffusion : 82M0011X
    Description :

    L'objectif principal de l'Enquête sur le tabagisme chez les jeunes de 2002 (ETJ) est de fournir des renseignements courants sur les habitudes en matière de tabagisme des jeunes de la 5e à la 9e année (5e et 6e années du primaire et 1re, 2e et 3e années du secondaire au Québec) et d'évaluer les changements qui se sont produits depuis la dernière fois que cette enquête était menée soit en 1994. De plus, en 2002, on a recueilli des données de base sur la consommation d'alcool et de drogues chez les élèves de la 7e à la 9e année (de la 1re à la 3e année du secondaire au Québec). Les résultats de l'Enquête sur le tabagisme chez les jeunes servent à évaluer des programmes de la lutte au tabagisme et à la consommation de drogues ainsi qu'à élaborer de nouveaux programmes.

    Date de diffusion : 2004-07-14

  • Microdonnées à grande diffusion : 12M0014X
    Géographie : Province ou territoire
    Description :

    Ce rapport présente un bref aperçu de l'information recueillie dans le cycle 14 de l'Enquête sociale générale (ESG). Le cycle 14 est le premier cycle à avoir recueilli des renseignements détaillés sur l'accès aux technologies de l'information et des communications au Canada et leur utilisation. Les sujets abordés comprennent l'utilisation générale de la technologie et des ordinateurs, la technologie en milieu de travail, le développement des compétences en informatique, la fréquence de l'utilisation d'Internet et du courriel, ainsi que les non-utilisateurs et la sécurité et l'information sur Internet. La population cible de l'ESG se composait de toutes les personnes de 15 ans et plus vivant dans un ménage privé dans l'une des dix provinces.

    Date de diffusion : 2001-06-29

  • Microdonnées à grande diffusion : 82M0010X
    Description :

    L'Enquête nationale sur la santé de la population (ENSP) vise à recueillir de l'information sur la santé de la population canadienne. Le premier cycle de collecte de données a débuté en 1994. La composante des établissements de soins de santé vise les résidents à long terme (plus de six mois) d'établissements de soins comportant quatre lits ou plus à travers le Canada , à l'exclusion du Yukon et des Territoires du Nord-Ouest. Le document a pour but de faciliter la manipulation du fichier de microdonnées 1996-1997 qui comprend les résultats de l'enquête. Les principales variables comprennent : démographie, état de santé, conditions chroniques, limitation d'activités, socio-demographie, et autres.

    Date de diffusion : 2000-08-02

  • Microdonnées à grande diffusion : 75M0007X
    Description :

    L'Enquête sur l'absence du travail fournit aux ministères des renseignements importants sur le temps perdu au travail par les Canadiens pour des raisons de santé. Ces renseignements contribuent également à l'élaboration de programmes d'aide à l'intention des employés qui s'absentent du travail. Par exemple, le régime restreint d'assurance-salaire tire des renseignements essentiels des données sur l'absence du travail. Ce régime s'adresse aux employeurs qui offrent à leurs salariés une assurance contre les pertes de salaire attribuable à la maladie, etc. Ces employeurs bénéficient d'une réduction des contributions qu'ils versent à la Commission d'assurance-emploi. Les réponses obtenues permettront également d'aider à déterminer les taux de réduction applicables à ces employeurs. Bien que l'enquête sur l'absence du travail recueille des renseignements sur les absences pour cause de maladie, d'accident ou de grossesse, elle ne constitue pas une représentation exhaustive des personnes qui ont été absentes du travail pour ces raisons, car les concepts et les définitions ont été élaborés spécialement pour répondre aux besoins du client. Aux fins de cette enquête, l'absence est, par définition, de deux semaines au moins, et on ne demande aux répondants que de citer les trois raisons de leur absence la plus récente et de celle qui l'a précédée.

    Date de diffusion : 1999-06-29

  • Microdonnées à grande diffusion : 12M0010X
    Description :

    Le cycle 10 a permis de recueillir des données auprès de personnes âgées de 15 ans et plus et mettait l'accent sur la famille. Au nombre des divers sujets traités, on compte les antécédents matrimoniaux, les unions libres, les enfants biologiques et adoptés et les enfants d'unions antérieures, l'origine familiale, le départ des enfants et les intentions de fécondité.

    La population cible de l'ESG (Enquête sociale générale) se composait de toutes les personnes de 15 ans et plus vivant dans un ménage privé dans l'une des dix provinces.

    Date de diffusion : 1997-02-28

  • Microdonnées à grande diffusion : 82F0001X
    Description :

    On utilise la base de sondage de l'Enquête sur la population active afin de tirer un échantillon d'environ 22 000 ménages pour l'Enquête nationale sur la santé de la population (ENSP). L'échantillon est distribué entre quatre périodes trimestrielles de collecte. Dans chacun des ménages, certains renseignements sommaires sont réunis auprès de tous les membres du ménage puis un membre du ménage, âgé de 12 ans et plus, choisi au hasard répond en plus à une interview en profondeur.

    Le questionnaire porte sur l'état de santé, l'utilisation des services de santé, les déterminants de la santé et un éventail de facteurs démographiques et économiques. Par exemple, pour les renseignements recueillis sur l'état de santé, il y a un indice de l'état de santé ainsi que des données sur les affections chroniques, sur les restrictions d'activités et sur la perception qu'a le répondant de la santé. L'utilisation des services de santé est évaluée au moyen de visites aux prestateurs de soins de santé, traditionnels et non traditionnels, et de questions sur les médicaments et drogues. Parmi les déterminants de la santé, on retrouve l'usage du tabac, la consommation d'alcool, l'activité physique; en outre, on insistera plus particulièrement, pour la première enquête, sur certains facteurs psycho-sociaux pouvant avoir une incidence sur la santé, notamment le stress, l'estime de soi et le soutien social. Les renseignements démographiques et économiques comprennent l'âge, le sexe, la scolarité, l'origine ethnique, le revenu du ménage et la situation vis-à-vis de l'activité.

    Date de diffusion : 1995-11-21

  • Microdonnées à grande diffusion : 95M0008X
    Description :

    Les fichiers de microdonnées sont uniques parmi les produits du recensement car ils sont les seuls qui donnent aux utilisateurs accès aux données non regroupées. Les FMGD sont donc de puissants outils de recherche. Chaque fichier comprend une série de réponses anonymes sur un grand nombre de variables. L'utilisateur des FMGD peut regrouper et manipuler ces variables en fonction de ses besoins en données et en recherche. Des tableaux ne figurant pas dans les autres produits du recensement peuvent être créés ou les relations entre variables peuvent être analysées en effectuant divers tests statistiques. Les FMGD facilitent l'accès rapide à une vaste base de données sociales et économiques sur le Canada et ses habitants.

    Toutes les caractéristiques que comprennent le recensement sont incluses dans les fichiers de microdonnées. Toutefois, pour assurer l'anonymat des répondants, l'identificateur géographique a été limité aux provinces/territoires et aux grandes régions métropolitaines de recensement.

    Traditionnellement, les fichiers de microdonnées étaient diffusés sur bande magnétique, dont l'exploitation requiert un ordinateur principal. Pour la première fois, les FMGD de 1991 sont aussi disponibles sur disque compact-ROM pour être utilisés sur micro-ordinateur.

    Ce fichier renferme des données fondées sur un échantillon de 3% de la population recensée en 1991. Il offre des renseignements sur les caractéristiques démographiques, sociales et économiques de la population canadienne. Le fichier sur les ménages et le logement permet aux utilisateurs de revenir à l'unité de base du recensement, de façon à pouvoir grouper et manipuler les données en fonction de leurs propres besoins en matière de données et de recherche.

    Ce produit fournit deux outils pour aider les utilisateurs à accéder au fichier de microdonnées à grande diffusion du recensement de 1991 sur les ménages et le logement.

    Date de diffusion : 1995-03-31
Analyses (26)

Analyses (26) (0 à 10 de 26 résultats)

  • Articles et rapports : 11-522-X200600110424
    Description :

    L'enquête réalisée par la Chine dans le cadre du programme de lutte internationale contre le tabagisme (ITC pour International Tobacco Control) comprend un plan d'échantillonnage à plusieurs degrés avec probabilités inégales où les grappes du niveau supérieur sont sélectionnées par la méthode d'échantillonnage PPT systématique randomisé. Durant l'exécution de l'enquête, il faut résoudre le problème suivant : plusieurs grappes de niveau supérieur échantillonnées refusent de participer et doivent être remplacées par des unités de substitution sélectionnées parmi les unités non incluses dans l'échantillon initial, de nouveau par la méthode d'échantillonnage PPT systématique randomisé. Dans de telles conditions, les probabilités d'inclusion de premier ordre des unités finales sélectionnées sont très difficiles à calculer et la détermination des probabilités d'inclusion de deuxième ordre devient virtuellement impossible. Dans le présent article, nous élaborons une méthode fondée sur la simulation pour calculer les probabilités d'inclusion de premier et de deuxième ordre lorsque le calcul direct est prohibitif ou impossible. Nous démontrons l'efficacité de la méthode que nous proposons en nous appuyant sur des considérations théoriques et des exemples numériques. Nous incluons plusieurs fonctions et codes R/S PLUS pour la procédure proposée. La méthode peut être étendue à des situations de refus/substitution plus complexes susceptibles de survenir en pratique.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110612
    Description :

    Lehtonen et Veijanen (1999) ont proposé un nouvel estimateur par la régression généralisée (GREG) assisté par modèle d'une moyenne de petit domaine sous un modèle à deux niveaux. Ils ont montré que l'estimateur proposé donne de meilleurs résultats que l'estimateur GREG habituel en ce qui concerne le biais relatif absolu moyen et l'erreur relative absolue médiane moyenne. Nous calculons l'erreur quadratique moyenne (EQM) du nouvel estimateur GREG sous le modèle à deux niveaux et nous la comparons à celle de l'estimateur fondé sur le meilleur prédicteur linéaire sans biais (BLUP). Nous présentons aussi des résultats empiriques concernant l'efficacité relative des estimateurs. Nous montrons que le nouvel estimateur GREG a de meilleures propriétés que l'estimateur GREG habituel en ce qui concerne l'EQM moyenne et l'erreur relative absolue moyenne. Nous montrons aussi que, parce qu'il emprunte de l'information aux petits domaines apparentés, l'estimateur EBLUP donne des résultats nettement meilleurs que l'estimateur GREG habituel et que le nouvel estimateur GREG. Nous fournissons les résultats de simulation sous un modèle, ainsi qu'en population finie réelle.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 11-522-X200600110432
    Description :

    L'utilisation de variables discrètes ayant une distribution statistique connue pour le masquage des données de variables discrètes est à l'étude depuis un certain temps. Le présent article fait état de quelques-uns de nos résultats de recherche sur le sujet. Les conséquences du prélèvement, dans des populations finies, d'échantillons avec et sans remise suscitent un intérêt tout particulier. Les estimations des moments de premier ordre et de second ordre qui permettent d'atténuer ou de corriger la variation supplémentaire causée par le masquage d'un type connu sont établies. L'incidence du masquage des données originales sur la structure de corrélation de variables discrètes faisant l'objet de mesures concomitantes est examinée, et la nécessité d'un examen plus poussé des résultats à des fins d'analyse des données multivariées est discutée.

    Date de diffusion : 2008-03-17

  • Articles et rapports : 12-001-X20060019262
    Description :

    Les populations humaines cachées, Internet et d'autres structures en réseau conceptualisées mathématiquement sous forme de graphes sont intrinsèquement difficiles à échantillonner par les moyens conventionnels et les plans d'étude les plus efficaces comportent habituellement des procédures de sélection de l'échantillon par suivi adaptatif des liens reliant un n'ode à un autre. Les données d'échantillon obtenues dans le cadre de telles études ne sont généralement pas représentatives au pied de la lettre de la population d'intérêt dans son ensemble. Cependant, un certain nombre de méthodes fondées sur le plan de sondage ou sur un modèle sont maintenant disponibles pour faire des inférences efficaces à partir d'échantillons de ce type. Les méthodes fondées sur le plan de sondage ont l'avantage de ne pas s'appuyer sur un modèle de population hypothétique, mais dépendent, en ce qui concerne leur validité, de la mise en oeuvre du plan de sondage dans des conditions contrôlées et connues, ce qui est parfois difficile, voire impossible, en pratique. Les méthodes fondées sur un modèle offrent plus de souplesse quant au plan de sondage, mais requièrent que la population soit modélisée au moyen de modèles de graphes stochastiques et que le plan de sondage soit ignorable ou de forme connue, afin qu'il puisse être inclus dans les équations de vraisemblance ou d'inférence bayésienne. Aussi bien pour les méthodes basées sur le plan de sondage que celles fondées sur un modèle, le point faible est souvent le manque de contrôle concernant l'obtention de l'échantillon initial, à partir duquel débute le dépistage des liens. Les plans de sondage décrits dans le présent article offrent une troisième méthode, dans laquelle les probabilités de sélection de l'échantillon deviennent pas à pas moins dépendantes de la sélection de l'échantillon initial. Un modèle de « marche aléatoire » markovienne idéalise au moyen d'un graphe, les tendances d'un plan d'échantillonnage naturel d'une séquence de sélections par dépistage de liens à suivre. Le présent article présente des plans de sondage à marche uniforme ou ciblée dans lesquels la marche aléatoire est ajustée à chaque pas afin de produire un plan de sondage ayant les probabilités stationnaires souhaitées. On obtient ainsi un échantillon qui, à d'importants égards, est représentatif au pied de la lettre de la population d'intérêt dans son ensemble, ou qui ne nécessite que de simples facteurs de pondération pour qu'il en soit ainsi.

    Date de diffusion : 2006-07-20

  • Articles et rapports : 12-002-X20060019253
    Description :

    Avant que des résultats analytiques ne soient diffusés par les Centres de données de recherche (CDR), les analystes de ces centres doivent procéder à une analyse (ou à une vérification) des risques de divulgation. Lorsqu'ils examinent tout produit analytique, ils appliquent les lignes directrices de Statistique Canada sur le contrôle de divulgation comme moyen de sauvegarde de la confidentialité pour les répondants des enquêtes. Dans le cas d'ensembles de données comme ceux de l'Enquête auprès des peuples autochtones (EAPA), de l'Enquête sur la diversité ethnique (EDE), de l'Enquête sur la participation et les limitations d'activités (EPLA) et de l'Enquête longitudinale auprès des immigrants du Canada (ELIC), Statistique Canada a élaboré des lignes directrices complémentaires portant sur l'arrondissement des résultats analytiques pour encore améliorer cette sauvegarde. Dans le présent article, nous exposerons la raison d'être de ce surcroît de procédures applicables à ces ensembles et préciserons ce que sont les lignes directrices en matière d'arrondis. Plus important encore, nous proposerons plusieurs façons d'aider les chercheurs à se conformer aux protocoles en question avec plus d'efficacité et d'efficience.

    Date de diffusion : 2006-07-18

  • Articles et rapports : 75F0002M2006005
    Description :

    L'Enquête sur la dynamique du travail et du revenu (EDTR) est une enquête longitudinale qui date de 1993. Elle se veut un moyen de mesurer les variations du bien-être économique des Canadiens ainsi que les facteurs touchant ces changements.

    Les enquêtes par sondage peuvent comporter des erreurs. Comme dans toutes ses enquêtes, Statistique Canada met un temps et un effort considérable à contrôler ces erreurs à chaque stade de l'Enquête sur la dynamique du travail et du revenu. Mais il y a quand même des erreurs. Statistique Canada a pour politique de fournir des mesures de la qualité des données pour aider ses utilisateurs à bien interpréter les données. Le présent rapport résume les mesures de qualité qui ont pour objet de décrire la qualité des données de l'EDTR. Parmis les mesures incluses dans le rapport nous retrouvons la composition de l'échantillon, le taux d'érosion, les erreurs d'échantillonnage, les erreurs de couverture, le taux de réponse, le taux de permission d'accès au dossier fiscal, le taux de couplage avec le dossier fiscal et le taux d'imputation.

    Date de diffusion : 2006-04-06

  • Articles et rapports : 11-522-X20040018740
    Description :

    L'immigration clandestine est difficile à échantillonner en Italie puisqu'il est habituellement impossible d'obtenir des bases de sondage complètes. L'échantillonnage de centres, est destiné aux enquêtes auprès de la population immigrante.

    Date de diffusion : 2005-10-27

  • Articles et rapports : 11-522-X20040018751
    Description :

    Ce document examine comment, par l'échantillonnage adapté, il est possible d'étendre les enquêtes nationales sur la santé de manière à pouvoir suivre et observer efficacement de nouvelles menaces pour la santé et repérer les gens exposés.

    Date de diffusion : 2005-10-27

  • Articles et rapports : 12-001-X20050018084
    Description :

    Les instituts nationaux de statistique intègrent parfois des expériences dans les enquêtes par sondage courantes afin d'étudier les effets éventuels de diverses techniques d'enquête sur les estimations des paramètres d'une population finie. En vue de tester les hypothèses au sujet des différences entre les estimations par sondage obtenues on applique diverses variantes de l'enquête, nous élaborons une théorie fondée sur le plan de sondage pour analyser des plans en randomisation totale ou des plans en blocs randomisés intégrés dans des plans de sondage complexes généraux. Pour ces deux types de plans d'expérience, nous établissons une statistique de Wald fondée sur le plan de sondage pour l'estimateur d'Horvitz-Thompson et pour l'estimateur par la régression généralisée. Enfin, nous illustrons la théorie au moyen d'une étude en simulation.

    Date de diffusion : 2005-07-21

  • Articles et rapports : 12-001-X20050018087
    Description :

    Dans le domaine de la statistique officielle, le processus de vérification des données joue un rôle important dans la rapidité de production, l'exactitude des données et les coûts d'enquête. Les techniques adoptées pour déceler et éliminer les erreurs que contiennent les données doivent essentiellement tenir compte simultanément de tous ces aspects. L'une des erreurs systématiques que l'on observe fréquemment dans les enquêtes visant à recueillir des données numériques est celle de l'unité de mesure. Cette erreur a une forte incidence sur la rapidité de production, l'exactitude des données et le coût de la phase de vérification et d'imputation. Dans le présent article, nous proposons une formalisation probabiliste du problème basée sur des modèles de mélanges finis. Ce cadre nous permet de traiter le problème dans un contexte multivarié et fournit en outre plusieurs diagnostics utiles pour établir la priorité des cas qui doivent être examinés plus en profondeur par examen manuel. Le classement des unités par ordre de priorité est important si l'on veut accroître l'exactitude des données, tout en évitant de perdre du temps en faisant le suivi d'unités qui ne sont pas vraiment critiques.

    Date de diffusion : 2005-07-21
Références (1)

Références (1) ((1 résultat))

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19990014710
    Description :

    La plupart des bureaux de la statistique utilisent des techniques non probabilistes pour choisir l'échantillon de produits dont les prix permettent de calculer les indices des prix à la consommation. Aux Pays-Bas, comme dans beacoup d'autres pays, ce genre de sondage raisonné se rapproche en quelque sorte de la sélection par seuil d'inclusion, une bonne partie de la population (normalement les produits suscitant le moins de dépenses) étant délibérément exclue des observations. Bien sûr, cette méthode donne lieu à des chiffres biaisés pour l'indice des prix. On peut se demander si un échangillonnage probabiliste donnerait de meilleurs résultats quant à l'erreur quadratique moyenne. Les auteurs ont considéré l'échantillonnage aléatoire simple, l'échantillonnage stratifié et l'échantillonnage systématique proportionnel aux dépenses. Ils ont mené des simulations de Monte Carlo à l'aide de données de lecture optique pour le café, les couches de bébés et le paper hygiénique afin d'évaluer le rendement des quatre plans d'échantillonnage. Il est assez surprenant de constater que la sélection par seuil d'inclusion est une bonne stratégie d'échantillonnage des produits pour l'indice des prix à la consommation.

    Date de diffusion : 1999-10-08
Date de modification :