Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (221)

Tout (221) (0 à 10 de 221 résultats)

  • Enquêtes et programmes statistiques — Documentation : 71-543-G
    Description :

    Le Guide de l'Enquête sur la population active contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données, la qualité des données et les produits et services d'information. Il contient également une description géographique des régions infraprovinciales de même que le questionnaire de l'enquête.

    Date de diffusion : 2020-04-09

  • Microdonnées à grande diffusion : 81M0011X
    Description :

    Cette enquête vise à déterminer dans quelle mesure les personnes ayant obtenu leur diplôme d'études postsecondaires ont réussi à se trouver un emploi par la suite, le lien entre le programme d'études du diplômé et son emploi subséquent, la satisfaction des diplômés à l'égard de leur emploi et de leurs perspectives de carrière, les taux de sous-emploi et de chômage, le type d'emploi obtenu par rapport aux possibilités de carrière et aux qualifications exigées, et l'incidence des études postsecondaires sur la réussite professionnelle. Cette information vise les responsables de l'élaboration de politiques, les chercheurs, les éducateurs, les employeurs et les jeunes adultes intéressés à l'éducation postsecondaire et à la transition de l'école au travail pour les diplômés des écoles de métiers et de la formation professionnelle, des collèges et des universités.

    Date de diffusion : 2020-01-14

  • Enquêtes et programmes statistiques — Documentation : 12-539-X
    Description :

    Ce document réunit des lignes directrices et des listes de contrôles liées à de nombreuses questions dont on doit tenir compte dans la poursuite des objectifs de qualité que sous-tend l'exécution des activités statistiques. Le document s'attarde principalement à la façon d'assurer la qualité grâce à la conception ou à la restructuration efficace et adéquate d'un projet ou d'un programme statistique, des débuts jusqu'à l'évaluation, la diffusion et la documentation des données. Ces lignes directrices sont fondées sur les connaissances et l'expérience collective d'un grand nombre d'employés de Statistique Canada. On espère que les Lignes directrices concernant la qualité seront utiles au personnel chargé de la planification et de la conception des enquêtes et d'autres projets statistiques, ainsi qu'à ceux qui évaluent et analysent les résultats de ces projets.

    Date de diffusion : 2019-12-04

  • Articles et rapports : 12-001-X201800254952
    Description :

    Les enquêtes par panel sont souvent utilisées pour mesurer l’évolution de paramètres au cours du temps. Ces enquêtes peuvent souffrir de différentes formes de non-réponse totale, situation que l’on traite à l’heure actuelle en estimant les probabilités de réponse et en effectuant une nouvelle pondération des répondants. La présente étude porte sur l’estimation, ainsi que l’estimation de la variance en cas de non-réponse totale dans les enquêtes par panel. En étendant les travaux de Kim et Kim (2007) à plusieurs périodes, nous considérons un estimateur ajusté par un score de propension qui tient compte de la non-réponse initiale et de l’attrition, et proposons un estimateur de variance approprié. Nous étendons ensuite cet estimateur afin de couvrir la plupart des estimateurs utilisés dans les enquêtes, y compris les estimateurs calés, les estimateurs de paramètres complexes et les estimateurs longitudinaux. Les propriétés de l’estimateur de variance proposé et d’un estimateur de variance simplifié sont évaluées au moyen d’une étude en simulation. Une illustration de la méthode proposée sur des données provenant de l’enquête ELFE est également présentée.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254955
    Description :

    De nombreuses études menées dans les différentes compagnies d’électricité à travers le monde se basent sur l’analyse de courbes de consommation électrique moyennes pour différentes sous-populations, en particulier de nature géographique. Ces courbes moyennes sont estimées à partir d’échantillons de milliers de courbes mesurées à un pas de temps fin pendant de longues périodes. L’estimation sur de petites sous-populations, aussi appelées petits domaines, est un sujet très courant en théorie des sondages.

    Dans cet article, nous traitons cette problématique dans le cadre des données fonctionnelles et nous cherchons à estimer des courbes moyennes de petits domaines. Pour cela, nous proposons quatre méthodes : la régression linéaire fonctionnelle, la modélisation des scores d’une analyse en composantes principales par des modèles linéaires mixtes au niveau unité, ainsi que deux estimateurs non paramétriques basés l’un sur des arbres de régression, l’autre sur des forêts aléatoires, adaptés aux courbes. L’ensemble de ces méthodes ont été testées et comparées sur des données réelles de consommation électrique de ménages français.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254959
    Description :

    Cet article propose un critère de calcul du paramètre de compromis dans les répartitions dites « mixtes », c’est-à-dire qui mélangent deux répartitions classiques en théorie des sondages. Dans les enquêtes auprès des entreprises de l’Insee (Institut National de la Statistique et des Études Économiques), il est courant d’utiliser la moyenne arithmétique d’une répartition proportionnelle et d’une répartition de Neyman (correspondant à un paramètre de compromis de 0,5). Il est possible d’obtenir une valeur du paramètre de compromis aboutissant à de meilleures propriétés pour les estimateurs. Cette valeur appartient à une région qui est obtenue en résolvant un programme d’optimisation. Différentes méthodes de calcul de ce paramètre seront présentées. Une application sur des enquêtes auprès des entreprises est présentée, avec comparaison avec d’autres répartitions de compromis usuelles.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254960
    Description :

    En présence d’information auxiliaire, la technique de calage est souvent utilisée pour améliorer la précision des estimations produites. Cependant, les pondérations par calage peuvent ne pas convenir à toutes les variables d’intérêt de l’enquête, en particulier celles qui ne sont pas liées aux variables auxiliaires utilisées dans le calage. Dans ce papier, nous proposons un critère permettant d’évaluer pour toute variable d’intérêt l’effet de l’utilisation de la pondération par calage sur la précision de l’estimation de son total. Ce critère permet donc de décider des pondérations associées à chacune des variables d’intérêt d’une enquête et de déterminer ainsi celles pour lesquelles il convient d’utiliser la pondération par calage.

    Date de diffusion : 2018-12-20

  • Microdonnées à grande diffusion : 82M0020X
    Description : L’Enquête canadienne sur le tabac, l’alcool et les drogues (ECTAD) est une enquête bisannuelle de la population générale qui porte sur l’usage du tabac et la consommation d’alcool et de drogues chez les Canadiens de 15 ans et plus, en ciblant plus particulièrement les personnes de 15 à 24 ans. L’ECTAD est une enquête téléphonique menée par Statistique Canada pour le compte de Santé Canada.
    Date de diffusion : 2018-11-01

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population de 2016. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2018-09-11

  • Articles et rapports : 12-001-X201800154925
    Description :

    Le présent article traite de l’inférence statistique sous un modèle de superpopulation en population finie quand on utilise des échantillons obtenus par échantillonnage d’ensembles ordonnés (EEO). Les échantillons sont construits sans remise. Nous montrons que la moyenne d’échantillon sous EEO est sans biais par rapport au modèle et présente une plus petite erreur de prédiction quadratique moyenne (EPQM) que la moyenne sous échantillonnage aléatoire simple (EAS). Partant d’un estimateur sans biais de l’EPQM, nous construisons aussi un intervalle de confiance de prédiction pour la moyenne de population. Une étude en simulation à petite échelle montre que cet estimateur est aussi bon qu’un estimateur sur échantillon aléatoire simple (EAS) quand l’information pour le classement est de qualité médiocre. Par ailleurs, cet estimateur est plus efficace que l’estimateur EAS quand la qualité de l’information de classement est bonne et que le ratio des coûts de l’obtention d’une unité sous EEO et sous EAS n’est pas très élevé. L’étude en simulation indique aussi que les probabilités de couverture des intervalles de prédiction sont très proches des probabilités de couverture nominales. La procédure d’inférence proposée est appliquée à un ensemble de données réel.

    Date de diffusion : 2018-06-21
Données (21)

Données (21) (0 à 10 de 21 résultats)

  • Microdonnées à grande diffusion : 81M0011X
    Description :

    Cette enquête vise à déterminer dans quelle mesure les personnes ayant obtenu leur diplôme d'études postsecondaires ont réussi à se trouver un emploi par la suite, le lien entre le programme d'études du diplômé et son emploi subséquent, la satisfaction des diplômés à l'égard de leur emploi et de leurs perspectives de carrière, les taux de sous-emploi et de chômage, le type d'emploi obtenu par rapport aux possibilités de carrière et aux qualifications exigées, et l'incidence des études postsecondaires sur la réussite professionnelle. Cette information vise les responsables de l'élaboration de politiques, les chercheurs, les éducateurs, les employeurs et les jeunes adultes intéressés à l'éducation postsecondaire et à la transition de l'école au travail pour les diplômés des écoles de métiers et de la formation professionnelle, des collèges et des universités.

    Date de diffusion : 2020-01-14

  • Microdonnées à grande diffusion : 82M0020X
    Description : L’Enquête canadienne sur le tabac, l’alcool et les drogues (ECTAD) est une enquête bisannuelle de la population générale qui porte sur l’usage du tabac et la consommation d’alcool et de drogues chez les Canadiens de 15 ans et plus, en ciblant plus particulièrement les personnes de 15 à 24 ans. L’ECTAD est une enquête téléphonique menée par Statistique Canada pour le compte de Santé Canada.
    Date de diffusion : 2018-11-01

  • Microdonnées à grande diffusion : 56M0001X
    Description :

    Le Centre de ressources Stentor Inc. a demandé à Statistique Canada de mener une enquête qui permette de surveiller le taux de pénétration du service téléphonique au Canada. L'enquête sert à déterminer si les répondants ont ou non une ligne téléphonique dans leur résidence et, si non, les raisons pour lesquelles ils n'en ont pas. Les caractéristiques sur le revenu des ménages interviewés sont également consignées.

    La gestion de l'enquête est passée de Stentor à Bell Canada à l'automne 1998.

    La capacité supplémentaire de l'Enquête sur la population active (EPA) est utilisée pour mener cette enquête semestrielle. On contacte un échantillon d'environ 44 000 répondants dans cette enquête (cinq des six groupes de renouvellement). Les données de l'enquête sont recueillies à l'aide de la méthode d'interview assistée par ordinateur (IAO). La première collecte des données a eu lieu au cours de la semaine de l'EPA de novembre 1996.

    Ce fichier de microdonnées est mis à jour deux fois par année et contient les variables de l'enquête en plus de variables géographiques de l'EPA (province, région métropolitaine de recensement, répartition urbaine et rurale). Aucune autre variable de l'EPA n'est ajoutée au fichier.

    Date de diffusion : 2014-12-12

  • Microdonnées à grande diffusion : 89M0014X
    Description :

    L'Enquête internationale sur l'alphabétisation des adultes (EIAA) représente un effort de collaboration entre vingt gouvernements et trois organismes intergouvernementaux. Les pays de l'Australie, la communauté flamande de Belgique, du Canada, de l'Allemagne, de l'Irlande, des Pays-Bas, de la Nouvelle-Zélande, de la Pologne, de la Suède, de la Suisse (francophone, germanophone et italophone), du Royaume-Uni, des États-Unis, du Chili, de la République tchèque, du Danemark, de la Finlande, de la Hongrie, de l'Italie, de la Norvège et de la Slovénie ont participé à l'EIAA.

    L'élément canadien de l'EIAA avait plusieurs objectifs : a) fournir un profil à jour des capacités de lecture des adultes canadiens, en comparaison avec celles fournies par l'Enquête sur les capacités de lecture et d'écriture utilisées quotidiennement 1989 (ECLEQ); b) fournir un nombre suffisamment élevé de Franco-Ontariens, d'aînés, de bénéficiaires de l'assurance sociale ou de l'assurance-chômage et de jeunes décrocheurs pour établir un profil de leurs niveaux de capacités de lecture; c) faire la lumière sur les relations entre le rendement, le niveau de scolarité, la participation au marché du travail et l'emploi, parmi les gens qui ont atteint certains niveaux de capacités; et d) comparer les niveaux canadiens de capacités avec ceux d'autres pays.

    Date de diffusion : 2013-11-14

  • Microdonnées à grande diffusion : 89M0017X
    Description :

    Il est maintenant possible de consulter le fichier de microdonnées à grande diffusion de l'Enquête canadienne sur le don, le bénévolat et la participation de 2010. Ce fichier comprend des données recueillies auprès de près de 15 000 répondants âgés de 15 ans et plus résidant dans un ménage privé de l'une des provinces. Le fichier de microdonnées à grande diffusion fournit des renseignements à l'échelon provincial sur la façon dont les Canadiens s'y prennent pour faire des dons d'argent et de biens à des organismes sans but lucratif et de bienfaisance ainsi que du bénévolat au sein de ces organismes et pour offrir de l'aide directe à autrui. Le fichier comprend également des données sociodémographiques ainsi que des données sur le revenu et sur la population active.

    Date de diffusion : 2012-05-04

  • Tableau : 53-222-X
    Description :

    Cette publication présente une vue d'ensemble complète de l'industrie du camionnage au Canada, tant pour le transport pour compte d'autrui que pour compte privé ou propre compte. Les principaux renseignements comprennent des statistiques sur les recettes et les dépenses, le matériel utilisé, les investissements, les effectifs et les marchandises transportées du point d'origine au point de destination. La publication comprend une analyse des données, des études spéciales, un glossaire et une section sur la méthodologie et la qualité des données.

    Date de diffusion : 2007-06-22

  • Microdonnées à grande diffusion : 56M0002G
    Description :

    Ce guide est pour le fichier de microdonnées de l'Enquête sur l'utilisation de l'internet à la maison. L'Enquête sur l'utilisation de l'internet à la maison, menée par Statistique Canada pour le compte de Industrie Canada, permettra au Projet de remaniement des sciences et de la technologie à Statistique Canada de satisfaire aux exigences d'une entente conclue entre celui-ci et la Division de la politique des télécommunications à Industrie Canada. L'Enquête sur l'utilisation de l'internet à la maison est une enquête volontaire qui nous fournira des renseignements sur l'utilisation des ordinateurs à des fins de communication, sur l'accès à l'internet des foyers canadiens et sur l'usage qu'en font ceux-ci.

    L'Enquête vise d'abord à évaluer la demande de services de télécommunications des ménages canadiens. Pour ce faire, on calcule, entre autres, la fréquence et l'intensité d'usage de ce qu'on appelle « l'autoroute de l'information » en demandant aux ménages de détailler leur accès à l'internet à la maison, au travail et ailleurs.

    Les renseignements recueillis serviront à mettre à jour et enrichir les données d'enquêtes antérieures menées par Statistique Canada au sujet de l'autoroute de l'information.

    Date de diffusion : 2004-09-28

  • Microdonnées à grande diffusion : 82M0011X
    Description :

    L'objectif principal de l'Enquête sur le tabagisme chez les jeunes de 2002 (ETJ) est de fournir des renseignements courants sur les habitudes en matière de tabagisme des jeunes de la 5e à la 9e année (5e et 6e années du primaire et 1re, 2e et 3e années du secondaire au Québec) et d'évaluer les changements qui se sont produits depuis la dernière fois que cette enquête était menée soit en 1994. De plus, en 2002, on a recueilli des données de base sur la consommation d'alcool et de drogues chez les élèves de la 7e à la 9e année (de la 1re à la 3e année du secondaire au Québec). Les résultats de l'Enquête sur le tabagisme chez les jeunes servent à évaluer des programmes de la lutte au tabagisme et à la consommation de drogues ainsi qu'à élaborer de nouveaux programmes.

    Date de diffusion : 2004-07-14

  • Microdonnées à grande diffusion : 81M0013X
    Description :

    L'Enquête sur l'éducation et sur la formation des adultes (EEFA) est la source la plus exhaustive de données au Canada sur l'éducation et sur la formation officielle des adultes. Il s'agit de la seule enquête au Canada servant à recueillir des données détaillées sur les efforts de développement des compétences de l'ensemble de la population adulte au Canada. L'EEFA fournit des données concernant le sujet principal des activités de formation, le fournisseur de la formation, la durée et les sources de la formation, ainsi que les types de soutien disponibles. Par ailleurs, l'EEFA permet l'examen des profils socioéconomiques et démographiques des participants et des non-participants à la formation. Elle permet en outre de déterminer les obstacles auxquels font face les personnes qui voudraient suivre de la formation, mais ne peuvent le faire. L'EEFA a été administrée trois fois dans les années 90, soit en 1992, 1994 et 1998, à titre de supplément de l'Enquête sur la population active (EPA).

    Le contenu de l'EEFA a été révisé, afin de tenir compte des recommandations découlant des exercices de consultation. Par conséquent, plus de la moitié de l'enquête de 2003 est constituée de nouvelles questions.

    1) Mesurer l'incidence et l'intensité de la participation des adultes à la formation officielle liée à un emploi.2) Établir un profil du soutien des employeurs à la formation officielle liée à un emploi.3) Analyser les aspects des activités de formation liée à un emploi, par exemple : les fournisseurs de la formation, les dépenses, le soutien financier, les motivations, les résultats et les difficultés qui se sont présentées pendant la formation.4) Déterminer les obstacles qui empêchent des personnes de participer à la formation officielle liée à un emploi qu'elles voudraient ou devraient suivre.5) Déterminer les raisons qui expliquent le manque d'intérêt et de participation de la part des adultes à l'égard de la formation officielle liée à un emploi.6) Établir un lien entre les modèles actuels de participation des adultes et leur participation passée, ainsi que leurs plans pour l'avenir, en matière de formation liée à un emploi.7) Mesurer l'incidence et la fréquence de la participation des adultes à la formation non officielle liée à un emploi.8) Examiner les interactions entre la participation à la formation officielle et non officielle liée à un emploi.

    La population couverte par l'EEFA de 2003 est constituée des Canadiens âgés de 25 ans et plus. Il s'agit d'un changement par rapport à la population cible de l'EEFA de 1998, qui était constituée des Canadiens âgés de 17 ans et plus. Parmi les principales considérations qui ont motivé ce changement figurent les difficultés pratiques de l'application de la définition de l'éducation des adultes aux personnes âgées de 17 à 24 ans. Par définition, l'éducation des adultes exclut les étudiants qui en sont encore aux premières étapes ou étapes initiales de leur scolarité. Étant donné que les anciennes EEFA n'identifiaient pas précisément les étudiants qui en étaient toujours aux premières étapes ou étapes initiales de leur scolarité, les analyses à partir de ces données devaient dépendre d'une définition spéciale des apprenants adultes. Selon cette définition, les personnes âgées de 17 à 24 ans qui ne se trouvaient pas dans les situations suivantes étaient exclues de l'analyse : étudiants à temps plein subventionnés par un employeur et étudiants à temps plein âgés de 19 ans et plus suivant des programmes aux niveaux primaire ou secondaire.

    Date de diffusion : 2004-05-27

  • Tableau : 50-002-X20010015780
    Description :

    La section 1 décrit les résultats pour les petits transporteurs pour compte d'autrui dont les recettes d'exploitation se situent entre 30 000 $ et 1 million de dollars. La section 2 présente les données pour l'ensemble des chauffeurs contractants compris dans l'Enquête annuelle auprès des transporteurs routiers de marchandises (petits transporteurs pour compte d'autrui et chauffeurs contractants), y compris pour certaines entreprises dont les recettes d'exploitation ont dépassé 1 000 000 $. La section 3 présente une analyse générale de la méthodologie et de la qualité des données de l'Enquête annuelle auprès des transporteurs routiers de marchandises (petits transporteurs pour compte d'autrui et chauffeurs contractants).

    Date de diffusion : 2001-06-29
Analyses (162)

Analyses (162) (0 à 10 de 162 résultats)

  • Articles et rapports : 12-001-X201800254952
    Description :

    Les enquêtes par panel sont souvent utilisées pour mesurer l’évolution de paramètres au cours du temps. Ces enquêtes peuvent souffrir de différentes formes de non-réponse totale, situation que l’on traite à l’heure actuelle en estimant les probabilités de réponse et en effectuant une nouvelle pondération des répondants. La présente étude porte sur l’estimation, ainsi que l’estimation de la variance en cas de non-réponse totale dans les enquêtes par panel. En étendant les travaux de Kim et Kim (2007) à plusieurs périodes, nous considérons un estimateur ajusté par un score de propension qui tient compte de la non-réponse initiale et de l’attrition, et proposons un estimateur de variance approprié. Nous étendons ensuite cet estimateur afin de couvrir la plupart des estimateurs utilisés dans les enquêtes, y compris les estimateurs calés, les estimateurs de paramètres complexes et les estimateurs longitudinaux. Les propriétés de l’estimateur de variance proposé et d’un estimateur de variance simplifié sont évaluées au moyen d’une étude en simulation. Une illustration de la méthode proposée sur des données provenant de l’enquête ELFE est également présentée.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254955
    Description :

    De nombreuses études menées dans les différentes compagnies d’électricité à travers le monde se basent sur l’analyse de courbes de consommation électrique moyennes pour différentes sous-populations, en particulier de nature géographique. Ces courbes moyennes sont estimées à partir d’échantillons de milliers de courbes mesurées à un pas de temps fin pendant de longues périodes. L’estimation sur de petites sous-populations, aussi appelées petits domaines, est un sujet très courant en théorie des sondages.

    Dans cet article, nous traitons cette problématique dans le cadre des données fonctionnelles et nous cherchons à estimer des courbes moyennes de petits domaines. Pour cela, nous proposons quatre méthodes : la régression linéaire fonctionnelle, la modélisation des scores d’une analyse en composantes principales par des modèles linéaires mixtes au niveau unité, ainsi que deux estimateurs non paramétriques basés l’un sur des arbres de régression, l’autre sur des forêts aléatoires, adaptés aux courbes. L’ensemble de ces méthodes ont été testées et comparées sur des données réelles de consommation électrique de ménages français.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254959
    Description :

    Cet article propose un critère de calcul du paramètre de compromis dans les répartitions dites « mixtes », c’est-à-dire qui mélangent deux répartitions classiques en théorie des sondages. Dans les enquêtes auprès des entreprises de l’Insee (Institut National de la Statistique et des Études Économiques), il est courant d’utiliser la moyenne arithmétique d’une répartition proportionnelle et d’une répartition de Neyman (correspondant à un paramètre de compromis de 0,5). Il est possible d’obtenir une valeur du paramètre de compromis aboutissant à de meilleures propriétés pour les estimateurs. Cette valeur appartient à une région qui est obtenue en résolvant un programme d’optimisation. Différentes méthodes de calcul de ce paramètre seront présentées. Une application sur des enquêtes auprès des entreprises est présentée, avec comparaison avec d’autres répartitions de compromis usuelles.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800254960
    Description :

    En présence d’information auxiliaire, la technique de calage est souvent utilisée pour améliorer la précision des estimations produites. Cependant, les pondérations par calage peuvent ne pas convenir à toutes les variables d’intérêt de l’enquête, en particulier celles qui ne sont pas liées aux variables auxiliaires utilisées dans le calage. Dans ce papier, nous proposons un critère permettant d’évaluer pour toute variable d’intérêt l’effet de l’utilisation de la pondération par calage sur la précision de l’estimation de son total. Ce critère permet donc de décider des pondérations associées à chacune des variables d’intérêt d’une enquête et de déterminer ainsi celles pour lesquelles il convient d’utiliser la pondération par calage.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 12-001-X201800154925
    Description :

    Le présent article traite de l’inférence statistique sous un modèle de superpopulation en population finie quand on utilise des échantillons obtenus par échantillonnage d’ensembles ordonnés (EEO). Les échantillons sont construits sans remise. Nous montrons que la moyenne d’échantillon sous EEO est sans biais par rapport au modèle et présente une plus petite erreur de prédiction quadratique moyenne (EPQM) que la moyenne sous échantillonnage aléatoire simple (EAS). Partant d’un estimateur sans biais de l’EPQM, nous construisons aussi un intervalle de confiance de prédiction pour la moyenne de population. Une étude en simulation à petite échelle montre que cet estimateur est aussi bon qu’un estimateur sur échantillon aléatoire simple (EAS) quand l’information pour le classement est de qualité médiocre. Par ailleurs, cet estimateur est plus efficace que l’estimateur EAS quand la qualité de l’information de classement est bonne et que le ratio des coûts de l’obtention d’une unité sous EEO et sous EAS n’est pas très élevé. L’étude en simulation indique aussi que les probabilités de couverture des intervalles de prédiction sont très proches des probabilités de couverture nominales. La procédure d’inférence proposée est appliquée à un ensemble de données réel.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154926
    Description :

    Le présent article traite de l’estimation de la variance par linéarisation ou par bootstrap pour l’indice de Gini, et pour l’évolution de cet indice entre deux périodes. Dans le cas d’un seul échantillon, nous adoptons l’approche de linéarisation par la fonction d’influence proposée par Deville (1999), la méthode du bootstrap sans remise proposée par Gross (1980) pour l’échantillonnage aléatoire simple sans remise, et la méthode de tirage avec remise des unités primaires d’écrite dans Rao et Wu (1988) pour l’échantillonnage à plusieurs degrés. Pour obtenir un estimateur de variance dans le cas de deux échantillons, nous utilisons la technique de linéarisation au moyen de fonctions d’influence partielles (Goga, Deville et Ruiz-Gazen, 2009). Nous élaborons aussi une extension des procédures bootstrap étudiées à l’échantillonnage bidimensionnel. Les deux approches sont comparées sur des données simulées.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154929
    Description :

    Le U.S. Census Bureau étudie des stratégies de sous-échantillonnage des non-répondants en prévision de l’Economic Census de 2017. Les contraintes imposées au plan de sondage comprennent une borne inférieure obligatoire pour le taux de réponse totale, ainsi que des taux de réponse cibles par industrie. Le présent article expose la recherche sur les procédures de répartition de l’échantillon pour le sous-échantillonnage des non-répondants conditionnellement à ce que ce sous-échantillonnage soit systématique. Nous considérons deux approches, à savoir 1) l’échantillonnage avec probabilités égales et 2) la répartition optimisée avec contraintes sur les taux de réponse totale et la taille d’échantillon, avec pour objectif la sélection de plus grands échantillons dans les industries qui, au départ, affichent des taux de réponse plus faibles. Nous présentons une étude en simulation qui examine le biais relatif et l’erreur quadratique moyenne pour les répartitions proposées, en évaluant la sensibilité de chaque procédure à la taille du sous-échantillon, aux propensions à répondre et à la procédure d’estimation

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154963
    Description :

    Le cadre fondé sur l’échantillonnage probabiliste a joué un rôle dominant en recherche par sondage, parce qu’il fournit des outils mathématiques précis pour évaluer la variabilité d’échantillonnage. Toutefois, en raison de la hausse des coûts et de la baisse des taux de réponse, l’usage d’échantillons non probabilistes s’accroît, particulièrement dans le cas de populations générales, pour lesquelles le tirage d’échantillons à partir d’enquêtes en ligne devient de plus en plus économique et facile. Cependant, les échantillons non probabilistes posent un risque de biais de sélection dû à des différences d’accès et de degrés d’intérêt, ainsi qu’à d’autres facteurs. Le calage sur des totaux statistiques connus dans la population offre un moyen de réduire éventuellement l’effet du biais de sélection dans les échantillons non probabilistes. Ici, nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif peut donner un estimateur convergent d’un total de population à condition qu’un sous-ensemble des variables explicatives réelles soit inclus dans le modèle de prédiction, permettant ainsi qu’un grand nombre de covariables possibles soit incluses sans risque de surajustement. Nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif produit une meilleure estimation, pour ce qui est de l’erreur quadratique moyenne, que les méthodes concurrentes classiques, tels les estimateurs par la régression généralisée (GREG), quand un grand nombre de covariables sont nécessaires pour déterminer le modèle réel, sans vraiment qu’il y ait perte d’efficacité par rapport à la méthode GREG quand de plus petits modèles suffisent. Nous obtenons aussi des formules analytiques pour les estimateurs de variance des totaux de population, et comparons le comportement de ces estimateurs aux estimateurs bootstrap. Nous concluons par un exemple réel en utilisant des données provenant de la National Health Interview Survey.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201600114540
    Description :

    Les auteurs comparent les estimateurs EBLUP et pseudo EBLUP pour l’estimation sur petits domaines en vertu d’un modèle de régression à erreur emboîtée, ainsi que trois autres estimateurs fondés sur un modèle au niveau du domaine à l’aide du modèle de Fay Herriot. Ils réalisent une étude par simulations fondée sur un plan de sondage pour comparer les estimateurs fondés sur un modèle pour des modèles au niveau de l’unité et au niveau du domaine sous un échantillonnage informatif et non informatif. Ils s’intéressent particulièrement aux taux de couverture des intervalles de confiance des estimateurs au niveau de l’unité et au niveau du domaine. Les auteurs comparent aussi les estimateurs sous un modèle dont la spécification est inexacte. Les résultats de la simulation montrent que les estimateurs au niveau de l’unité sont plus efficaces que les estimateurs au niveau du domaine. L’estimateur pseudo EBLUP donne les meilleurs résultats à la fois au niveau de l’unité et au niveau du domaine.

    Date de diffusion : 2016-06-22

  • Articles et rapports : 12-001-X201600114541
    Description :

    Le présent travail a pour objet de comparer des estimateurs non paramétriques pour des fonctions de répartition de populations finies fondés sur deux types de valeurs prédites, à savoir celles données par l’estimateur bien connu de Kuo et une version modifiée de ces dernières, qui intègre une estimation non paramétrique de la fonction de régression à la moyenne. Pour chaque type de valeurs prédites, nous considérons l’estimateur fondé sur un modèle correspondant et, après incorporation des poids de sondage, l’estimateur par la différence généralisée. Nous montrons sous des conditions assez générales que le terme principal de l’erreur quadratique moyenne sous le modèle n’est pas affecté par la modification des valeurs prédites, même si cette modification réduit la vitesse de convergence pour le biais sous le modèle. Les termes d’ordre deux des erreurs quadratiques moyennes sous le modèle sont difficiles à obtenir et ne seront pas calculés dans le présent article. La question est de savoir si les valeurs prédites modifiées offrent un certain avantage du point de vue de l’approche fondée sur un modèle. Nous examinons aussi les propriétés des estimateurs sous le plan de sondage et proposons pour l’estimateur par la différence généralisée un estimateur de variance fondé sur les valeurs prédites modifiées. Enfin, nous effectuons une étude en simulation. Les résultats des simulations laissent entendre que les valeurs prédites modifiées entraînent

    Date de diffusion : 2016-06-22
Références (37)

Références (37) (0 à 10 de 37 résultats)

  • Enquêtes et programmes statistiques — Documentation : 71-543-G
    Description :

    Le Guide de l'Enquête sur la population active contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données, la qualité des données et les produits et services d'information. Il contient également une description géographique des régions infraprovinciales de même que le questionnaire de l'enquête.

    Date de diffusion : 2020-04-09

  • Enquêtes et programmes statistiques — Documentation : 12-539-X
    Description :

    Ce document réunit des lignes directrices et des listes de contrôles liées à de nombreuses questions dont on doit tenir compte dans la poursuite des objectifs de qualité que sous-tend l'exécution des activités statistiques. Le document s'attarde principalement à la façon d'assurer la qualité grâce à la conception ou à la restructuration efficace et adéquate d'un projet ou d'un programme statistique, des débuts jusqu'à l'évaluation, la diffusion et la documentation des données. Ces lignes directrices sont fondées sur les connaissances et l'expérience collective d'un grand nombre d'employés de Statistique Canada. On espère que les Lignes directrices concernant la qualité seront utiles au personnel chargé de la planification et de la conception des enquêtes et d'autres projets statistiques, ainsi qu'à ceux qui évaluent et analysent les résultats de ces projets.

    Date de diffusion : 2019-12-04

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population de 2016. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2018-09-11

  • Enquêtes et programmes statistiques — Documentation : 71-526-X
    Description :

    L'Enquête sur la population active du Canada (EPA) est la source officielle d'estimations mensuelles de l'emploi total et du chômage. Suite au recensement de 2011, l'EPA a connu un remaniement pour tenir compte de l’évolution des caractéristiques de la population et du marché du travail, pour s’adapter aux besoins actuels et prévus des utilisateurs de données et pour mettre à jour l’information géographique requise pour mener l’enquête. Le programme de remaniement qui a suivi le recensement de 2011 a mené à l'introduction d'un nouvel échantillon au début de l'année 2015. Cette publication est un ouvrage de référence sur les aspects méthodologiques de l'EPA, y compris la stratification, l'échantillonnage, la collecte, le traitement, la pondération, l'estimation, l'estimation de la variance et la qualité des données.

    Date de diffusion : 2017-12-21

  • Enquêtes et programmes statistiques — Documentation : 75-005-M2016001
    Description :

    En plus de 70 ans, la méthodologie et le questionnaire ainsi que les techniques de collecte et de traitement de l'Enquête sur la population active (EPA) au Canada ont connu des changements importants. Le présent document résume ces changements par ordre chronologique et renvoie à des sources d'informations plus détaillées. Parmi les changements les plus importants figurent deux remaniements du questionnaire, qui se sont produits à environ 20 ans d'intervalle, soit en 1976 et en 1997.

    Date de diffusion : 2017-01-06

  • Enquêtes et programmes statistiques — Documentation : 99-002-X2011001
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage et de pondération utilisées pour l’Enquête nationale auprès des ménages de 2011. Il fournit les justifications opérationnelles et théoriques et présente les résultats des études d'évaluation de ces méthodes.

    Date de diffusion : 2015-01-28

  • Enquêtes et programmes statistiques — Documentation : 12-001-X201300211887
    Description :

    Les modèles multiniveaux sont d'usage très répandu pour analyser les données d'enquête en faisant concorder la hiérarchie du plan de sondage avec la hiérarchie du modèle. Nous proposons une approche unifiée, basée sur une log-vraisemblance composite pondérée par les poids de sondage pour des modèles à deux niveaux, qui mène à des estimateurs des paramètres du modèle convergents sous le plan et sous le modèle, même si les tailles d'échantillon dans les grappes sont petites, à condition que le nombre de grappes échantillonnées soit grand. Cette méthode permet de traiter les modèles à deux niveaux linéaires ainsi que linéaires généralisés et requiert les probabilités d'inclusion de niveau 2 et de niveau 1, ainsi que les probabilités d'inclusion conjointe de niveau 1, où le niveau 2 représente une grappe et le niveau 1, un élément dans une grappe. Nous présentons aussi les résultats d'une étude en simulation qui donnent la preuve que la méthode proposée est supérieure aux méthodes existantes sous échantillonnage informatif.

    Date de diffusion : 2014-01-15

  • Enquêtes et programmes statistiques — Documentation : 12-001-X201300211888
    Description :

    Lorsque les variables étudiées sont fonctionnelles et que les capacités de stockage sont limitées ou que les coûts de transmission sont élevés, les sondages, qui permettent de sélectionner une partie des observations de la population, sont des alternatives intéressantes aux techniques de compression du signal. Notre étude est motivée, dans ce contexte fonctionnel, par l'estimation de la courbe de charge électrique moyenne sur une période d'une semaine. Nous comparons différentes stratégies d'estimation permettant de prendre en compte une information auxiliaire telle que la consommation moyenne de la période précédente. Une première stratégie consiste à utiliser un plan de sondage aléatoire simple sans remise, puis de prendre en compte l'information auxiliaire dans l'estimateur en introduisant un modèle linéaire fonctionnel. La seconde approche consiste à incorporer l'information auxiliaire dans les plans de sondage en considérant des plans à probabilités inégales tels que les plans stratifiés et les plans pi. Nous considérons ensuite la question de la construction de bandes de confiance pour ces estimateurs de la moyenne. Lorsqu'on dispose d'estimateurs performants de leur fonction de covariance et si l'estimateur de la moyenne satisfait un théorème de la limite centrale fonctionnel, il est possible d'utiliser une technique rapide de construction de bandes de confiance qui repose sur la simulation de processus Gaussiens. Cette approche est comparée avec des techniques de bootstrap qui ont été adaptées afin de tenir compte du caractère fonctionnel des données.

    Date de diffusion : 2014-01-15

  • Enquêtes et programmes statistiques — Documentation : 12-001-X201200111687
    Description :

    Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des sous­échantillons aléatoires des enregistrements originaux. Le sous­échantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le sous­échantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des sous­échantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des sous­échantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples sous­échantillons synthétiques.

    Date de diffusion : 2012-06-27

  • Enquêtes et programmes statistiques — Documentation : 12-001-X201100211606
    Description :

    Cet article introduit une compilation spéciale du U.S. Census Bureau en présentant quatre articles du présent numéro : trois articles des auteurs Tillé, Lohr et Thompson de même qu'un article de discussion de l'auteur Opsomer.

    Date de diffusion : 2011-12-21
Date de modification :