Méthodes statistiques

Aide à l'ordre

Résultats

Tout (1 984)

Tout (1 984) (0 à 10 de 1 984 résultats)

  • Articles et rapports : 12-001-X201800154925
    Description :

    Le présent article traite de l’inférence statistique sous un modèle de superpopulation en population finie quand on utilise des échantillons obtenus par échantillonnage d’ensembles ordonnés (EEO). Les échantillons sont construits sans remise. Nous montrons que la moyenne d’échantillon sous EEO est sans biais par rapport au modèle et présente une plus petite erreur de prédiction quadratique moyenne (EPQM) que la moyenne sous échantillonnage aléatoire simple (EAS). Partant d’un estimateur sans biais de l’EPQM, nous construisons aussi un intervalle de confiance de prédiction pour la moyenne de population. Une étude en simulation à petite échelle montre que cet estimateur est aussi bon qu’un estimateur sur échantillon aléatoire simple (EAS) quand l’information pour le classement est de qualité médiocre. Par ailleurs, cet estimateur est plus efficace que l’estimateur EAS quand la qualité de l’information de classement est bonne et que le ratio des coûts de l’obtention d’une unité sous EEO et sous EAS n’est pas très élevé. L’étude en simulation indique aussi que les probabilités de couverture des intervalles de prédiction sont très proches des probabilités de couverture nominales. La procédure d’inférence proposée est appliquée à un ensemble de données réel.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154926
    Description :

    Le présent article traite de l’estimation de la variance par linéarisation ou par bootstrap pour l’indice de Gini, et pour l’évolution de cet indice entre deux périodes. Dans le cas d’un seul échantillon, nous adoptons l’approche de linéarisation par la fonction d’influence proposée par Deville (1999), la méthode du bootstrap sans remise proposée par Gross (1980) pour l’échantillonnage aléatoire simple sans remise, et la méthode de tirage avec remise des unités primaires d’écrite dans Rao et Wu (1988) pour l’échantillonnage à plusieurs degrés. Pour obtenir un estimateur de variance dans le cas de deux échantillons, nous utilisons la technique de linéarisation au moyen de fonctions d’influence partielles (Goga, Deville et Ruiz-Gazen, 2009). Nous élaborons aussi une extension des procédures bootstrap étudiées à l’échantillonnage bidimensionnel. Les deux approches sont comparées sur des données simulées.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154927
    Description :

    L’étalonnage des séries mensuelles et trimestrielles à des données annuelles est une pratique courante adoptée par de nombreux instituts nationaux de statistique. Le problème de l’étalonnage se pose quand des données temporelles pour une même variable cible sont mesurées à différentes fréquences et qu’il est nécessaire d’éliminer les différences entre les sommes des valeurs infra-annuelles et les valeurs annuelles de référence. Plusieurs méthodes d’étalonnage sont décrites dans la littérature. La procédure d’étalonnage avec préservation des taux de croissance (PTC) est souvent considérée comme étant la meilleure. Il est généralement soutenu qu’elle a pour fondement un principe idéal de préservation du mouvement. Toutefois, nous montrons que l’étalonnage PTC présente des inconvénients appréciables qui importent pour les applications pratiques et qui ne sont pas décrits dans la littérature. Nous considérons d’autres modèles d’étalonnage qui ne souffrent pas de certains des effets indésirables de la PTC.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154928
    Description :

    Un processus à deux phases a été utilisé par la Substance Abuse and Mental Health Services Administration pour estimer la proportion d’Américains adultes atteints d’une maladie mentale grave (MMG). La première phase correspondait à la National Survey on Drug Use and Health (NSDUH) réalisée annuellement, tandis que la seconde phase consistait en un sous-échantillon aléatoire d’adultes ayant répondu à la NSDUH. Les personnes qui ont répondu à la deuxième phase d’échantillonnage ont été soumises à une évaluation clinique visant à déceler les maladies mentales graves. Un modèle de prédiction logistique a été ajusté à ce sous-échantillon en prenant la situation de MMG (oui ou non) déterminée au moyen de l’instrument de deuxième phase comme variable dépendante, et les variables connexes recueillies dans la NSDUH auprès de tous les adultes comme variables explicatives du modèle. Des estimations de la prévalence de la MMG chez l’ensemble des adultes et au sein de sous-populations d’adultes ont ensuite été calculées en attribuant à chaque participant à la NSDUH une situation de MMG établie en comparant sa probabilité estimée d’avoir une MMG avec un seuil diagnostique choisi sur la distribution des probabilités prédites. Nous étudions d’autres options que cet estimateur par seuil diagnostique classique, dont l’estimateur par probabilité. Ce dernier attribue une probabilité estimée d’avoir une MMG à chaque participant à la NSDUH. La prévalence estimée de la MMG est la moyenne pondérée de ces probabilités estimées. Au moyen des données de la NSDUH et de son sous-échantillon, nous montrons que, même si l’estimateur par probabilité donne une plus petite erreur quadratique moyenne quand on estime la prévalence de la MMG parmi l’ensemble des adultes, il a une plus grande tendance que l’estimateur par seuil diagnostique classique à présenter un biais au niveau de la sous-population.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154929
    Description :

    Le U.S. Census Bureau étudie des stratégies de sous-échantillonnage des non-répondants en prévision de l’Economic Census de 2017. Les contraintes imposées au plan de sondage comprennent une borne inférieure obligatoire pour le taux de réponse totale, ainsi que des taux de réponse cibles par industrie. Le présent article expose la recherche sur les procédures de répartition de l’échantillon pour le sous-échantillonnage des non-répondants conditionnellement à ce que ce sous-échantillonnage soit systématique. Nous considérons deux approches, à savoir 1) l’échantillonnage avec probabilités égales et 2) la répartition optimisée avec contraintes sur les taux de réponse totale et la taille d’échantillon, avec pour objectif la sélection de plus grands échantillons dans les industries qui, au départ, affichent des taux de réponse plus faibles. Nous présentons une étude en simulation qui examine le biais relatif et l’erreur quadratique moyenne pour les répartitions proposées, en évaluant la sensibilité de chaque procédure à la taille du sous-échantillon, aux propensions à répondre et à la procédure d’estimation

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154959
    Description :

    Les modèles pour petits domaines conçus pour traiter les données au niveau du domaine reposent habituellement sur l’hypothèse de normalité des effets aléatoires. Cette hypothèse ne tient pas toujours. L’article présente un nouveau modèle pour petits domaines dont les effets aléatoires suivent une loi t. En outre, la modélisation conjointe des moyennes et des variances de petit domaine est examinée. Il est montré que cette approche donne de meilleurs résultats que les autres méthodes.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154963
    Description :

    Le cadre fondé sur l’échantillonnage probabiliste a joué un rôle dominant en recherche par sondage, parce qu’il fournit des outils mathématiques précis pour évaluer la variabilité d’échantillonnage. Toutefois, en raison de la hausse des coûts et de la baisse des taux de réponse, l’usage d’échantillons non probabilistes s’accroît, particulièrement dans le cas de populations générales, pour lesquelles le tirage d’échantillons à partir d’enquêtes en ligne devient de plus en plus économique et facile. Cependant, les échantillons non probabilistes posent un risque de biais de sélection dû à des différences d’accès et de degrés d’intérêt, ainsi qu’à d’autres facteurs. Le calage sur des totaux statistiques connus dans la population offre un moyen de réduire éventuellement l’effet du biais de sélection dans les échantillons non probabilistes. Ici, nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif peut donner un estimateur convergent d’un total de population à condition qu’un sous-ensemble des variables explicatives réelles soit inclus dans le modèle de prédiction, permettant ainsi qu’un grand nombre de covariables possibles soit incluses sans risque de surajustement. Nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif produit une meilleure estimation, pour ce qui est de l’erreur quadratique moyenne, que les méthodes concurrentes classiques, tels les estimateurs par la régression généralisée (GREG), quand un grand nombre de covariables sont nécessaires pour déterminer le modèle réel, sans vraiment qu’il y ait perte d’efficacité par rapport à la méthode GREG quand de plus petits modèles suffisent. Nous obtenons aussi des formules analytiques pour les estimateurs de variance des totaux de population, et comparons le comportement de ces estimateurs aux estimateurs bootstrap. Nous concluons par un exemple réel en utilisant des données provenant de la National Health Interview Survey.

    Date de diffusion : 2018-06-21

  • Revues et périodiques : 12-001-X
    Géographie : Canada
    Description :

    La revue publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d'ordre pratique, l'utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l'évaluation des enquêtes, la recherche sur les méthodes d'enquêtes, l'analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l'intégration des données statistiques, les méthodes d'estimation et d'analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l'élaboration et à l'évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles.

    Date de diffusion : 2018-06-21

  • Avis et consultations : 13-605-X
    Description :

    Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.

    Date de diffusion : 2018-04-26

  • Articles et rapports : 75F0002M2018001
    Description :

    Cette étude passe en revue les changements apportés en 2018 à la méthodologie utilisée pour calculer la mesure de faible revenu de la famille de recensement, en faisant appel au Fichier des familles (FFT1; données des déclarants). Ces changements font en sorte que la méthodologie concorde mieux avec d’autres sources de données de Statistique Canada, comme le Recensement de la population et l’Enquête canadienne sur le revenu. Afin de tenir compte des changements apportés à la méthodologie, de nouveaux tableaux standard du FFT1 fournissant des données sur la mesure de faible revenu de la famille de recensement (revenu après impôt) à partir de 2004 ont été introduits.

    Date de diffusion : 2018-04-05
Données (28)

Données (28) (0 à 10 de 28 résultats)

  • Microdonnées à grande diffusion : 89F0002X
    Description :

    La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.

    Date de diffusion : 2018-01-08

  • Visualisation des données : 11-627-M2016005
    Description :

    Cette infographie présente une nouvelle application interactive de visualisation de données qui démontre l’interconnectivité qui existe entre diverses régions du Canada en raison de leurs liens commerciaux. Les utilisateurs peuvent examiner les liens commerciaux entre les régions pour la période de 2004 à 2012 au moyen d’un diagramme à cordes interactif. Ils peuvent également utiliser des cartes interactives pour obtenir un portrait des tendances géographiques dans les échanges commerciaux.

    Date de diffusion : 2016-09-22

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 13-220-X
    Description :

    Les Indicateurs nationaux du tourisme ont été parrainés par la Commission canadienne du tourisme, et visent à produire des mises à jour annuelles du Compte satellite du tourisme. Dans l'édition de 1997, ces indicateurs sont ajustés aux nouvelles données repères de 1992 et aux données revisées de 1988. Les indicateurs permettent d'actualiser l'évaluation des composantes du tourisme au Canada que sont l'offre, la demande et l'emploi. Les tableaux annuels sont estimés à l'aide des Comptes nationaux des revenus et dépenses (CRD) et de plusieurs enquêtes portant sur les branches d'activité et les voyages. Ils sont disponibles approximativement quatre semaines après la publication des CRD annuels. Des tableaux montrant les niveaux et les variations en pourcentage des estimations désaisonnalisées aux prix courants et en prix constants sont inclus. De plus, une section analytique avec des graphiques présente les séries chronologiques des premières différences, variations en pourcentage et facteurs saisonniers pour plusieurs indicateurs. La publication, qui présente les données historiques à partir de 1987, sera disponible le jour de la parution. Des nouvelles données concernant les biens et services non touristiques produits par des industries non touristiques sont maintenant incluses dans les tableaux de la demande. De même, des nouvelles données sur l'emploi touristique direct généré par les industries non touristiques sont comprises dans les tableaux sur l'emploi.

    Date de diffusion : 2003-01-08

  • Tableau : 11-516-X198300111298
    Description :

    Les statistiques contenues dans cette section proviennent essentiellement de deux sources. Les séries A1-349 correspondent aux données des recensements ou ont été établies d'après les données des recensements, publiées par Statistique Canada ou ses prédécesseurs. Les séries A350-416 ont été extraites des documents officiels du ministère de l'Emploi et de l'Immigration ou de ses prédécesseurs.

    Date de diffusion : 1999-07-29

  • Tableau : 11-516-X198300111299
    Description :

    Les statistiques des tableaux de la section B sont divisées en deux parties. Les séries B1-81 renferment des données sur la statistique de l'état civil, et les séries B82-543, sur la santé. Les données sur le bien-être social, qui figuraient auparavant ici, sont présentées séparément à la Section C.

    Date de diffusion : 1999-07-29

  • Tableau : 11-516-X198300111300
    Description :

    Les statistiques de cette section sont réparties en six grandes divisions: programmes fédéraux de sécurité du revenu (séries C1-195); programmes fédéraux et provinciaux d'assurance revenu (séries C196-286); programmes fédéraux-provinciaux de sécurité du revenu à coûts partagés (séries C287-442); programmes fédéraux et provinciaux de service social (séries C443-507); programmes provinciaux-municipaux de sécurité du revenu (séries C508-559); dépenses publiques au titre de la sécurité sociale par grandes catégories de programmes (séries C560-599).

    Date de diffusion : 1999-07-29

  • Tableau : 11-516-X198300111301
    Description :

    Cette section présente des séries sur la population active, l'emploi, le chômage et les postes vacants, séries qui proviennent pour la plupart de publications de Statistique Canada, anciennement le Bureau fédéral de la statistique. Certaines des plus anciennes sont tirées directement des totalisations des recensements, tandis que d'autres découlent de ces totalisations mais ont été ajustées afin d'améliorer la cohérence dans le temps. Bon nombre des séries parmi les plus récentes sont tirées de l'enquête sur la population active. Figurent également des séries provenant des enquêtes de Statistique Canada sur l'emploi et sur les postes vacants, un ensemble d'indices de l'offre d'emplois élaboré par le ministère des Finances et repris par Statistique Canada, ainsi que quelques autres séries.

    Date de diffusion : 1999-07-29

  • Tableau : 11-516-X198300111302
    Description :

    Les statistiques présentées dans cette section se divisent en huit parties: revenu du travail (séries El-40); emploi gains et durée du travail (séries E41-135); coût de main-d'oeuvre à la charge de l'employeur (séries E136-151); assurance-chômage (séries E152-171); service de placement (séries E172-174); syndicats et grèves et lock-out (séries E175-197); indices des taux de salaire, taux de salaire et traitements (séries E198-375); réparation des accidents du travail (séries E376-389).

    Date de diffusion : 1999-07-29

  • Tableau : 11-516-X198300111303
    Description :

    Les données statistiques de cette section sont réparties en cinq sous-sections, qui portent sur les éléments suivants: comptes nationaux des revenus et des dépenses et agrégats connexes de 1926 à 1976 (séries F1-152), revenus produits dans chaque activité économique de 1919 à 1926 et formation brute de capital de 1901 à 1930 (séries F153-182), stock d'actifs corporels à partir de 1926 (séries F183-220) et valeurs comptables des stocks (séries F221-224), produit intérieur réel par activité économique (séries F225-240), et indices de la productivité du travail (séries F241-294).

    Date de diffusion : 1999-07-29
Analyses (1 550)

Analyses (1 550) (0 à 10 de 1 550 résultats)

  • Articles et rapports : 12-001-X201800154925
    Description :

    Le présent article traite de l’inférence statistique sous un modèle de superpopulation en population finie quand on utilise des échantillons obtenus par échantillonnage d’ensembles ordonnés (EEO). Les échantillons sont construits sans remise. Nous montrons que la moyenne d’échantillon sous EEO est sans biais par rapport au modèle et présente une plus petite erreur de prédiction quadratique moyenne (EPQM) que la moyenne sous échantillonnage aléatoire simple (EAS). Partant d’un estimateur sans biais de l’EPQM, nous construisons aussi un intervalle de confiance de prédiction pour la moyenne de population. Une étude en simulation à petite échelle montre que cet estimateur est aussi bon qu’un estimateur sur échantillon aléatoire simple (EAS) quand l’information pour le classement est de qualité médiocre. Par ailleurs, cet estimateur est plus efficace que l’estimateur EAS quand la qualité de l’information de classement est bonne et que le ratio des coûts de l’obtention d’une unité sous EEO et sous EAS n’est pas très élevé. L’étude en simulation indique aussi que les probabilités de couverture des intervalles de prédiction sont très proches des probabilités de couverture nominales. La procédure d’inférence proposée est appliquée à un ensemble de données réel.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154926
    Description :

    Le présent article traite de l’estimation de la variance par linéarisation ou par bootstrap pour l’indice de Gini, et pour l’évolution de cet indice entre deux périodes. Dans le cas d’un seul échantillon, nous adoptons l’approche de linéarisation par la fonction d’influence proposée par Deville (1999), la méthode du bootstrap sans remise proposée par Gross (1980) pour l’échantillonnage aléatoire simple sans remise, et la méthode de tirage avec remise des unités primaires d’écrite dans Rao et Wu (1988) pour l’échantillonnage à plusieurs degrés. Pour obtenir un estimateur de variance dans le cas de deux échantillons, nous utilisons la technique de linéarisation au moyen de fonctions d’influence partielles (Goga, Deville et Ruiz-Gazen, 2009). Nous élaborons aussi une extension des procédures bootstrap étudiées à l’échantillonnage bidimensionnel. Les deux approches sont comparées sur des données simulées.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154927
    Description :

    L’étalonnage des séries mensuelles et trimestrielles à des données annuelles est une pratique courante adoptée par de nombreux instituts nationaux de statistique. Le problème de l’étalonnage se pose quand des données temporelles pour une même variable cible sont mesurées à différentes fréquences et qu’il est nécessaire d’éliminer les différences entre les sommes des valeurs infra-annuelles et les valeurs annuelles de référence. Plusieurs méthodes d’étalonnage sont décrites dans la littérature. La procédure d’étalonnage avec préservation des taux de croissance (PTC) est souvent considérée comme étant la meilleure. Il est généralement soutenu qu’elle a pour fondement un principe idéal de préservation du mouvement. Toutefois, nous montrons que l’étalonnage PTC présente des inconvénients appréciables qui importent pour les applications pratiques et qui ne sont pas décrits dans la littérature. Nous considérons d’autres modèles d’étalonnage qui ne souffrent pas de certains des effets indésirables de la PTC.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154928
    Description :

    Un processus à deux phases a été utilisé par la Substance Abuse and Mental Health Services Administration pour estimer la proportion d’Américains adultes atteints d’une maladie mentale grave (MMG). La première phase correspondait à la National Survey on Drug Use and Health (NSDUH) réalisée annuellement, tandis que la seconde phase consistait en un sous-échantillon aléatoire d’adultes ayant répondu à la NSDUH. Les personnes qui ont répondu à la deuxième phase d’échantillonnage ont été soumises à une évaluation clinique visant à déceler les maladies mentales graves. Un modèle de prédiction logistique a été ajusté à ce sous-échantillon en prenant la situation de MMG (oui ou non) déterminée au moyen de l’instrument de deuxième phase comme variable dépendante, et les variables connexes recueillies dans la NSDUH auprès de tous les adultes comme variables explicatives du modèle. Des estimations de la prévalence de la MMG chez l’ensemble des adultes et au sein de sous-populations d’adultes ont ensuite été calculées en attribuant à chaque participant à la NSDUH une situation de MMG établie en comparant sa probabilité estimée d’avoir une MMG avec un seuil diagnostique choisi sur la distribution des probabilités prédites. Nous étudions d’autres options que cet estimateur par seuil diagnostique classique, dont l’estimateur par probabilité. Ce dernier attribue une probabilité estimée d’avoir une MMG à chaque participant à la NSDUH. La prévalence estimée de la MMG est la moyenne pondérée de ces probabilités estimées. Au moyen des données de la NSDUH et de son sous-échantillon, nous montrons que, même si l’estimateur par probabilité donne une plus petite erreur quadratique moyenne quand on estime la prévalence de la MMG parmi l’ensemble des adultes, il a une plus grande tendance que l’estimateur par seuil diagnostique classique à présenter un biais au niveau de la sous-population.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154929
    Description :

    Le U.S. Census Bureau étudie des stratégies de sous-échantillonnage des non-répondants en prévision de l’Economic Census de 2017. Les contraintes imposées au plan de sondage comprennent une borne inférieure obligatoire pour le taux de réponse totale, ainsi que des taux de réponse cibles par industrie. Le présent article expose la recherche sur les procédures de répartition de l’échantillon pour le sous-échantillonnage des non-répondants conditionnellement à ce que ce sous-échantillonnage soit systématique. Nous considérons deux approches, à savoir 1) l’échantillonnage avec probabilités égales et 2) la répartition optimisée avec contraintes sur les taux de réponse totale et la taille d’échantillon, avec pour objectif la sélection de plus grands échantillons dans les industries qui, au départ, affichent des taux de réponse plus faibles. Nous présentons une étude en simulation qui examine le biais relatif et l’erreur quadratique moyenne pour les répartitions proposées, en évaluant la sensibilité de chaque procédure à la taille du sous-échantillon, aux propensions à répondre et à la procédure d’estimation

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154959
    Description :

    Les modèles pour petits domaines conçus pour traiter les données au niveau du domaine reposent habituellement sur l’hypothèse de normalité des effets aléatoires. Cette hypothèse ne tient pas toujours. L’article présente un nouveau modèle pour petits domaines dont les effets aléatoires suivent une loi t. En outre, la modélisation conjointe des moyennes et des variances de petit domaine est examinée. Il est montré que cette approche donne de meilleurs résultats que les autres méthodes.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 12-001-X201800154963
    Description :

    Le cadre fondé sur l’échantillonnage probabiliste a joué un rôle dominant en recherche par sondage, parce qu’il fournit des outils mathématiques précis pour évaluer la variabilité d’échantillonnage. Toutefois, en raison de la hausse des coûts et de la baisse des taux de réponse, l’usage d’échantillons non probabilistes s’accroît, particulièrement dans le cas de populations générales, pour lesquelles le tirage d’échantillons à partir d’enquêtes en ligne devient de plus en plus économique et facile. Cependant, les échantillons non probabilistes posent un risque de biais de sélection dû à des différences d’accès et de degrés d’intérêt, ainsi qu’à d’autres facteurs. Le calage sur des totaux statistiques connus dans la population offre un moyen de réduire éventuellement l’effet du biais de sélection dans les échantillons non probabilistes. Ici, nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif peut donner un estimateur convergent d’un total de population à condition qu’un sous-ensemble des variables explicatives réelles soit inclus dans le modèle de prédiction, permettant ainsi qu’un grand nombre de covariables possibles soit incluses sans risque de surajustement. Nous montrons que le calage assisté par un modèle en utilisant le LASSO adaptatif produit une meilleure estimation, pour ce qui est de l’erreur quadratique moyenne, que les méthodes concurrentes classiques, tels les estimateurs par la régression généralisée (GREG), quand un grand nombre de covariables sont nécessaires pour déterminer le modèle réel, sans vraiment qu’il y ait perte d’efficacité par rapport à la méthode GREG quand de plus petits modèles suffisent. Nous obtenons aussi des formules analytiques pour les estimateurs de variance des totaux de population, et comparons le comportement de ces estimateurs aux estimateurs bootstrap. Nous concluons par un exemple réel en utilisant des données provenant de la National Health Interview Survey.

    Date de diffusion : 2018-06-21

  • Revues et périodiques : 12-001-X
    Géographie : Canada
    Description :

    La revue publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d'ordre pratique, l'utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l'évaluation des enquêtes, la recherche sur les méthodes d'enquêtes, l'analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l'intégration des données statistiques, les méthodes d'estimation et d'analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l'élaboration et à l'évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles.

    Date de diffusion : 2018-06-21

  • Articles et rapports : 75F0002M2018001
    Description :

    Cette étude passe en revue les changements apportés en 2018 à la méthodologie utilisée pour calculer la mesure de faible revenu de la famille de recensement, en faisant appel au Fichier des familles (FFT1; données des déclarants). Ces changements font en sorte que la méthodologie concorde mieux avec d’autres sources de données de Statistique Canada, comme le Recensement de la population et l’Enquête canadienne sur le revenu. Afin de tenir compte des changements apportés à la méthodologie, de nouveaux tableaux standard du FFT1 fournissant des données sur la mesure de faible revenu de la famille de recensement (revenu après impôt) à partir de 2004 ont été introduits.

    Date de diffusion : 2018-04-05

  • Articles et rapports : 75F0002M2018002
    Description :

    Cette étude passe en revue les différences entre les statistiques de mesure de faible revenu (MFR) après impôt provenant de deux sources de données qui font appel à des données fiscales administratives comme intrants principaux : le Recensement de la population de 2016 et le Fichier des familles T1 (FFT1). Elle présente un résumé des deux sources de données et une comparaison des statistiques de MFR en mettant l’accent sur l’unité d’analyse, les seuils de MFR après impôt et le pourcentage de la population sous la MFR. L’étude examine en outre les facteurs que les utilisateurs pourraient prendre en considération au moment de choisir une source de données par rapport à une autre.

    Date de diffusion : 2018-04-05
Références (453)

Références (453) (0 à 10 de 453 résultats)

  • Avis et consultations : 13-605-X
    Description :

    Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.

    Date de diffusion : 2018-04-26

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2018-02-23

  • Enquêtes et programmes statistiques — Documentation : 71-526-X
    Description :

    L'Enquête sur la population active du Canada (EPA) est la source officielle d'estimations mensuelles de l'emploi total et du chômage. Suite au recensement de 2011, l'EPA a connu un remaniement pour tenir compte de l’évolution des caractéristiques de la population et du marché du travail, pour s’adapter aux besoins actuels et prévus des utilisateurs de données et pour mettre à jour l’information géographique requise pour mener l’enquête. Le programme de remaniement qui a suivi le recensement de 2011 a mené à l'introduction d'un nouvel échantillon au début de l'année 2015. Cette publication est un ouvrage de référence sur les aspects méthodologiques de l'EPA, y compris la stratification, l'échantillonnage, la collecte, le traitement, la pondération, l'estimation, l'estimation de la variance et la qualité des données.

    Date de diffusion : 2017-12-21

  • Enquêtes et programmes statistiques — Documentation : 12-606-X
    Description :

    Ceci est une trouse destiné à aider des producteurs et des utilisateurs de données à l'externe de Statistique Canada.

    Date de diffusion : 2017-09-27

  • Enquêtes et programmes statistiques — Documentation : 91F0015M2017013
    Description :

    Au moyen d’un couplage d’enregistrements, le présent article compare le lieu de résidence indiqué dans le Recensement de 2011 à celui du fichier T1 sur la famille (T1FF) de 2010. Il en ressort que si le niveau de correspondance du lieu de résidence est relativement élevé en général, il fléchit, parfois de manière importante, pour certaines franges de la population.

    Date de diffusion : 2017-09-26

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2017007
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

    Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2017-06-16

  • Enquêtes et programmes statistiques — Documentation : 75-514-G
    Description :

    Le Guide de l'Enquête sur les postes vacants et les salaires contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données et la qualité des données. Le guide porte sur les deux volets de l'enquête, soit le volet sur les postes vacants, dont la fréquence est trimestrielle, et le volet sur les salaires, dont la fréquence est annuelle.

    Date de diffusion : 2017-06-15

  • Enquêtes et programmes statistiques — Documentation : 12-586-X
    Description : Le Cadre d’assurance de la qualité (CAQ) est l’outil de gouvernance de niveau le plus élevé pour la gestion de la qualité à Statistique Canada. Il fournit un aperçu des stratégies de gestion de la qualité et d’atténuation des risques adoptées par les différents secteurs de programme de l’organisme. Le CAQ est utilisé conjointement avec les pratiques de gestion de Statistique Canada, comme celles décrites dans les Lignes directrices concernant la qualité.
    Date de diffusion : 2017-04-21

  • Enquêtes et programmes statistiques — Documentation : 91F0015M2016012
    Description :

    Le présent article renferme de l’information pertinente à l’utilisation des variables relatives à la famille dans les fichiers de microdonnées du Recensement de la population du Canada. Ces fichiers se trouvent à Statistique Canada même, dans les centres de données de recherche (CDR) ou sous forme de fichiers de microdonnées à grande diffusion (FMGD). L’article explique certains des aspects techniques des trois versions, y compris la création de variables multiniveau à des fins analytiques.

    Date de diffusion : 2016-12-22

  • Fichiers et documentation sur la géographie : 12-572-X
    Description :

    La Classification géographique type (CGT) fournit une structure de classification systématique pour toutes les régions géographiques au Canada. La CGT est le système de classification officielle utilisé pour le Recensement de la population et d’autres enquêtes de Statistique Canada.

    La classification est divisée en deux volumes, soit le volume I, La classification et le volume II, Cartes de référence.

    Le volume II renferme des cartes de référence indiquant les limites, les noms, les codes et l'emplacement des régions géographiques figurant dans la classification. Les cartes de référence montrent les subdivisions de recensement, les divisions de recensement, les régions métropolitaines de recensement, les agglomérations de recensement, les zones d'influence métropolitaine de recensement et les régions économiques. Les définitions de ces termes se trouvent dans le Volume I, La classification. Le volume I renferme une description de la classification et des régions géographiques normalisées connexes et comprend les noms de localité.

    Les cartes du volume II peuvent être téléchargées en format PDF à partir de notre site Web.

    Date de diffusion : 2016-11-16

Explorer notre page de partenaires pour trouver la liste complète de nos partenaires et de leurs produits associés.

Date de modification :