Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Enquête ou programme statistique

701 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (24 265)

Tout (24 265) (17 860 à 17 870 de 24 265 résultats)

  • 17 861. Production d'oeufs Archivé
    Tableau : 23-003-X
    Description :

    Ce bulletin mensuel fournit des estimations aux niveaux provincial et national relativement au nombre de pondeuses, aux taux de ponte, à la production d'oeufs, aux prix à la ferme, aux oeufs vendus pour la consommation et ceux utilisés par les producteurs, aux oeufs fissurés et rejetés, aux oeufs transformés, aux placements de poussins femelles de ponte et au prix moyen des oeufs vendus pour la consommation.

    Date de diffusion : 2005-02-08

  • Articles et rapports : 12-001-X20040027747
    Description :

    La réduction de l'exactitude de la classification révisée des personnes en chômage dans la Current Population Survey (CPS) a été décrite dans Biemer et Bushery (2000). Dans le présent article, nous donnons des preuves supplémentaires de cette anomalie et essayons de découvrir la source de l'erreur grâce à une analyse étendue des données de la CPS recueillies avant et après le remaniement. L'article présente une approche novatrice de décomposition de l'erreur dans le cas d'un processus de classification complexe, comme la classification de la situation d'activité de la CPS, par une analyse markovienne de classes latentes (MLCA). En vue de déterminer la cause de la perte apparente d'exactitude de la classification des chômeurs, nous recensons les composantes clés du questionnaire qui déterminent les classifications et nous estimons la contribution de chacune à l'erreur totale du processus de classification. Ces travaux serviront d'orientation aux études futures des causes profondes des erreurs lors de la collecte de données sur la situation d'activité dans le cadre de la CPS, éventuellement au moyen d'expériences cognitives en laboratoire et (ou) d'essais sur le terrain.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027749
    Description :

    Nous dérivons un algorithme simple et pratique permettant d'établir des bornes de stratification telles que les coefficients de variation soient égaux dans chaque strate pour des populations positivement asymétriques. Nous montrons que, comparativement à la méthode de la fonction cumulative de la racine carrée des fréquences (Dalenius et Hodges 1957) et à la méthode d'approximation de Lavallée et l'Hidiroglou (1988), le nouvel algorithme est avantageux pour l'estimation des bornes optimales de stratification.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027750
    Description :

    La reconnaissance intelligente de caractère (RIC) est une nouvelle technologie de saisie des données d'usage très répandu. Statistique Canada l'a utilisée pour la première fois pour traiter les données du Recensement de l'agriculture du Canada de 2001. Cet exercice a posé de nombreux défis d'ordre tant opérationnel que méthodologique. Le présent article donne un aperçu des outils méthodologiques utilisés pour mettre en place un système de RIC efficace. Puisque le risque d'erreur est élevé aux diverses étapes de l'opération, des méthodes et des procédures d'assurance de la qualité (AQ) et de contrôle de la qualité (CQ) ont été intégrées à celle ci afin de s'assurer du haut degré d'exactitude des données saisies. L'article décrit ces méthodes d'AQ/CQ ainsi que leur résultat et montre comment ont été réalisées les améliorations de la qualité dans l'opération de saisie des données par RIC. Il souligne aussi les effets positifs de ces procédures sur l'opération de saisie.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027751
    Description :

    Nous examinons de nouveau la relation entre les effets de plan pour l'estimateur pondéré du total et l'estimateur pondéré de la moyenne sous échantillonnage complexe. Nous donnons des exemples sous diverses conditions. En outre, au moyen d'exemples, nous corrigeons certaines idées fausses concernant les effets de plan.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027752
    Description :

    Le meilleur estimateur (ou prédicteur) linéaire sans biais (BLU) d'un total de population est fondé sur les deux hypothèses suivantes : i) le modèle d'estimation qui sous tend l'estimateur BLU est spécifié correctement et ii) le plan de sondage est ignorable en ce qui concerne le modèle d'estimation. Dans ce contexte, un estimateur est robuste si sa distribution demeure proche de celle de l'estimateur BLU lorsque les deux hypothèses tiennent et s'il retient de bonnes propriétés lorsque l'une des hypothèses ou les deux ne sont pas entièrement satisfaites. La robustesse aux écarts par rapport à l'hypothèse (i) est appelée robustesse au modèle, tandis que la robustesse aux écarts par rapport à l'hypothèse (ii) est appelée robustesse au plan de sondage. On considère souvent que l'estimateur par la régression généralisée (GREG) est robuste, puisque sa propriété d'être asymptotiquement sans biais par rapport au plan (ASBP) ne dépend ni de l'hypothèse (i) ni de l'hypothèse (ii). Toutefois, si ces deux hypothèses tiennent, l'estimateur GREG est parfois nettement moins efficace que l'estimateur BLU et, en ce sens, n'est pas robuste. L'inefficacité relative de l'estimateur GREG comparativement à l'estimateur BLU est due à la grande dispersion des poids de sondage. Afin d'obtenir un estimateur robuste au plan de sondage, nous proposons donc un compromis entre ces deux estimateurs. Cette approche offre aussi une certaine protection contre les écarts par rapport à l'hypothèse (i). Toutefois, elle ne protège pas contre les données aberrantes, qui peuvent être considérées comme la conséquence d'une erreur de spécification du modèle. Pour traiter les données aberrantes, nous utilisons la technique de l'estimation M généralisée pondérée pour réduire l'influence des unités pour lesquelles les résidus pondérés de population sont importants. Nous proposons deux moyens pratiques de mettre en oeuvre les estimateurs M dans le cas d'enquêtes polyvalentes; soit nous modifions le poids des unités influentes et adoptons une approche par calage pour obtenir un ensemble unique de poids d'estimation robustes soit nous modifions les valeurs des unités influentes. Nous évaluons certaines propriétés de l'approche proposée au moyen d'une étude en simulation portant sur une population finie asymétrique créée à partir de données d'enquête réelles.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027753
    Description :

    Les échantillonneurs se méfient souvent des approches d'inférence fondées sur un modèle, parce qu'ils craignent que soient commises des erreurs de spécification lorsque les modèles sont appliqués à de grands échantillons provenant de populations complexes. Nous soutenons que le paradigme de l'inférence fondée sur un modèle peut donner de très bons résultats dans les conditions d'enquête, à condition que les modèles soient choisis de façon à tenir compte du plan d'échantillonnage et d'éviter de faire des hypothèses fortes au sujet des paramètres. L'estimateur d'Horvitz Thompson (HT) est un estimateur simple sans biais par rapport au plan de sondage du total de population finie. Du point de vue de la modélisation, l'estimateur HT fonctionne bien lorsque les ratios des valeurs de la variable de résultat et des probabilités d'inclusion sont interchangeables. Si cette hypothèse n'est pas satisfaite, l'estimateur HT peut être très inefficace. Dans Zheng et Little (2003, 2004), nous avons utilisé des fonctions splines pénalisées (p splines) pour modéliser des relations à variation lisse entre le résultat et les probabilités d'inclusion sous échantillonnage à un degré avec probabilité proportionnelle à la taille (PPT). Nous avons montré que les estimateurs fondés sur un modèle à fonction p spline sont généralement plus efficaces que l'estimateur HT et peuvent fournir des intervalles de confiance plus étroits dont la couverture est proche du niveau de confiance nominal. Dans le présent article, nous étendons cette approche aux plans d'échantillonnage à deux degrés. Nous utilisons un modèle mixte fondé sur une p spline qui est ajusté à une relation non paramétrique entre les moyennes des unités primaires d'échantillonnage (UPE) et une mesure de la taille des UPE, et auquel sont intégrés des effets aléatoires pour modéliser la mise en grappes. Pour l'estimation de la variance, nous considérons les méthodes d'estimation de la variance fondées sur un modèle bayésien empirique, la méthode du jackknife et la méthode des répliques répétées équilibrées (BRR). Des études en simulation portant sur des données simulées et des échantillons tirés des microdonnées à grande diffusion du Recensement de 1990 montrent que l'estimateur fondé sur un modèle à fonction p spline donne de meilleurs résultats que l'estimateur HT et que les estimateurs linéaires assistés par un modèle. Les simulations montrent aussi que les méthodes d'estimation de la variance produisent des intervalles de confiance dont la couverture est satisfaisante. Fait intéressant, ces progrès peuvent être observés pour un plan d'échantillonnage courant à probabilités de sélection égales, où la sélection à la première étape est PPT et où les probabilités de sélection à la deuxième étape sont proportionnelles à l'inverse des probabilités de sélection à la première étape, et où l'estimateur HT mène à la moyenne non pondérée. Dans les situations favorisant le plus l'utilisation de l'estimateur HT, les estimateurs fondés sur un modèle ont une efficacité comparable.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027755
    Description :

    Plusieurs organismes statistiques utilisent, ou considèrent utiliser, l'imputation multiple pour limiter le risque de divulguer l'identité des répondants ou certains attributs délicats dans les fichiers de données à grande diffusion. Par exemple, ces organismes peuvent diffuser des ensembles de données partiellement synthétiques comprenant les unités étudiées originellement, où certaines valeurs recueillies, comme les valeurs délicates posant un risque élevé de divulgation ou les valeurs d'identificateurs clés, sont remplacées par des imputations multiples. Le présent article décrit une approche permettant de générer des ensembles de données partiellement synthétiques multi imputés pour traiter simultanément le contrôle de la divulgation et les données manquantes. L'idée fondamentale consiste à imputer d'abord les valeurs manquantes pour produire m ensembles de données complets, puis à remplacer dans chaque ensemble de données complet les valeurs délicates ou permettant l'identification par r valeurs imputées. L'article décrit aussi des méthodes permettant de faire des inférences valides à partir d'ensembles de données multi imputés de ce genre. De nouvelles règles sont nécessaires pour combiner les estimations ponctuelles et de variances multiples, parce que les deux étapes d'imputation multiple introduisent dans les estimations ponctuelles deux sources de variabilité que les méthodes existantes d'obtention d'inférences à partir d'ensembles de données multi imputés ne mesurent pas correctement. Une loi t de référence appropriée pour l'inférence quand les valeurs de m et r sont moyennes est établie au moyen d'approximations par appariement de moments et par développement en série de Taylor.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027756
    Description :

    Il arrive souvent de découvrir à l'étape de la collecte des données d'une enquête que certaines unités de l'échantillon ne satisfont pas aux critères d'admissibilité, alors que l'information enregistrée dans la base de sondage indique le contraire. Par exemple, dans le cas des enquêtes auprès des entreprises, il est fréquent qu'une proportion non négligeable d'unités échantillonnées aient mis fin à leurs activités commerciales depuis la dernière mise à jour de la base de sondage. Cette information peut être enregistrée dans la base de sondage et utilisée lors des enquêtes subséquentes, de façon à rendre les futurs échantillons plus efficaces en n'échantillonnant pas les unités inadmissibles. Lors du premier de deux cycles d'une enquête, nous supposons que toutes les unités inadmissibles comprises dans l'échantillon (ou l'ensemble d'échantillons) sont décelées et exclues de la base de sondage. Lors du deuxième cycle, nous observons de nouveau un sous échantillon de la partie admissible. Le sous échantillon peut être agrandi au moyen d'un nouvel échantillon qui contiendra à la fois des unités admissibles et inadmissibles. Nous étudions l'effet que peut avoir sur l'estimation le processus d'introduction de l'information sur l'inadmissibilité dans la base de sondage et nous établissons une expression du biais qui peut résulter de cette rétroaction. Nous nous concentrons sur l'estimation du total au moyen de l'estimateur par extension courant. Nous obtenons un estimateur presque sans biais en présence de rétroaction. Cet estimateur dépend de la disponibilité d'estimations convergentes des nombres d'unités admissibles et inadmissibles dans la population.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X20040027758
    Description :

    Nous étudions l'utilisation de réseaux neuronaux bayésiens pour l'estimation en population finie. Nous proposons des estimateurs de la moyenne de population finie et de son erreur quadratique moyenne. Nous proposons aussi d'utiliser la loi t de Student pour modéliser les perturbations afin de pouvoir utiliser les observations extrêmes souvent présentes dans les données provenant d'enquêtes sociales par sondage. Les résultats numériques montrent que les réseaux neuronaux bayésiens améliorent significativement l'estimation en population finie comparativement aux méthodes fondées sur la régression linéaire.

    Date de diffusion : 2005-02-03
Données (11 968)

Données (11 968) (30 à 40 de 11 968 résultats)

  • Tableau : 20-10-0005-01
    La fréquence : Mensuelle
    Description :

    Diffusions historiques (temps réel) des ventes de grossistes, prix et volume, selon le Système de classification des industries de l'Amérique du Nord (SCIAN). Les données sont désaisonnalisées et disponible de façcon mensuel en dollars x 1 000 000.

    Date de diffusion : 2024-05-21

  • Tableau : 20-10-0019-01
    Géographie : Canada, Province ou territoire
    La fréquence : Mensuelle
    Description :

    Diffusions historiques des ventes du commerce de gros, disponibles pour tous les membres sous les dimensions diffusion et ajustements, pour Canada, provinces et territoires, disponibles mensuellement en dollars x 1 000.

    Date de diffusion : 2024-05-21

  • Tableau : 20-10-0020-01
    Géographie : Canada
    La fréquence : Mensuelle
    Description :

    Diffusions historiques (temps réel) du commerce de gros, stocks, disponibles pour tous les membres sous les dimensions diffusions, ajustements et Système de classification des industries de l'Amérique du Nord (SCIAN), disponibles mensuellement, pour Canada, en dollars x 1 000.

    Date de diffusion : 2024-05-21

  • Tableau : 23-10-0216-01
    Géographie : Canada
    La fréquence : Mensuelle
    Description : Statistiques des chargements mensuels de l’industrie ferroviaire pour le trafic intermodal et non intermodal en tonnes métriques, pour la période allant de janvier au mois le plus récent de l’année en cours, Canada, division Est et division Ouest.
    Date de diffusion : 2024-05-21

  • Tableau : 23-10-0216-02
    Géographie : Canada
    La fréquence : Mensuelle
    Description :

    Statistiques des chargements mensuels de l’industrie ferroviaire pour le trafic non intermodal, nombre total de wagons et tonnage, pour la période allant de janvier au mois le plus récent de l’année en cours, Canada, division Est et division Ouest.

    Date de diffusion : 2024-05-21

  • Tableau : 25-10-0075-01
    Géographie : Canada, Province ou territoire
    La fréquence : Mensuelle
    Description : Stocks d'ouverture et de fermeture de pétrole brut et de produits pétroliers, par mode de transport, notamment les pipelines, les navires et les terminaux connexes, et par type de produit, mensuel, données non désaisonnalisées.
    Date de diffusion : 2024-05-21

  • Tableau : 25-10-0077-01
    Géographie : Canada, Province ou territoire
    La fréquence : Mensuelle
    Description : Mouvements de pétrole brut et de produits pétroliers, par mode de transport, notamment les pipelines, les navires et les terminaux connexes, et par type de produit, de la région d'expédition à la région de réception, mensuel, données non désaisonnalisées.
    Date de diffusion : 2024-05-21

  • Tableau : 33-10-0036-01
    Géographie : Canada
    La fréquence : Quotidienne
    Description :

    Ce tableau contient 27 séries. Les données commencent en 1981 (il n'y a pas nécessairement de données pour toutes les années pour l'ensemble des combinaisons). Ce tableau contient des données telles que décrites par les dimensions suivantes (Les combinaisons ne sont pas toutes disponibles) : Géographie (1 élément : Canada) ; Genre de monnaie (27 éléments : Dollar (Australie), moyenne quotidienne; Real (Brésil), moyenne quotidienne; Renminbi (Chine), moyenne quotidienne; Euro (Europe), moyenne quotidienne; ...).

    Date de diffusion : 2024-05-21

  • Tableau : 36-10-0356-01
    Géographie : Canada
    La fréquence : Annuelle
    Description :

    Données sur les activités des entreprises multinationales canadiennes et étrangères au Canada, par exemple le nombre d’emplois, les actifs, les revenus d’exploitation, le commerce international de marchandises ou le produit intérieur brut, en proportion de l’économie canadienne.

    Date de diffusion : 2024-05-21

  • Tableau : 36-10-0445-01
    Géographie : Canada
    La fréquence : Annuelle
    Description :

    Données sur les activités des entreprises multinationales étrangères au Canada, par exemple le nombre d’emplois, les actifs, les revenus d’exploitation, le commerce international de marchandises ou le produit intérieur brut, selon le pays investisseur immédiat et ultime.

    Date de diffusion : 2024-05-21
Analyses (9 935)

Analyses (9 935) (260 à 270 de 9 935 résultats)

  • Stats en bref : 11-001-X20240169305
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2024-01-16

  • Articles et rapports : 75-006-X202400100001
    Description : Fondée sur les données tirées de l’Enquête sur la santé dans les collectivités canadiennes, cette étude porte sur la couverture des hommes et des femmes en fonction de quatre types de régimes d’assurance-médicaments (parrainés par le gouvernement, parrainés par l’employeur, parrainés par une association et privés), ventilés en fonction de divers facteurs socioéconomiques, démographiques et géographiques. L’étude traite également de l’ampleur du non-respect des ordonnances de médicaments en raison des coûts, chez les hommes et les femmes, et ventilée en fonction du type de régime d’assurance-médicaments.
    Date de diffusion : 2024-01-10

  • Stats en bref : 11-001-X202401037854
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2024-01-10

  • Articles et rapports : 12-001-X202300200001
    Description : Lorsqu’un fournisseur de soins de santé de Medicare est soupçonné de fraude liée à la facturation, on isole une population de paiements X versés à ce fournisseur sur une certaine période. Un examinateur médical agréé peut, dans un long processus, établir le trop-payé Y = X - (montant justifié par la preuve) pour chaque paiement. En temps normal, il y aura trop de paiements dans une population pour que chacun soit examiné avec soin, aussi prélève-t-on un échantillon probabiliste. Les trop-payés de cet échantillon servent alors à calculer une borne inférieure de l’intervalle de confiance de 90 % pour le trop-payé total de cette population. La borne correspond au montant exigé en recouvrement auprès du fournisseur. Malheureusement, les méthodes classiques de calcul de cette borne ne permettent parfois pas de dégager le niveau de confiance de 90 %, plus particulièrement lorsqu’on utilise un échantillon stratifié.

    Dans le présent document, nous présentons et décrivons 166 échantillons épurés tirés des enquêtes au sujet de l’intégrité de Medicare qui comportent 156 populations de paiements correspondantes. Les 7 588 paires échantillonnées (Y, X) indiquent 1) que les vérifications réalisées au sein de Medicare affichent des taux d’erreur élevés : plus de 76 % des paiements en question sont considérés comme étant des erreurs. Elles indiquent aussi 2) que les configurations de ces échantillons vont dans le sens d’un modèle de mélange « tout ou rien » pour (Y, X) qui est déjà défini dans les études spécialisées. Nous analysons des procédures de test de Monte Carlo fondées sur un modèle pour les plans de sondage de Medicare, ainsi que des méthodes de stratification fondées sur les moments anticipés du modèle. Pour la viabilité (atteinte d’un niveau de confiance de 90 %), nous définissons dans le présent article une nouvelle méthode de stratification qui rivalise avec les meilleures parmi de nombreuses méthodes existantes et qui semble moins sensible au choix de paramètres d’exploitation. Pour ce qui est du recouvrement des trop-payés (ce qui équivaut à une mesure de la précision), la nouvelle méthode se compare aussi aux meilleures parmi les nombreuses méthodes expérimentées. Malheureusement, aucun algorithme de stratification mis à l’essai ne s’est révélé viable pour plus de la moitié environ des 104 populations visées par l’essai.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200002
    Description : Il est essentiel de pouvoir quantifier l’exactitude (biais, variance) des résultats publiés dans les statistiques officielles. Dans ces dernières, les résultats sont presque toujours divisés en sous-populations selon une variable de classification, comme le revenu moyen par catégorie de niveau de scolarité. Ces résultats sont également appelés « statistiques de domaine ». Dans le présent article, nous nous limitons aux variables de classification binaire. En pratique, des erreurs de classification se produisent et contribuent au biais et à la variance des statistiques de domaine. Les méthodes analytiques et numériques servant actuellement à estimer cet effet présentent deux inconvénients. Le premier inconvénient est qu’elles exigent que les probabilités de classification erronée soient connues au préalable et le deuxième est que les estimations du biais et de la variance sont elles-mêmes biaisées. Dans le présent article, nous présentons une nouvelle méthode, un modèle de mélange gaussien estimé par un algorithme espérance-maximisation (EM) combiné à un bootstrap, appelé « méthode bootstrap EM ». Cette nouvelle méthode n’exige pas que les probabilités de classification erronée soient connues au préalable, bien qu’elle soit plus efficace quand on utilise un petit échantillon de vérification qui donne une valeur de départ pour les probabilités de classification erronée dans l’algorithme EM. Nous avons comparé le rendement de la nouvelle méthode et celui des méthodes numériques actuellement disponibles, à savoir la méthode bootstrap et la méthode SIMEX. Des études antérieures ont démontré que pour les paramètres non linéaires, le bootstrap donne de meilleurs résultats que les expressions analytiques. Pour presque toutes les conditions mises à l’essai, les estimations du biais et de la variance obtenues par la méthode bootstrap EM sont plus proches de leurs vraies valeurs que celles obtenues par les méthodes bootstrap et SIMEX. Nous terminons l’article par une discussion sur les résultats et d’éventuels prolongements de la méthode.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200003
    Description : Nous étudions la prédiction sur petits domaines des paramètres généraux à partir de deux modèles pour les dénombrements au niveau de l’unité. Nous construisons des prédicteurs de paramètres, comme les quartiles, qui peuvent être des fonctions non linéaires de la variable réponse du modèle. Nous élaborons d’abord une procédure pour construire les meilleurs prédicteurs empiriques et les estimateurs de l’erreur quadratique moyenne des paramètres généraux dans un modèle Gamma-Poisson au niveau de l’unité. Nous utilisons ensuite un algorithme de rééchantillonnage préférentiel pour élaborer des prédicteurs pour un modèle linéaire mixte généralisé (MLMG) avec une distribution de la réponse de Poisson. Nous comparons les deux modèles au moyen d’une simulation et d’une analyse des données de l’Iowa Seat-Belt Use Survey (une enquête sur l’utilisation de la ceinture de sécurité dans l’État de l’Iowa).
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200004
    Description : Nous présentons une nouvelle méthodologie pour réconcilier des estimations des totaux des superficies cultivées au niveau du comté à un total prédéfini au niveau de l’État soumis à des contraintes d’inégalité et à des variances aléatoires dans le modèle de Fay-Herriot. Pour la superficie ensemencée du National Agricultural Statistics Service (NASS), un organisme du ministère de l’Agriculture des États-Unis (USDA), il est nécessaire d’intégrer la contrainte selon laquelle les totaux estimés, dérivés de données d’enquête et d’autres données auxiliaires, ne sont pas inférieurs aux totaux administratifs de la superficie ensemencée préenregistrés par d’autres organismes du USDA, à l’exception de NASS. Ces totaux administratifs sont considérés comme fixes et connus, et cette exigence de cohérence supplémentaire ajoute à la complexité de la réconciliation des estimations au niveau du comté. Une analyse entièrement bayésienne du modèle de Fay-Herriot offre un moyen intéressant d’intégrer les contraintes d’inégalité et de réconciliation et de quantifier les incertitudes qui en résultent, mais l’échantillonnage à partir des densités a posteriori comprend une intégration difficile; des approximations raisonnables doivent être faites. Tout d’abord, nous décrivons un modèle à rétrécissement unique, qui rétrécit les moyennes lorsque l’on suppose que les variances sont connues. Ensuite, nous élargissons ce modèle pour tenir compte du rétrécissement double par l’emprunt d’information dans les moyennes et les variances. Ce modèle élargi comporte deux sources de variation supplémentaire; toutefois, comme nous rétrécissons à la fois les moyennes et les variances, ce second modèle devrait avoir un meilleur rendement sur le plan de la qualité de l’ajustement (fiabilité) et, possiblement, sur le plan de la précision. Les calculs sont difficiles pour les deux modèles, qui sont appliqués à des ensembles de données simulées dont les propriétés ressemblent à celles des cultures de maïs de l’Illinois.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200005
    Description : Le sous-dénombrement de la population est un des principaux obstacles avec lesquels il faut composer lors de l’analyse statistique d’échantillons d’enquête non probabilistes. Nous considérons dans le présent article deux scénarios types de sous-dénombrement, à savoir le sous-dénombrement stochastique et le sous-dénombrement déterministe. Nous soutenons que l’on peut appliquer directement les méthodes d’estimation existantes selon l’hypothèse de positivité sur les scores de propension (c’est-à-dire les probabilités de participation) pour traiter le scénario de sous-dénombrement stochastique. Nous étudions des stratégies visant à atténuer les biais lors de l’estimation de la moyenne de la population cible selon le sous-dénombrement déterministe. Plus précisément, nous examinons une méthode de population fractionnée (split-population method) fondée sur une formulation d’enveloppe convexe et nous construisons des estimateurs menant à des biais réduits. Un estimateur doublement robuste peut être construit si un sous-échantillon de suivi de l’enquête probabiliste de référence comportant des mesures sur la variable étudiée devient réalisable. Le rendement de six estimateurs concurrents est examiné au moyen d’une étude par simulations, et des questions nécessitant un examen plus approfondi sont brièvement abordées.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200006
    Description : Les spécialistes de la recherche sur les enquêtes se tournent de plus en plus vers la collecte multimodale de données pour composer avec la baisse des taux de réponse aux enquêtes et l’augmentation des coûts. Une approche efficace propose des modes de collecte moins coûteux (par exemple sur le Web) suivis d’un mode plus coûteux pour un sous-échantillon des unités (par exemple les ménages) dans chaque unité primaire d’échantillonnage (UPE). Nous présentons deux solutions de rechange à cette conception classique. La première consiste à sous-échantillonner les UPE plutôt que les unités pour limiter les coûts. La seconde est un plan hybride qui comprend un échantillon (à deux degrés) par grappes et un échantillon indépendant sans mise en grappes. À l’aide d’une simulation, nous démontrons que le plan hybride comporte des avantages considérables.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200007
    Description : La prédiction conforme est une méthode allégée en hypothèses servant à générer des intervalles ou des ensembles de prédiction sans distribution, pour des modèles prédictifs presque arbitraires, avec une couverture d’échantillon fini garantie. Les méthodes conformes sont un sujet de recherche dynamique en statistique et en apprentissage automatique, mais ce n’est que récemment qu’elles ont été étendues aux données non échangeables. Dans le présent article, nous invitons les méthodologistes d’enquête à commencer à utiliser des méthodes conformes et à y contribuer. Nous introduisons la façon dont la prédiction conforme peut être appliquée à des données provenant de plusieurs plans de sondage complexes courants dans un cadre d’inférence fondée sur le plan pour une population finie, et nous faisons ressortir des lacunes où les méthodologistes d’enquête pourraient appliquer leur expertise de façon fructueuse. Nos simulations confirment empiriquement les garanties théoriques de la couverture d’échantillon fini, et notre exemple de données réelles démontre la façon dont la prédiction conforme peut être appliquée aux données d’enquêtes-échantillons complexes.
    Date de diffusion : 2024-01-03
Références (1 888)

Références (1 888) (10 à 20 de 1 888 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-26-0001
    Description : Les données pour les produits associés à ce guide de référence technique sont tirées d'une première version du fichier T1 que Statistique Canada reçoit de l'Agence du revenu du Canada (ARC). Les données sur des sujets particuliers reliés au revenu et aux déductions d'impôts peuvent être tirées des déclarations de revenus T1. Les sujets d'intérêt de cette version préliminaire du T1 peuvent varier d'année en année.
    Date de diffusion : 2024-03-06

  • Avis et consultations : 13-605-X
    Description : Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.
    Date de diffusion : 2024-02-29

  • Enquêtes et programmes statistiques — Documentation : 32-26-0007
    Description : Les données du Recensement de l’agriculture fournissent des renseignements statistiques sur les exploitations et les exploitants agricoles à des niveaux géographiques fins et pour de petites sous–populations. Des activités d’évaluation de la qualité sont essentielles pour s’assurer que les données du recensement sont fiables et qu’elles répondent aux besoins des utilisateurs.

    Ce rapport fournit des renseignements sur la qualité des données relatives au Recensement de l’agriculture, comme les sources d’erreur, la détection des erreurs, les méthodes de contrôle de la divulgation, les indicateurs de la qualité des données, les taux de réponse et les taux de collecte.
    Date de diffusion : 2024-02-06

  • Enquêtes et programmes statistiques — Documentation : 13-605-X202400100001
    Description : Ce guide présente de l’information visant à améliorer la compréhension des statistiques du Commerce international de marchandises du Canada. Les définitions de bases, les concepts clés, la méthodologie, et les processus de traitement de données y sont présentés. Un aperçu des données publiées, qui inclut une description des classifications de produits, d’industries, et des zones géographiques est fourni. Des liens vers les produits pour lesquels ces données sont disponibles sont également présentés.
    Date de diffusion : 2024-01-22

  • Enquêtes et programmes statistiques — Documentation : 13-26-0002
    Description :

    Créé en collaboration avec l'Agence de la santé publique du Canada (ASPC), ce guide de l'utilisateur des données avec son dictionnaire de données annexé fournit aux Canadiens et aux chercheurs les informations nécessaires pour pouvoir utiliser le tableau des informations préliminaires détaillées sur les cas confirmés de COVID-19 (révisé).

    Le guide de l'utilisateur des données avec le dictionnaire de données annexé décrit les informations générales sur la COVID-19 ainsi que les objectifs, la couverture, le contenu du tableau, les limites et les problèmes de qualité des données de l'ensemble des données.

    Date de diffusion : 2024-01-12

  • Enquêtes et programmes statistiques — Documentation : 62F0072G
    Description : Les données qui servent à la création de l'indice de mission sont pour la plupart tirées des enquêtes périodiques sur les prix de détail et le coût de la vie menées par le personnel du service extérieur en poste à l'étranger. Les données de ces enquêtes sont analysées par Statistique Canada. En plus de recueillir divers renseignements sur les prix aux points de vente au détail où le personnel canadien en poste à l'étranger s'approvisionne, Statistique Canada obtient aussi des données sur les habitudes de dépenses, des renseignements relatifs à l'existence de points d'achats spéciaux sur place et au volume des importations directes de biens de consommation effectuées par le personnel. L'objectif général est de mener des enquêtes à grande échelle tous les trois ans environ. Toutefois, des études précises peuvent être menées à intervalles plus ou moins rapprochés en fonction du degré d'instabilité des prix de détail dans chaque pays et des taux de change, et de la mesure dans laquelle il est possible d'utiliser d'autres indicateurs statistiques pour exercer une surveillance étroite des changements de la situation locale des prix de détail auxquels le personnel canadien fait face.
    Date de diffusion : 2023-12-22

  • Enquêtes et programmes statistiques — Documentation : 37-20-00012023006
    Description : Ce guide de référence technique s'adresse aux utilisateurs de la Plateforme longitudinale entre l'éducation et le marché du travail (PLEMT). Les données pour les produits associés à ce numéro proviennent des fichiers longitudinaux de l'intégration du Système d'information sur les étudiants postsecondaires (SIEP). Statistique Canada a établi une série d'indicateurs annuels des étudiants postsecondaires, y compris le taux de persévérance, le taux de diplomation, et le délai moyen d'obtention de la sanction d'études, par titre scolaire, domaine d'études, groupe d'âge, et genre pour le Canada, les provinces et les trois territoires combinés.
    Date de diffusion : 2023-12-19

  • Classification : 12-608-X
    Description : La Classification type des pays et des zones d'intérêt (CTPZI) a été élaborée pour harmoniser davantage la liste des pays utilisée à Statistique Canada et comprend les pays et les zones pour lesquels des données statistiques sont recueillies. La Variante de la CTPZI pour les statistiques sociales et la Variante de la CTPZI pour les statistiques sur les voyages ont été élaborées pour créer des groupements de pays afin de faciliter la production de statistiques intégrées lors de la publication des statistiques sociales et des statistiques sur les voyages, respectivement. Ces variantes comprennent trois niveaux.
    Date de diffusion : 2023-12-07

  • Enquêtes et programmes statistiques — Documentation : 25-26-0002
    Description : Le tableau des statistiques consolidées de l'énergie (TSCE) fournit des estimations nationales mensuelles des caractéristiques de la disponibilité et de l'écoulement des sources d'énergie primaires et secondaires, par type de combustible. Les données sont présentées en térajoules, une unité de mesure courante qui permet de facilement comparer différents types de combustibles et d'énergies. Le tableau est mis à jour chaque mois au moyen de l'ajout de nouvelles données.
    Date de diffusion : 2023-12-07

  • Classification : 65-209-X
    Description : La Nomenclature canadienne d'exportation est un système de classification structuré et hiérarchique fondé sur le Système harmonisé de désignation et de codification. La nomenclature du SH est divisée en 21 sections, regroupant, en général, les marchandises produites dans le même secteur de l'économie.
    Date de diffusion : 2023-12-06
Date de modification :