Méthodes statistiques

Indicateurs clés

Toute modification apportera automatiquement une mise à jour au contenu de la page.

Région géographique choisie : Canada

Région géographique choisie : Terre Neuve et Labrador

Région géographique choisie : Île-du-Prince-Edouard

Région géographique choisie : Nouvelle-Écosse

Région géographique choisie : Nouveau-Brunswick

Région géographique choisie : Québec

Région géographique choisie : Ontario

Région géographique choisie : Manitoba

Région géographique choisie : Saskatchewan

Région géographique choisie : Alberta

Région géographique choisie : Colombie-Britannique

Région géographique choisie : Yukon

Région géographique choisie : Territoires du Nord-Ouest

Région géographique choisie : Nunavut

Aide à l'ordre
entrées

Résultats

Tout (2 345)

Tout (2 345) (0 à 10 de 2 345 résultats)

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2025-01-23

  • Articles et rapports : 12-001-X202400200001
    Description : La règle de Cochran stipule qu’un intervalle de confiance (de Wald) à 95 % bilatéral standard autour de la moyenne d’un échantillon tiré d’une population présentant une asymétrie positive est raisonnable lorsque la taille de l’échantillon est supérieure à 25 fois le carré du coefficient d’asymétrie de la population. Nous examinons si une variante de cette règle brute s’applique à une proportion estimée à partir d’un échantillon aléatoire simple stratifié.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200002
    Description : Le présent article porte sur la possibilité que la qualité des données d’enquête fluctue au fil de la journée. Après avoir exposé l’argument sur le plan théorique, les données recueillies au moyen d’un panel du Survey of Unemployed Workers in New Jersey (enquête sur les chômeurs au New Jersey) sont analysées. Plusieurs indicateurs indirects de l’erreur de réponse sont examinés, notamment la non-réponse partielle, la durée des interviews, l’arrondissement et les mesures de la qualité des données du journal sur l’emploi du temps. Les données probantes que nous avons rassemblées pour l’effet de l’heure de la journée sur les interviews sont fiables ou inexistantes. La non-réponse partielle et la probabilité que la durée des interviews fasse partie des 5 % des durées les plus courtes semblent augmenter en soirée, mais une évaluation plus détaillée demande de recourir à des variables instrumentales.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200003
    Description : La répartition optimale de l’échantillon dans le cadre d’un échantillonnage stratifié est l’une des questions fondamentales des techniques d’enquête. Il s’agit d’une procédure consistant à diviser la taille globale de l’échantillon en strates de telle sorte que, pour des plans d’échantillonnage donnés dans les strates, la variance de l’estimateur stratifié /pi du total (ou de la moyenne) de la population pour une variable à l’étude donnée atteigne son minimum. Dans le présent travail, nous considérons la répartition optimale d’un échantillon, sous des bornes inférieures et supérieures imposées conjointement sur les tailles d’échantillon dans les strates. Nous nous intéressons à la fonction de variance d’une forme générique qui, en particulier, couvre le cas de l’échantillonnage aléatoire simple sans remise dans les strates. L’objectif du présent document est double. Tout d’abord, nous établissons (à l’aide des conditions de Karush-Kuhn-Tucker) une forme générique de la solution optimale, appelée « conditions d’optimalité ». Ensuite, sur la base des conditions d’optimalité établies, nous dérivons un algorithme récursif efficace, appelé « RNABOX », qui résout le problème de répartition étudié. Le RNABOX peut être considéré comme une généralisation de l’algorithme récursif classique de répartition de Neyman, un outil populaire pour la répartition optimale lorsque seules des bornes supérieures sont imposées à la taille des strates d’échantillonnage. Nous mettons en œuvre le RNABOX dans R dans le cadre de notre paquet stratallo qui est disponible dans le dépôt Comprehensive R Archive Network (CRAN).
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200004
    Description : Tout en évitant de préciser la relation paramétrique entre la variable d’étude et les covariables, nous illustrons l’avantage d’inclure une composante spatiale pour mieux tenir compte des covariables dans nos modèles en vue de faire une inférence prédictive bayésienne. Nous traitons chaque combinaison unique de covariables comme une strate individuelle, puis nous utilisons les techniques d’estimation sur petits domaines pour faire une inférence à propos de la population moyenne finie de la variable de réponse continue. Les deux modèles spatiaux utilisés sont le modèle d’autorégression conditionnel et le modèle d’autorégression conditionnelle simple. Nous incluons les effets spatiaux en créant la matrice d’adjacence à partir de la distance de Mahalanobis entre les covariables. Nous démontrons également la façon d’incorporer les poids d’enquête dans les modèles spatiaux en cas de données d’enquête probabiliste. Nous comparons les résultats des deux modèles non spatiaux, à savoir le modèle Scott-Smith et le modèle Battese, Harter et Fuller, aux modèles spatiaux. Nous illustrons la comparaison entre les deux modèles mentionnés et une application au moyen des données sur l’indice de masse corporelle de huit comtés en Californie. Notre but est d’obtenir des strates voisines donnant des prédictions similaires et d’augmenter la différence entre les strates qui ne sont pas voisines. Finalement, l’utilisation des modèles spatiaux montre un regroupement global moindre par rapport aux modèles non spatiaux, ce qui correspond au résultat souhaité.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200005
    Description : Les plans d’enquête adaptatifs (PEA) permettent d’adapter les protocoles de recrutement aux sous-groupes de population qui présentent un intérêt pour une enquête. Ces dernières années, l’optimisation efficace d’un PEA a fait l’objet de recherches et de plusieurs applications. Toutefois, le rendement d’un PEA optimisé au fil du temps réagit aux variations temporelles des propensions à répondre. On ne comprend pas encore entièrement la façon dont les stratégies d’adaptation peuvent s’adapter à une telle variation au fil du temps. Dans la présente étude, nous proposons une approche d’optimisation robuste dans le contexte d’enquêtes séquentielles multimodales à l’aide d’une analyse bayésienne. Cette approche s’exprime sous la forme d’un problème de programmation mathématique qui tient explicitement compte de l’incertitude attribuable à la variation temporelle. Des décisions en matière de PEA peuvent alors être prises en tenant compte de la variation chronologique de la propension à répondre conditionnelle au mode et des corrélations de la propension à répondre entre les modes. La démonstration de cette approche fait appel à une étude de cas : l’Enquête sur la santé aux Pays-Bas de 2014 à 2017. Nous évaluons la sensibilité du rendement des PEA 1) au niveau budgétaire et 2) à la durée des données de série chronologique historiques applicables. Nous concluons que la dépendance au niveau budgétaire n’est que modérée et que la dépendance aux données historiques est tempérée par le degré de saisonnalité au cours de l’année.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200006
    Description : À mesure que les plans de sondage à mode mixte deviennent de plus en plus populaires, leurs effets sur la qualité des données ont attiré l’attention de plusieurs chercheurs. La plupart des études se sont concentrées sur les propriétés de biais des plans de sondage à mode mixte; peu d’entre elles ont cherché à savoir si les plans de sondage à mode mixte ont des structures de variance hétérogènes entre les modes. Bien que de nombreuses caractéristiques des plans de sondage à mode mixte, comme l’utilisation d’intervieweurs variés, les différences systématiques entre les répondants, les différents niveaux de biais dû à la désirabilité sociale, entre autres, peuvent conduire à des variances hétérogènes dans les estimations ponctuelles des moyennes de population propre à un mode, la présente étude permet d’examiner précisément si les variances de l’intervieweur demeurent cohérentes entre les différents modes dans les études multimodales. Pour répondre à cette question de recherche, nous utilisons les données recueillies grâce à deux modèles d’études distincts. Dans le premier modèle, lorsque les intervieweurs sont responsables soit du mode face à face, soit du mode téléphonique, nous examinons s’il y a des différences de mode dans les variances de l’intervieweur pour : 1) les questions politiques de nature délicate; 2) les éléments internationaux; 3) les indicateurs d’éléments manquants sur des éléments internationaux, grâce aux données sur la Jordanie de la vague 6 de l’Arab Barometer. Dans le deuxième modèle, nous nous appuyons sur les données de base de la Health and Retirement Study (HRS) de 2016 pour examiner la question sur trois sujets lorsque les intervieweurs sont responsables des deux modes. Les sujets traités comprennent : 1) l’échelle d’évaluation de la dépression du Center for Epidemiological Studies-Depression (CES-D); 2) les observations des intervieweurs; 3) l’échelle d’activité physique. Pour tenir compte du manque de plans de sondage interpénétrés dans les deux sources de données, nous incluons des covariables au niveau du répondant dans nos modèles. Nous constatons des différences importantes dans les variances de l’intervieweur sur un élément (12 éléments au total) dans l’enquête de l’Arab Barometer, alors que pour la HRS, les résultats sont de 3 sur 18. Dans l’ensemble, nous constatons que l’ampleur des variances de l’intervieweur est plus grande en personne que par téléphone pour les éléments de nature délicate. Nous effectuons des simulations pour comprendre le pouvoir de détecter les effets du mode d’enquête dans les tailles d’échantillons typiquement modestes de l’intervieweur.
    Date de diffusion : 2024-12-20

  • 12-001-X202400200007
    Description : Il est possible d’appliquer la méthode de capture-recapture pour mesurer la couverture des sources de données administratives et de mégadonnées dans les statistiques officielles. Dans sa forme de base, elle comporte le couplage de deux sources tout en supposant un couplage parfait et d’autres hypothèses types. En pratique, des erreurs de couplage surviennent et constituent une source potentielle de biais quand le couplage est fondé sur des quasi-identificateurs. Ces erreurs comprennent des faux positifs et des faux négatifs, où les premiers se produisent quand un lien est établi entre des enregistrements provenant de différentes unités, et les deuxièmes surviennent lorsqu’il n’y a pas de lien entre des enregistrements provenant de la même unité. Jusqu’à présent, les solutions trouvées ont reposé sur des vérifications manuelles coûteuses ou ont posé l’hypothèse restrictive de l’indépendance conditionnelle. Dans le présent article, on assouplit ces exigences en modélisant plutôt le nombre de liens à partir d’un enregistrement. Cette méthode peut aussi être adoptée pour estimer l’exactitude du couplage sans vérifications manuelles, quand on lie deux sources ayant chacune de la sous-couverture.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200008
    Description : Lorsqu’ils souhaitent diffuser des fichiers à grande diffusion pour des données confidentielles, les organismes de statistique peuvent générer des données entièrement synthétiques. Nous proposons une méthode pour construire des données entièrement synthétiques à partir d’enquêtes dont les données sont recueillies selon des plans d’échantillonnage complexes. Notre méthode respecte la stratégie générale proposée par Rubin (1993). Plus précisément, nous générons des pseudo-populations en appliquant la méthode du bootstrap bayésien en population finie pondéré pour tenir compte des poids d’enquête, tirons des échantillons aléatoires simples de ces pseudo-populations, estimons des modèles de synthèse en utilisant ces échantillons aléatoires simples et diffusons des données simulées tirées des modèles sous la forme de fichiers à grande diffusion. Pour faciliter l’estimation de la variance, nous utilisons le cadre d’imputation multiple et deux stratégies de génération de données. Dans la première, nous générons plusieurs ensembles de données à partir de chaque échantillon aléatoire simple. Dans la seconde, nous générons un seul ensemble de données synthétiques à partir de chaque échantillon aléatoire simple. Nous présentons des règles de combinaison de l’imputation multiple pour chaque scénario. Nous illustrons les propriétés d’échantillonnage répété des règles de combinaison au moyen d’études par simulations, ce qui comprend des comparaisons avec la génération de données synthétiques en fonction de méthodes de pseudo-vraisemblance. Nous appliquons les méthodes proposées à un sous-ensemble de données tirées de l’American Community Survey.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200009
    Description : De nombreuses études sont aux prises avec un problème de comparaison d’estimations obtenues à l’aide de différentes méthodologies d’enquête, notamment des différences de base de sondage, d’instruments de mesure et de modes d’exécution. L’enjeu se présente dans les enquêtes multimodales et les enquêtes remaniées. Un remaniement majeur des processus d’enquête pourrait avoir une incidence systématique sur les estimations d’enquêtes; il est donc important de quantifier et d’ajuster de telles discontinuités entre les plans de sondage pour assurer la comparabilité des estimations au fil du temps. Nous proposons une approche d’estimation sur petits domaines pour rapprocher deux ensembles d’estimations d’enquête et l’appliquons à deux enquêtes du Marine Recreational Information Program (MRIP), qui surveille la pêche récréative le long des côtes de l’océan Atlantique et du golfe du Mexique aux États-Unis. Nous développons un modèle log-normal pour les estimations issues des deux enquêtes, en tenant compte de la dynamique temporelle par régression sur la taille de la population et les facteurs saisonniers État-par-vague et en tenant partiellement compte des propriétés de couverture changeantes par régression sur la pénétration du téléphone sans fil. À l’aide des variances de plan de sondage estimées, nous développons un modèle de régression qui est analytiquement cohérent avec le modèle de moyenne log-normal. Nous utilisons les variances de plan de sondage modélisées dans une procédure d’estimation sur petits domaines de Fay-Herriot, afin d’obtenir les meilleurs prédicteurs linéaires sans biais empiriques des estimations rapprochées de l’effort de pêche (nécessitant des prédictions pour de nouveaux ensembles de covariables), et de fournir une approximation asymptotiquement valide de l’erreur quadratique moyenne.
    Date de diffusion : 2024-12-20
Données (10)

Données (10) ((10 résultats))

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2024-12-20

  • Tableau : 89-26-0006
    Description : PASSAGES est un modèle de microsimulation dynamique de source ouverte qui vise à étayer les analyses de politiques et les recherches sur les résultats du régime de revenu de retraite canadien au niveau individuel et familial. La version accessible au public comprend une base de données synthétiques initiale, un modèle et des documents. Une base de données confidentielles initiale est également disponible.
    Date de diffusion : 2024-10-18

  • Microdonnées à grande diffusion : 89F0002X
    Description : La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.
    Date de diffusion : 2024-08-26

  • Visualisation des données : 71-607-X2020010
    Description : L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les ensembles de données géospatiales de Statistique Canada à des niveaux géographiques variés, y compris au niveau des quartiers. Les utilisateurs peuvent visualiser les données, les cartographier thématiquement, les explorer et les analyser spatialement, de même que les exporter et les utiliser dans divers formats. Les utilisateurs peuvent aussi voir ces données superposées à des couches d’imageries satellitaires, des couches topographiques et des couches de rues.
    Date de diffusion : 2024-08-21

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22

  • Visualisation des données : 71-607-X2019010
    Description : Le Visualiseur de données sur le logement est un outil de visualisation qui permet aux utilisateurs d’explorer les données de Statistique Canada sur une carte. Ils peuvent utiliser l’outil pour consulter, comparer et exporter les données.
    Date de diffusion : 2019-10-30

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 13-220-X
    Description : Les Indicateurs nationaux du tourisme ont été parrainés par la Commission canadienne du tourisme, et visent à produire des mises à jour annuelles du Compte satellite du tourisme. Dans l'édition de 1997, ces indicateurs sont ajustés aux nouvelles données repères de 1992 et aux données revisées de 1988. Les indicateurs permettent d'actualiser l'évaluation des composantes du tourisme au Canada que sont l'offre, la demande et l'emploi. Les tableaux annuels sont estimés à l'aide des Comptes nationaux des revenus et dépenses (CRD) et de plusieurs enquêtes portant sur les branches d'activité et les voyages. Ils sont disponibles approximativement quatre semaines après la publication des CRD annuels. Des tableaux montrant les niveaux et les variations en pourcentage des estimations désaisonnalisées aux prix courants et en prix constants sont inclus. De plus, une section analytique avec des graphiques présente les séries chronologiques des premières différences, variations en pourcentage et facteurs saisonniers pour plusieurs indicateurs. La publication, qui présente les données historiques à partir de 1987, sera disponible le jour de la parution. Des nouvelles données concernant les biens et services non touristiques produits par des industries non touristiques sont maintenant incluses dans les tableaux de la demande. De même, des nouvelles données sur l'emploi touristique direct généré par les industries non touristiques sont comprises dans les tableaux sur l'emploi.
    Date de diffusion : 2003-01-08

  • Tableau : 11-516-X
    Description :

    La deuxième édition des Statistiques historiques du Canada a été produite conjointement par la Fédération canadienne des sciences sociales et Statistique Canada, en 1983. Cet ouvrage comprend environ 1 088 tableaux statistiques sur la situation sociale, économique et institutionnelle du Canada, du début de la Confédération, en 1867, au milieu des années 70. Les tableaux sont disposés en sections, lesquelles comportent une introduction qui explique le contenu de chaque section ainsi que les sources principales de données pour chaque tableau, et des notes explicatives générales concernant les statistiques. Dans la plupart des cas, la description des séries individuelles est suffisante pour permettre aux lecteurs de les utiliser sans avoir à consulter les nombreuses sources dont il est fait état dans la publication.

    La version électronique de cette publication historique est accessible dans le site Internet de Statistique Canada, à titre de document téléchargeable sans frais : texte en HTML et tous les tableaux sous forme de chiffriers électroniques individuels en format csv (qui permet le visionnement ou le téléchargement direct).

    Date de diffusion : 1999-07-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29
Analyses (1 914)

Analyses (1 914) (0 à 10 de 1 914 résultats)

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2025-01-23

  • Articles et rapports : 12-001-X202400200001
    Description : La règle de Cochran stipule qu’un intervalle de confiance (de Wald) à 95 % bilatéral standard autour de la moyenne d’un échantillon tiré d’une population présentant une asymétrie positive est raisonnable lorsque la taille de l’échantillon est supérieure à 25 fois le carré du coefficient d’asymétrie de la population. Nous examinons si une variante de cette règle brute s’applique à une proportion estimée à partir d’un échantillon aléatoire simple stratifié.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200002
    Description : Le présent article porte sur la possibilité que la qualité des données d’enquête fluctue au fil de la journée. Après avoir exposé l’argument sur le plan théorique, les données recueillies au moyen d’un panel du Survey of Unemployed Workers in New Jersey (enquête sur les chômeurs au New Jersey) sont analysées. Plusieurs indicateurs indirects de l’erreur de réponse sont examinés, notamment la non-réponse partielle, la durée des interviews, l’arrondissement et les mesures de la qualité des données du journal sur l’emploi du temps. Les données probantes que nous avons rassemblées pour l’effet de l’heure de la journée sur les interviews sont fiables ou inexistantes. La non-réponse partielle et la probabilité que la durée des interviews fasse partie des 5 % des durées les plus courtes semblent augmenter en soirée, mais une évaluation plus détaillée demande de recourir à des variables instrumentales.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200003
    Description : La répartition optimale de l’échantillon dans le cadre d’un échantillonnage stratifié est l’une des questions fondamentales des techniques d’enquête. Il s’agit d’une procédure consistant à diviser la taille globale de l’échantillon en strates de telle sorte que, pour des plans d’échantillonnage donnés dans les strates, la variance de l’estimateur stratifié /pi du total (ou de la moyenne) de la population pour une variable à l’étude donnée atteigne son minimum. Dans le présent travail, nous considérons la répartition optimale d’un échantillon, sous des bornes inférieures et supérieures imposées conjointement sur les tailles d’échantillon dans les strates. Nous nous intéressons à la fonction de variance d’une forme générique qui, en particulier, couvre le cas de l’échantillonnage aléatoire simple sans remise dans les strates. L’objectif du présent document est double. Tout d’abord, nous établissons (à l’aide des conditions de Karush-Kuhn-Tucker) une forme générique de la solution optimale, appelée « conditions d’optimalité ». Ensuite, sur la base des conditions d’optimalité établies, nous dérivons un algorithme récursif efficace, appelé « RNABOX », qui résout le problème de répartition étudié. Le RNABOX peut être considéré comme une généralisation de l’algorithme récursif classique de répartition de Neyman, un outil populaire pour la répartition optimale lorsque seules des bornes supérieures sont imposées à la taille des strates d’échantillonnage. Nous mettons en œuvre le RNABOX dans R dans le cadre de notre paquet stratallo qui est disponible dans le dépôt Comprehensive R Archive Network (CRAN).
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200004
    Description : Tout en évitant de préciser la relation paramétrique entre la variable d’étude et les covariables, nous illustrons l’avantage d’inclure une composante spatiale pour mieux tenir compte des covariables dans nos modèles en vue de faire une inférence prédictive bayésienne. Nous traitons chaque combinaison unique de covariables comme une strate individuelle, puis nous utilisons les techniques d’estimation sur petits domaines pour faire une inférence à propos de la population moyenne finie de la variable de réponse continue. Les deux modèles spatiaux utilisés sont le modèle d’autorégression conditionnel et le modèle d’autorégression conditionnelle simple. Nous incluons les effets spatiaux en créant la matrice d’adjacence à partir de la distance de Mahalanobis entre les covariables. Nous démontrons également la façon d’incorporer les poids d’enquête dans les modèles spatiaux en cas de données d’enquête probabiliste. Nous comparons les résultats des deux modèles non spatiaux, à savoir le modèle Scott-Smith et le modèle Battese, Harter et Fuller, aux modèles spatiaux. Nous illustrons la comparaison entre les deux modèles mentionnés et une application au moyen des données sur l’indice de masse corporelle de huit comtés en Californie. Notre but est d’obtenir des strates voisines donnant des prédictions similaires et d’augmenter la différence entre les strates qui ne sont pas voisines. Finalement, l’utilisation des modèles spatiaux montre un regroupement global moindre par rapport aux modèles non spatiaux, ce qui correspond au résultat souhaité.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200005
    Description : Les plans d’enquête adaptatifs (PEA) permettent d’adapter les protocoles de recrutement aux sous-groupes de population qui présentent un intérêt pour une enquête. Ces dernières années, l’optimisation efficace d’un PEA a fait l’objet de recherches et de plusieurs applications. Toutefois, le rendement d’un PEA optimisé au fil du temps réagit aux variations temporelles des propensions à répondre. On ne comprend pas encore entièrement la façon dont les stratégies d’adaptation peuvent s’adapter à une telle variation au fil du temps. Dans la présente étude, nous proposons une approche d’optimisation robuste dans le contexte d’enquêtes séquentielles multimodales à l’aide d’une analyse bayésienne. Cette approche s’exprime sous la forme d’un problème de programmation mathématique qui tient explicitement compte de l’incertitude attribuable à la variation temporelle. Des décisions en matière de PEA peuvent alors être prises en tenant compte de la variation chronologique de la propension à répondre conditionnelle au mode et des corrélations de la propension à répondre entre les modes. La démonstration de cette approche fait appel à une étude de cas : l’Enquête sur la santé aux Pays-Bas de 2014 à 2017. Nous évaluons la sensibilité du rendement des PEA 1) au niveau budgétaire et 2) à la durée des données de série chronologique historiques applicables. Nous concluons que la dépendance au niveau budgétaire n’est que modérée et que la dépendance aux données historiques est tempérée par le degré de saisonnalité au cours de l’année.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200006
    Description : À mesure que les plans de sondage à mode mixte deviennent de plus en plus populaires, leurs effets sur la qualité des données ont attiré l’attention de plusieurs chercheurs. La plupart des études se sont concentrées sur les propriétés de biais des plans de sondage à mode mixte; peu d’entre elles ont cherché à savoir si les plans de sondage à mode mixte ont des structures de variance hétérogènes entre les modes. Bien que de nombreuses caractéristiques des plans de sondage à mode mixte, comme l’utilisation d’intervieweurs variés, les différences systématiques entre les répondants, les différents niveaux de biais dû à la désirabilité sociale, entre autres, peuvent conduire à des variances hétérogènes dans les estimations ponctuelles des moyennes de population propre à un mode, la présente étude permet d’examiner précisément si les variances de l’intervieweur demeurent cohérentes entre les différents modes dans les études multimodales. Pour répondre à cette question de recherche, nous utilisons les données recueillies grâce à deux modèles d’études distincts. Dans le premier modèle, lorsque les intervieweurs sont responsables soit du mode face à face, soit du mode téléphonique, nous examinons s’il y a des différences de mode dans les variances de l’intervieweur pour : 1) les questions politiques de nature délicate; 2) les éléments internationaux; 3) les indicateurs d’éléments manquants sur des éléments internationaux, grâce aux données sur la Jordanie de la vague 6 de l’Arab Barometer. Dans le deuxième modèle, nous nous appuyons sur les données de base de la Health and Retirement Study (HRS) de 2016 pour examiner la question sur trois sujets lorsque les intervieweurs sont responsables des deux modes. Les sujets traités comprennent : 1) l’échelle d’évaluation de la dépression du Center for Epidemiological Studies-Depression (CES-D); 2) les observations des intervieweurs; 3) l’échelle d’activité physique. Pour tenir compte du manque de plans de sondage interpénétrés dans les deux sources de données, nous incluons des covariables au niveau du répondant dans nos modèles. Nous constatons des différences importantes dans les variances de l’intervieweur sur un élément (12 éléments au total) dans l’enquête de l’Arab Barometer, alors que pour la HRS, les résultats sont de 3 sur 18. Dans l’ensemble, nous constatons que l’ampleur des variances de l’intervieweur est plus grande en personne que par téléphone pour les éléments de nature délicate. Nous effectuons des simulations pour comprendre le pouvoir de détecter les effets du mode d’enquête dans les tailles d’échantillons typiquement modestes de l’intervieweur.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200008
    Description : Lorsqu’ils souhaitent diffuser des fichiers à grande diffusion pour des données confidentielles, les organismes de statistique peuvent générer des données entièrement synthétiques. Nous proposons une méthode pour construire des données entièrement synthétiques à partir d’enquêtes dont les données sont recueillies selon des plans d’échantillonnage complexes. Notre méthode respecte la stratégie générale proposée par Rubin (1993). Plus précisément, nous générons des pseudo-populations en appliquant la méthode du bootstrap bayésien en population finie pondéré pour tenir compte des poids d’enquête, tirons des échantillons aléatoires simples de ces pseudo-populations, estimons des modèles de synthèse en utilisant ces échantillons aléatoires simples et diffusons des données simulées tirées des modèles sous la forme de fichiers à grande diffusion. Pour faciliter l’estimation de la variance, nous utilisons le cadre d’imputation multiple et deux stratégies de génération de données. Dans la première, nous générons plusieurs ensembles de données à partir de chaque échantillon aléatoire simple. Dans la seconde, nous générons un seul ensemble de données synthétiques à partir de chaque échantillon aléatoire simple. Nous présentons des règles de combinaison de l’imputation multiple pour chaque scénario. Nous illustrons les propriétés d’échantillonnage répété des règles de combinaison au moyen d’études par simulations, ce qui comprend des comparaisons avec la génération de données synthétiques en fonction de méthodes de pseudo-vraisemblance. Nous appliquons les méthodes proposées à un sous-ensemble de données tirées de l’American Community Survey.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200009
    Description : De nombreuses études sont aux prises avec un problème de comparaison d’estimations obtenues à l’aide de différentes méthodologies d’enquête, notamment des différences de base de sondage, d’instruments de mesure et de modes d’exécution. L’enjeu se présente dans les enquêtes multimodales et les enquêtes remaniées. Un remaniement majeur des processus d’enquête pourrait avoir une incidence systématique sur les estimations d’enquêtes; il est donc important de quantifier et d’ajuster de telles discontinuités entre les plans de sondage pour assurer la comparabilité des estimations au fil du temps. Nous proposons une approche d’estimation sur petits domaines pour rapprocher deux ensembles d’estimations d’enquête et l’appliquons à deux enquêtes du Marine Recreational Information Program (MRIP), qui surveille la pêche récréative le long des côtes de l’océan Atlantique et du golfe du Mexique aux États-Unis. Nous développons un modèle log-normal pour les estimations issues des deux enquêtes, en tenant compte de la dynamique temporelle par régression sur la taille de la population et les facteurs saisonniers État-par-vague et en tenant partiellement compte des propriétés de couverture changeantes par régression sur la pénétration du téléphone sans fil. À l’aide des variances de plan de sondage estimées, nous développons un modèle de régression qui est analytiquement cohérent avec le modèle de moyenne log-normal. Nous utilisons les variances de plan de sondage modélisées dans une procédure d’estimation sur petits domaines de Fay-Herriot, afin d’obtenir les meilleurs prédicteurs linéaires sans biais empiriques des estimations rapprochées de l’effort de pêche (nécessitant des prédictions pour de nouveaux ensembles de covariables), et de fournir une approximation asymptotiquement valide de l’erreur quadratique moyenne.
    Date de diffusion : 2024-12-20

  • Articles et rapports : 12-001-X202400200010
    Description : Des travaux récents sur l’estimation des domaines d’enquête ont montré que l’intégration a priori d’hypothèses sur l’ordonnancement des moyennes des domaines de population réduit la variance des estimateurs et fournit des intervalles de confiance plus petits ayant une bonne couverture. Dans le présent document, nous montrons dans quelle mesure les hypothèses d’ordonnancement partiel permettent une estimation fondée sur un modèle des moyennes d’échantillon dans des domaines pour lesquels la taille de l’échantillon est nulle, lorsque les estimations de la variance et les intervalles de confiance sont conservateurs. Les restrictions d’ordre peuvent également améliorer considérablement l’estimation et l’inférence dans les domaines de petite taille. Des exemples de données d’enquêtes bien connues démontrent l’utilité de ces méthodes. Le code permettant de mettre en œuvre les exemples à l’aide du paquet R csurvey est fourni en annexe.
    Date de diffusion : 2024-12-20
Références (368)

Références (368) (0 à 10 de 368 résultats)

  • Enquêtes et programmes statistiques — Documentation : 89-657-X2024009
    Description : Le guide de l’utilisateur de l’Enquête sur la population de langue officielle en situation minoritaire (EPLOSM) contient une description de l’enquête, ainsi que les concepts et définitions de l’enquête et un survol de l’élaboration du contenu. La population cible, la population observée, le plan de sondage et la taille de l’échantillons sont décrits dans la section de la Méthodologie. Finalement, dans le module de collecte de données, la période, l’instrument et les modes de collecte, les stratégies de collecte et de communication et les taux de réponse sont fournies.
    Date de diffusion : 2024-12-16

  • Avis et consultations : 13-605-X
    Description : Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.
    Date de diffusion : 2024-12-12

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2024005
    Description : La Direction des études analytiques et de la modélisation (DEAM) est le centre de la recherche, de la modélisation, de la formation et de l’accès de Statistique Canada. Elle est axée sur l’utilisation des vastes fonds de données de l’organisme afin de produire des renseignements détaillés à l’appui de la prise de décisions fondées sur des données probantes et permettant aux autres d’en faire autant au moyen de la formation analytique et de l’accès aux données. La DEAM, comme les autres secteurs de programme de l’organisme, s’emploie à soutenir la mission globale de Statistique Canada, qui consiste à éclairer grâce aux données pour bâtir un Canada meilleur.
    Date de diffusion : 2024-12-06

  • Enquêtes et programmes statistiques — Documentation : 98-303-X
    Description : Le Rapport technique sur la couverture présentera les erreurs qui sont comprises dans les données du recensement du fait que des personnes sont omises (non dénombrées) ou sont dénombrées plus d’une fois. L’erreur de couverture de la population figure parmi les erreurs les plus importantes, car elle a une incidence sur l’exactitude non seulement des chiffres de population, mais également de tous les résultats des données du recensement décrivant les caractéristiques de l’univers de la population.
    Date de diffusion : 2024-10-23

  • Enquêtes et programmes statistiques — Documentation : 89-653-X2024002
    Description : Ce guide vise à fournir un compte rendu détaillé des approches spécialisées et méthodologiques de l’EAPA et l’EAPA–SIN de 2022. Conçu pour les utilisateurs de données de l’EAPA et l’EAPA–SIN, ce guide décrit les concepts et les mesures de l’enquête, tout en abordant les détails techniques de la conception, les travaux sur le terrain et le traitement des données. Ce guide a pour objectif de fournir aux utilisateurs des renseignements utiles sur la façon d’utiliser et d’interpréter les résultats de l’enquête. De plus, une analyse de la qualité des données permet aux utilisateurs d’examiner les forces et les limites des données en fonction de leurs besoins particuliers.

    La section 1 du présent guide donne un aperçu de l’EAPA et de l’EAPA–SIN de 2022. Le contexte et les objectifs de l’enquête y sont également abordés. La section 2 traite des thèmes de l’EAPA et explique les principaux concepts et définitions utilisés dans le cadre de l’enquête. Les sections 3 à 6 portent sur des aspects importants de la méthodologie d’enquête, du plan d’échantillonnage, de la collecte des données et du traitement des données. Dans les sections 7 et 8, il est question des problèmes liés à la qualité des données et l’on met en garde les utilisateurs en ce qui a trait à la comparaison des données de l’EAPA ou de l’EAPA–SIN de 2022 avec celles issues d’autres sources. La section 9 présente les produits de l’enquête qui sont offerts au public, y compris les tableaux de données, les articles analytiques et les documents de référence. Les annexes fournissent une liste exhaustive des indicateurs de l’enquête, des catégories supplémentaires de codage et des classifications types utilisées dans le cadre de l’EAPA et l’EAPA–SIN. Enfin, on y trouve également un glossaire des termes relatifs à l’enquête ainsi que de l’information sur les intervalles de confiance.
    Date de diffusion : 2024-08-14

  • Enquêtes et programmes statistiques — Documentation : 75-514-G
    Description : Le Guide de l'Enquête sur les postes vacants et les salaires contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données et la qualité des données. Le guide porte sur les deux volets de l'enquête, soit le volet sur les postes vacants, dont la fréquence est trimestrielle, et le volet sur les salaires, dont la fréquence est annuelle.
    Date de diffusion : 2024-06-18

  • Enquêtes et programmes statistiques — Documentation : 32-26-0007
    Description : Les données du Recensement de l’agriculture fournissent des renseignements statistiques sur les exploitations et les exploitants agricoles à des niveaux géographiques fins et pour de petites sous–populations. Des activités d’évaluation de la qualité sont essentielles pour s’assurer que les données du recensement sont fiables et qu’elles répondent aux besoins des utilisateurs.

    Ce rapport fournit des renseignements sur la qualité des données relatives au Recensement de l’agriculture, comme les sources d’erreur, la détection des erreurs, les méthodes de contrôle de la divulgation, les indicateurs de la qualité des données, les taux de réponse et les taux de collecte.
    Date de diffusion : 2024-02-06

  • Enquêtes et programmes statistiques — Documentation : 75-005-M2023001
    Description : Ce document fournit des informations sur l'évolution des taux de réponse de l'Enquête sur la population active (EPA) et une discussion de l'évaluation de deux aspects de la qualité des données qui garantissent que les estimations de l'EPA continuent à fournir un portrait précis du marché du travail canadien.
    Date de diffusion : 2023-10-30

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2023-10-04

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

Browse our partners page to find a complete list of our partners and their associated products.

Date de modification :