Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Enquête ou programme statistique

112 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (2 295)

Tout (2 295) (0 à 10 de 2 295 résultats)

  • Microdonnées à grande diffusion : 89F0002X
    Description : La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.
    Date de diffusion : 2024-04-12

  • Articles et rapports : 11-522-X202200100001
    Description : Le couplage d’enregistrements vise à mettre en évidence les paires d’enregistrements liées à la même unité et observées dans deux ensembles de données différents, disons A et B. Fellegi et Sunter (1969) proposent de mettre à l’essai chaque paire d’enregistrements, qu’elle soit générée à partir de l’ensemble de paires appariées ou non. La fonction de décision est le rapport entre m(y) et u(y), les probabilités d’observer une comparaison y d’un ensemble de k>3 variables d’identification clés dans une paire d’enregistrements, sous l’hypothèse que la paire constitue, respectivement, un appariement ou non. On estime habituellement ces paramètres au moyen de l’algorithme EM en utilisant comme données les comparaisons pour toutes les paires du produit cartésien ?=A×B. On émet l’hypothèse que ces observations (sur les comparaisons et sur l’état des paires comme appariement ou non) sont générées indépendamment des autres paires, hypothèse caractérisant la majeure partie de la littérature sur le couplage d’enregistrements et mise en œuvre dans les outils logiciels (p. ex., RELAIS, Cibella et coll. 2012). Au contraire, les comparaisons y et l’état d’appariement dans O sont dépendants de manière déterministe. Par conséquent, les estimations sur m(y) et u(y) fondées sur l’algorithme EM sont généralement mauvaises. Ce fait compromet l’efficacité de l’application de la méthode de Fellegi-Sunter, ainsi que le calcul automatique des mesures de la qualité et la possibilité d’appliquer des méthodes efficaces aux fins d’estimation du modèle sur des données couplées (p. ex. les fonctions de régression), comme dans Chambers et coll. (2015). Nous proposons d’examiner O au moyen d’un ensemble d’échantillons, chacun tiré de manière à préserver l’indépendance des comparaisons entre les paires d’enregistrements sélectionnées. Les simulations sont encourageantes.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100002
    Description : Les auteures ont utilisé le progiciel de couplage probabiliste Splink mis au point par le ministère de la Justice du Royaume-Uni pour relier les données du recensement de l’Angleterre et du pays de Galles à elles-mêmes afin de trouver des réponses en double au recensement. Un grand ensemble étalon-or des doublons confirmés du recensement était disponible, ce qui signifiait que la qualité des résultats de la mise en œuvre de Splink pouvait être assurée. Le présent article décrit la mise en œuvre et les fonctionnalités de Splink, donne des détails sur les configurations et les paramètres que nous avons utilisés pour ajuster Splink à notre projet en particulier, et donne les résultats que nous avons obtenus.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100003
    Description : L’estimation à de fins niveaux d’agrégation est nécessaire pour mieux décrire une société. Les approches fondées sur un modèle d’estimation sur petits domaines qui combinent des données d’enquête parcimonieuses à des données riches provenant de sources auxiliaires se sont révélées utiles pour améliorer la fiabilité des estimations sur petits domaines. Nous examinons ici un scénario où des estimations basées sur un modèle pour petits domaines, produit à un niveau d’agrégation donné, devaient être désagrégées pour mieux décrire la structure sociale à des niveaux plus fins. Pour ce scénario, nous avons élaboré une méthode de répartition afin de mettre en œuvre la désagrégation, surmontant les problèmes associés à la disponibilité des données et à l’élaboration de modèles à des niveaux de cette finesse. La méthode est appliquée à l’estimation de la littératie et de la numératie des adultes au niveau du comté par groupe, au moyen des données du Programme pour l’évaluation internationale des compétences des adultes (PEICA) des États-Unis. Dans cette application, les groupes sont définis en fonction de l’âge ou de la scolarité, mais la méthode pourrait être appliquée à l’estimation d’autres groupes en quête d’équité.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100004
    Description : Conformément au Plan d’action sur les données désagrégées (PADD) à long terme de Statistique Canada, plusieurs initiatives ont été mises en œuvre dans l’Enquête sur la population active (EPA). Une des initiatives les plus directes fut une augmentation ciblée dans la taille de l’échantillon mensuel de l’EPA. En outre, un programme d’enquête supplémentaire régulier a été introduit, où une série supplémentaire de questions a été posée à un sous-ensemble de répondants de l’EPA et analysée dans un cycle de production mensuel ou trimestriel. Enfin, les estimations fondées sur les méthodologies de l’estimation sur petits domaines (EPD) sont réintroduites dans l’EPA et comprendront une portée élargie avec davantage de valeur analytique qu’auparavant. Le présent article donne un aperçu de ces trois initiatives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100005
    Description : Le lissage de la variance due à l’échantillonnage est un sujet important dans l’estimation sur petits domaines. Dans le présent article, nous proposons des méthodes de lissage de la variance due à l’échantillonnage aux fins d’estimation sur petits domaines. En particulier, nous considérons la fonction de variance généralisée et les méthodes d’effet de plan aux fins de lissage de la variance due à l’échantillonnage. Nous évaluons et comparons les variances dues à l’échantillonnage lissées et les estimations sur petits domaines fondées sur des estimations de la variance lissées au moyen de l’analyse de données d’enquête de Statistique Canada. Les résultats de l’analyse de données réelles indiquent que les méthodes de lissage de la variance due à l’échantillonnage proposées fonctionnent très bien pour l’estimation sur petits domaines.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100006
    Description : L’ABS (Bureau de la statistique de l’Australie) s’est engagé à offrir un meilleur accès à un plus grand nombre de microdonnées, tout en assurant la protection des renseignements personnels et la confidentialité, grâce à son DataLab (laboratoire de données) virtuel qui aide à entreprendre des recherches complexes plus efficacement. À l’heure actuelle, pour être autorisées, les données de sortie de recherche de DataLab doivent respecter des règles strictes afin de minimiser les risques de divulgation. Or le processus d’examen manuel n’est pas rentable et peut entraîner des erreurs. Le nombre croissant de résultats statistiques provenant de différents projets peut introduire des risques de divulgation résiduelle même si ces résultats de différents projets ont respecté des règles strictes en matière de sorties. L’ABS étudie la possibilité de fournir une vérification automatique des sorties au moyen de la méthodologie de la clé de cellule de l’ABS pour s’assurer que toutes les sorties des différents projets sont protégées de façon uniforme afin de minimiser les risques de divulgation résiduelle et de réduire les coûts associés à la vérification des sorties.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100007
    Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100009
    Description : L’éducation et la formation sont reconnues comme des éléments fondamentaux du développement d’une société. Il s’agit d’un phénomène multidimensionnel complexe, dont les déterminants sont attribuables à plusieurs conditions sociales et socioéconomiques interdépendantes. Pour répondre à la demande de renseignements statistiques à l’appui de l’élaboration des politiques et de leurs processus de suivi et d’évaluation, l’Institut national italien de statistique (Istat) renouvelle le système de production de statistiques sur l’éducation et la formation en mettant en œuvre un nouveau registre statistique thématique. Ce dernier fera partie du système intégré de registres de l’Istat, ce qui permettra de relier le phénomène de l’éducation et de la formation à d’autres phénomènes pertinents, comme la transition vers le marché du travail.
    Date de diffusion : 2024-03-25
Données (9)

Données (9) ((9 résultats))

  • Microdonnées à grande diffusion : 89F0002X
    Description : La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.
    Date de diffusion : 2024-04-12

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2023-12-19

  • Visualisation des données : 71-607-X2020010
    Description : L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les ensembles de données géospatiales de Statistique Canada à des niveaux géographiques variés, y compris au niveau des quartiers. Les utilisateurs peuvent visualiser les données, les cartographier thématiquement, les explorer et les analyser spatialement, de même que les exporter et les utiliser dans divers formats. Les utilisateurs peuvent aussi voir ces données superposées à des couches d’imageries satellitaires, des couches topographiques et des couches de rues.
    Date de diffusion : 2023-01-24

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22

  • Visualisation des données : 71-607-X2019010
    Description : Le Visualiseur de données sur le logement est un outil de visualisation qui permet aux utilisateurs d’explorer les données de Statistique Canada sur une carte. Ils peuvent utiliser l’outil pour consulter, comparer et exporter les données.
    Date de diffusion : 2019-10-30

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 13-220-X
    Description : Les Indicateurs nationaux du tourisme ont été parrainés par la Commission canadienne du tourisme, et visent à produire des mises à jour annuelles du Compte satellite du tourisme. Dans l'édition de 1997, ces indicateurs sont ajustés aux nouvelles données repères de 1992 et aux données revisées de 1988. Les indicateurs permettent d'actualiser l'évaluation des composantes du tourisme au Canada que sont l'offre, la demande et l'emploi. Les tableaux annuels sont estimés à l'aide des Comptes nationaux des revenus et dépenses (CRD) et de plusieurs enquêtes portant sur les branches d'activité et les voyages. Ils sont disponibles approximativement quatre semaines après la publication des CRD annuels. Des tableaux montrant les niveaux et les variations en pourcentage des estimations désaisonnalisées aux prix courants et en prix constants sont inclus. De plus, une section analytique avec des graphiques présente les séries chronologiques des premières différences, variations en pourcentage et facteurs saisonniers pour plusieurs indicateurs. La publication, qui présente les données historiques à partir de 1987, sera disponible le jour de la parution. Des nouvelles données concernant les biens et services non touristiques produits par des industries non touristiques sont maintenant incluses dans les tableaux de la demande. De même, des nouvelles données sur l'emploi touristique direct généré par les industries non touristiques sont comprises dans les tableaux sur l'emploi.
    Date de diffusion : 2003-01-08

  • Tableau : 11-516-X
    Description :

    La deuxième édition des Statistiques historiques du Canada a été produite conjointement par la Fédération canadienne des sciences sociales et Statistique Canada, en 1983. Cet ouvrage comprend environ 1 088 tableaux statistiques sur la situation sociale, économique et institutionnelle du Canada, du début de la Confédération, en 1867, au milieu des années 70. Les tableaux sont disposés en sections, lesquelles comportent une introduction qui explique le contenu de chaque section ainsi que les sources principales de données pour chaque tableau, et des notes explicatives générales concernant les statistiques. Dans la plupart des cas, la description des séries individuelles est suffisante pour permettre aux lecteurs de les utiliser sans avoir à consulter les nombreuses sources dont il est fait état dans la publication.

    La version électronique de cette publication historique est accessible dans le site Internet de Statistique Canada, à titre de document téléchargeable sans frais : texte en HTML et tous les tableaux sous forme de chiffriers électroniques individuels en format csv (qui permet le visionnement ou le téléchargement direct).

    Date de diffusion : 1999-07-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29
Analyses (1 871)

Analyses (1 871) (20 à 30 de 1 871 résultats)

  • Revues et périodiques : 75F0002M
    Description : Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.
    Date de diffusion : 2024-02-22

  • Articles et rapports : 75-005-M2024001
    Description : De 2010 à 2019, le taux de réponse à l’Enquête sur la population active (EPA) – ou la proportion de ménages sélectionnés ayant répondu à une interview de l’EPA – avait suivi une lente tendance à la baisse, en raison d'une série de changements sociaux et technologiques qui ont rendu plus difficiles les efforts visant à contacter les ménages sélectionnés et à les persuader de participer une fois qu’ils sont contactés. Ces facteurs ont été exacerbés par la pandémie de COVID-19, qui a entraîné la suspension des entretiens en personne entre avril 2020 et l'automne 2022. Statistique Canada s'engage à rétablir les taux de réponse de l'EPA dans toute la mesure du possible. Ce document technique traite de deux initiatives en cours pour s’assurer que les estimations de l'EPA continuent à fournir un portrait précis et représentatif du marché du travail canadien.
    Date de diffusion : 2024-02-16

  • Articles et rapports : 75F0002M2024002
    Description : Ce document de discussion décrit les considérations relatives à l'application de la méthodologie de la mesure du panier de consommation (MPC) à une source de données purement administrative. Le document commence par exposer les raisons qui justifient l'utilisation de données administratives sur le revenu pour la production de statistiques de pauvreté à l’aide de la MPC. Il décrit ensuite une proposition pour la création d'échantillons annuels et certaines mises en garde relatives à la création de ces échantillons, suivies d'une brève analyse utilisant les échantillons proposés. Le document conclut sur les améliorations potentielles à apporter aux échantillons et donne l'occasion aux lecteurs de faire part de leurs commentaires.
    Date de diffusion : 2024-02-08

  • Stats en bref : 11-637-X
    Description : Ce produit présente des données sur les objectifs de développement durable. Ils présentent un aperçu des 17 objectifs à l’aide d’infographies en utilisant les données disponibles pour faire rapport du progrès du Canada vis-à-vis le Programme de développement durable à l'horizon 2030.
    Date de diffusion : 2024-01-25

  • Articles et rapports : 13-604-M2024001
    Description : Cette documentation donne un aperçu de la méthodologie utilisée pour élaborer les comptes économiques répartis pour le secteur des ménages publiés en janvier 2024 pour les années de références de 2010 à 2023. Elle présente le cadre et les étapes de la production de renseignements sur les répartitions qui sont conformes aux Comptes du Bilan National et à d'autres concepts liés aux comptes nationaux. Elle inclut également un rapport sur la qualité des répartitions estimées.
    Date de diffusion : 2024-01-22

  • Stats en bref : 11-001-X202402237898
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2024-01-22

  • Articles et rapports : 11-633-X2024001
    Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.
    Date de diffusion : 2024-01-22

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2024-01-22

  • Articles et rapports : 12-001-X202300200001
    Description : Lorsqu’un fournisseur de soins de santé de Medicare est soupçonné de fraude liée à la facturation, on isole une population de paiements X versés à ce fournisseur sur une certaine période. Un examinateur médical agréé peut, dans un long processus, établir le trop-payé Y = X - (montant justifié par la preuve) pour chaque paiement. En temps normal, il y aura trop de paiements dans une population pour que chacun soit examiné avec soin, aussi prélève-t-on un échantillon probabiliste. Les trop-payés de cet échantillon servent alors à calculer une borne inférieure de l’intervalle de confiance de 90 % pour le trop-payé total de cette population. La borne correspond au montant exigé en recouvrement auprès du fournisseur. Malheureusement, les méthodes classiques de calcul de cette borne ne permettent parfois pas de dégager le niveau de confiance de 90 %, plus particulièrement lorsqu’on utilise un échantillon stratifié.

    Dans le présent document, nous présentons et décrivons 166 échantillons épurés tirés des enquêtes au sujet de l’intégrité de Medicare qui comportent 156 populations de paiements correspondantes. Les 7 588 paires échantillonnées (Y, X) indiquent 1) que les vérifications réalisées au sein de Medicare affichent des taux d’erreur élevés : plus de 76 % des paiements en question sont considérés comme étant des erreurs. Elles indiquent aussi 2) que les configurations de ces échantillons vont dans le sens d’un modèle de mélange « tout ou rien » pour (Y, X) qui est déjà défini dans les études spécialisées. Nous analysons des procédures de test de Monte Carlo fondées sur un modèle pour les plans de sondage de Medicare, ainsi que des méthodes de stratification fondées sur les moments anticipés du modèle. Pour la viabilité (atteinte d’un niveau de confiance de 90 %), nous définissons dans le présent article une nouvelle méthode de stratification qui rivalise avec les meilleures parmi de nombreuses méthodes existantes et qui semble moins sensible au choix de paramètres d’exploitation. Pour ce qui est du recouvrement des trop-payés (ce qui équivaut à une mesure de la précision), la nouvelle méthode se compare aussi aux meilleures parmi les nombreuses méthodes expérimentées. Malheureusement, aucun algorithme de stratification mis à l’essai ne s’est révélé viable pour plus de la moitié environ des 104 populations visées par l’essai.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200002
    Description : Il est essentiel de pouvoir quantifier l’exactitude (biais, variance) des résultats publiés dans les statistiques officielles. Dans ces dernières, les résultats sont presque toujours divisés en sous-populations selon une variable de classification, comme le revenu moyen par catégorie de niveau de scolarité. Ces résultats sont également appelés « statistiques de domaine ». Dans le présent article, nous nous limitons aux variables de classification binaire. En pratique, des erreurs de classification se produisent et contribuent au biais et à la variance des statistiques de domaine. Les méthodes analytiques et numériques servant actuellement à estimer cet effet présentent deux inconvénients. Le premier inconvénient est qu’elles exigent que les probabilités de classification erronée soient connues au préalable et le deuxième est que les estimations du biais et de la variance sont elles-mêmes biaisées. Dans le présent article, nous présentons une nouvelle méthode, un modèle de mélange gaussien estimé par un algorithme espérance-maximisation (EM) combiné à un bootstrap, appelé « méthode bootstrap EM ». Cette nouvelle méthode n’exige pas que les probabilités de classification erronée soient connues au préalable, bien qu’elle soit plus efficace quand on utilise un petit échantillon de vérification qui donne une valeur de départ pour les probabilités de classification erronée dans l’algorithme EM. Nous avons comparé le rendement de la nouvelle méthode et celui des méthodes numériques actuellement disponibles, à savoir la méthode bootstrap et la méthode SIMEX. Des études antérieures ont démontré que pour les paramètres non linéaires, le bootstrap donne de meilleurs résultats que les expressions analytiques. Pour presque toutes les conditions mises à l’essai, les estimations du biais et de la variance obtenues par la méthode bootstrap EM sont plus proches de leurs vraies valeurs que celles obtenues par les méthodes bootstrap et SIMEX. Nous terminons l’article par une discussion sur les résultats et d’éventuels prolongements de la méthode.
    Date de diffusion : 2024-01-03
Références (363)

Références (363) (0 à 10 de 363 résultats)

  • Avis et consultations : 13-605-X
    Description : Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.
    Date de diffusion : 2024-02-29

  • Enquêtes et programmes statistiques — Documentation : 32-26-0007
    Description : Les données du Recensement de l’agriculture fournissent des renseignements statistiques sur les exploitations et les exploitants agricoles à des niveaux géographiques fins et pour de petites sous–populations. Des activités d’évaluation de la qualité sont essentielles pour s’assurer que les données du recensement sont fiables et qu’elles répondent aux besoins des utilisateurs.

    Ce rapport fournit des renseignements sur la qualité des données relatives au Recensement de l’agriculture, comme les sources d’erreur, la détection des erreurs, les méthodes de contrôle de la divulgation, les indicateurs de la qualité des données, les taux de réponse et les taux de collecte.
    Date de diffusion : 2024-02-06

  • Enquêtes et programmes statistiques — Documentation : 75-005-M2023001
    Description : Ce document fournit des informations sur l'évolution des taux de réponse de l'Enquête sur la population active (EPA) et une discussion de l'évaluation de deux aspects de la qualité des données qui garantissent que les estimations de l'EPA continuent à fournir un portrait précis du marché du travail canadien.
    Date de diffusion : 2023-10-30

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2023-10-04

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

  • Enquêtes et programmes statistiques — Documentation : 32-26-0006
    Description : Ce rapport fournit des renseignements sur la qualité des données relatives au Couplage agriculture–population, comme les sources d’erreur, le processus d’appariement, les taux de réponse, les taux d’imputation, l’échantillonnage, la pondération, les méthodes de contrôle de la divulgation et les indicateurs de la qualité des données.
    Date de diffusion : 2023-08-25

  • Enquêtes et programmes statistiques — Documentation : 75-514-G
    Description : Le Guide de l'Enquête sur les postes vacants et les salaires contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données et la qualité des données. Le guide porte sur les deux volets de l'enquête, soit le volet sur les postes vacants, dont la fréquence est trimestrielle, et le volet sur les salaires, dont la fréquence est annuelle.
    Date de diffusion : 2023-05-25

  • Enquêtes et programmes statistiques — Documentation : 32-26-0002
    Description :

    Ce guide de référence peut être utile à la fois pour les nouveaux utilisateurs et pour les utilisateurs expérimentés qui désirent se familiariser avec le Recensement de l'agriculture et trouver des renseignements détaillés sur celui-ci.

    Le guide fournit un aperçu des activités de communication, de détermination du contenu, de collecte, de traitement, d'évaluation de la qualité des données et de diffusion du Recensement de l'agriculture, en plus de fournir une description sommaire des principaux changements apportés au recensement et d'autres informations utiles.

    Date de diffusion : 2022-04-14

  • Fichiers et documentation sur la géographie : 12-572-X
    Description :

    La Classification géographique type (CGT) fournit une structure de classification systématique pour toutes les régions géographiques au Canada. La CGT est le système de classification officielle utilisé pour le Recensement de la population et d’autres enquêtes de Statistique Canada.

    La classification est divisée en deux volumes, soit le volume I, La classification et le volume II, Cartes de référence.

    Le volume II renferme des cartes de référence indiquant les limites, les noms, les codes et l'emplacement des régions géographiques figurant dans la classification. Les cartes de référence montrent les subdivisions de recensement, les divisions de recensement, les régions métropolitaines de recensement, les agglomérations de recensement, les zones d'influence métropolitaine de recensement et les régions économiques. Les définitions de ces termes se trouvent dans le Volume I, La classification. Le volume I renferme une description de la classification et des régions géographiques normalisées connexes et comprend les noms de localité.

    Les cartes du volume II peuvent être téléchargées en format PDF à partir de notre site Web.

    Date de diffusion : 2022-02-09

  • Enquêtes et programmes statistiques — Documentation : 12-004-X
    Description :

    Les statistiques : le pouvoir des données! est une ressource Web créée en 2001 pour aider les étudiants du secondaire et les enseignants de mathématiques et de sciences de l’information à soutirer le maximum des statistiques. Au cours des 20 dernières années, ce produit est devenu l’une des références les plus populaires de Statistique Canada chez les étudiants, les enseignants et beaucoup d’autres membres de la population générale. Ce produit a été mis à jour la dernière fois en 2021.

    Date de diffusion : 2021-09-02
Date de modification :