Méthodes statistiques

Indicateurs clés

Toute modification apportera automatiquement une mise à jour au contenu de la page.

Région géographique choisie : Canada

Région géographique choisie : Terre Neuve et Labrador

Région géographique choisie : Île-du-Prince-Edouard

Région géographique choisie : Nouvelle-Écosse

Région géographique choisie : Nouveau-Brunswick

Région géographique choisie : Québec

Région géographique choisie : Ontario

Région géographique choisie : Manitoba

Région géographique choisie : Saskatchewan

Région géographique choisie : Alberta

Région géographique choisie : Colombie-Britannique

Région géographique choisie : Yukon

Région géographique choisie : Territoires du Nord-Ouest

Région géographique choisie : Nunavut

Aide à l'ordre
entrées

Résultats

Tout (2 295)

Tout (2 295) (2 140 à 2 150 de 2 295 résultats)

  • Articles et rapports : 12-001-X198800114597
    Description :

    Le U.S. Bureau of the Census aura recours à une enquête post-censitaire pour évaluer le taux de couverture du recensement décennal de 1990. Cet article décrit les nouvelles méthodes que le Bureau a mises au point et expérimentées pour accroître le degré de précision des estimations de cette enquête. Il étudie aussi les catégories d’erreur qui surviennent dans une enquête post-censitaire de même que les moyens qui permettent de juger de l’exactitude des résultats. À cette fin, les auteurs se servent d’une enquête post-censitaire qui a été réalisée récemment à titre expérimental.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114598
    Description :

    Cet article porte sur les méthodes de traitement des données manquantes dans les enquêtes postcensitaires en vue de l’estimation de l’erreur de couverture dans le recensement; à titre d’illustration, nous analysons le test des opérations de redressement de 1986 (Diffendal 1988). Les méthodes précitées comprennent des méthodes d’imputation fondées sur le hot-deck et des modèles de régression logistique de même que des méthodes de redressement par la pondération. Nous analysons également la sensibilité des estimations de sous-dénombrement tirées du test de 1986 à la variation des modèles d’imputation.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114599
    Description :

    En vue du recensement décennal de 1990, le Census Bureau a étudié la possibilité de redresser les chiffres du recensement pour tenir compte du taux de sous-dénombrement estimé. À cette fin, il a exécuté un recensement d’essai dans un secteur à majorité hispanique du Central Los Angeles County afin de vérifier le calendrier et les caractéristiques des opérations de redressement réalisées au moyen d’une enquête post-censitaire (EP). Cet article vise à exposer les méthodes qui ont été utilisées pour produire des données de recensement qui tiennent compte de la population non dénombrée; on y trouve également les résultats de l’application de ces méthodes. Les méthodes utilisées pour le redressement des données de recensement comprenaient l’élaboration d’un plan de sondage, l’estimation « bivalente » et le calcul d’estimations régionales. Le plan de sondage prévoyait un échantillon d’îlots stratifiés selon l’origine ethnique. L’appariement s’est fait par ordinateur tandis que les opérations de contrôle et de résolution ont été exécutées manuellement. L’estimateur « bivalent », appelé aussi estimateur de Petersen ou saisie-resaisie, a servi à estimer la population. À cause de la nature des recensements, les chiffres du recensement ont été redressés avant de servir au calcul de l’estimateur bivalent. Avant de corriger les estimations régionales, on a ajusté un modèle de régression au facteur de redressement (estimateur bivalent divisé par le chiffre du recensement) afin de réduire les effets de la variabilité d’échantillonnage. Un estimateur synthétique a permis d’effectuer le redressement jusqu’au niveau de l’îlot. Les résultats de l’estimation bivalente sont présentés pour la région d’essai selon les trois principaux groupes ethniques (hispanique, asiatique, autre), le mode d’occupation, l’âge et le sexe. Enfin, nous présentons en bref les résultats du redressement des estimations régionales du recensement par îlot et nous en faisons l’analyse.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114600
    Description :

    Le présent article contient la description d’un programme d’ordinateur personnel servant à l’estimation de la variance pour de grandes enquêtes. Ce programme, connu sous le nom de PC CARP, permet de calculer des estimations pour des agrégats, des rapports, des moyennes, des quantiles et des coefficients de régression et d’estimer les variances correspondantes.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114601
    Description :

    La SIPP (Survey of Income and Program Participation/Enquête sur le revenu et la participation aux programmes) est une enquête permanente menée par le U.S. Bureau of the Census auprès d’un échantillon de ménages représentatif de la population à l’échelle nationale. Le but principal de la SIPP est d’améliorer la mesure de l’information sur la situation économique des ménages et des particuliers aux États-Unis. Pour atteindre ce but, des interviews sont menées à plusieurs reprises auprès des individus échantillonnés. Elles sont basées sur un questionnaire contenant des questions d’approfondissement dont la période de référence est courte. Le plan de sondage à plusieurs interviews de la SIPP soulève des questions d’ordre méthodologique et statistique qui concernent toutes les enquêtes par panel menées auprès de familles et de particuliers. Ces questions sont traitées dans le présent article du point de vue de la SIPP. Il s’agit : 1) de la conception du questionnaire; 2) de la collecte des données, notamment des règles de conduite adoptées à l’égard des répondants, du mode de collecte des données, de la durée de la période de référence et des règles de conduite adoptées à l’égard des personnes ayant déménagé; 3) des définitions, du plan de sondage et des estimations; 4) de l’erreur de réponse.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114602
    Description :

    Pour un degré de précision donné, Hidiroglou (1986) a défini un algorithme permettant de diviser la population en une strate à tirage complet et en une strate à tirage partiel de manière à minimiser la taille de l’échantillon global en supposant un échantillonnage aléatoire simple sans remise dans la strate à tirage partiel. Sethi (1963) a proposé un algorithme permettant un découpage optimal de la population en un certain nombre de strates à tirage partiel. Dans cet article, il est question d’un algorithme itératif qui vise à déterminer les bornes de strates pour une population fortement asymétrique découpée en une strate à tirage complet et en un certain nombre de strates à tirage partiel. Ces bornes de strates sont calculées de manière à minimiser la taille de l’échantillon global étant donné un degré de précision relative, un échantillonnage aléatoire simple sans remise dans les strates à tirage partiel et une répartition à la puissance « p » de l’échantillon entre ces mêmes strates. L’algorithme présenté dans cet article est une combinaison des travaux d’Hidiroglou (1986) et de Sethi (1963).

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114603
    Description :

    La plupart des enquêtes ont de nombreux usages et nous proposons dans cet article une hiérarchie de ces usages en six niveaux. Toutefois, la plupart des théories et des ouvrages statistiques mettent l’accent sur les enquêtes à usage unique pour éviter la complexité des plans de sondage à usages multiples et les problèmes que ces plans soulèvent. Nous exposons tout d’abord dix sources d’incompatibilité entre les usages de ces plans, puis nous posons des problèmes et donnons des solutions pour chaque cas. Heureusement, des compromis et des solutions communes sont possibles puisque la plupart des optimums sont très peu prononcés et que la plupart des « exigences » relatives à la précision sont en réalité très souples. Il est préférable de parler d’usages multiples et de composer avec eux que de se limiter à quelques usages choisis arbitrairement; en outre, la venue de l’informatique a facilité l’application des plans de sondage à usages multiples.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198800114604
    Description :

    Malgré la facilité relative de l’étude des erreurs dans les statistiques du commerce extérieur, il y a eu peu de tentatives pour quantifier leur taille, leur origine, leur distribution et leur évolution dans le temps. Les décideurs et les négociateurs commerciaux n’ont que des notions très limitées de l’imprécision de ces statistiques, en dépit de leur niveau de détail poussé. L’auteur s’est servi de la banque de données du commerce mondial mise au point à Statistique Canada pour étudier et quantifier les divergences qui existent dans les statistiques du commerce extérieur.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198700214514
    Description :

    S’inspirant de l’approche de Cassel, Särndal et Wretman (1983), l’auteur aborde le problème de la non-réponse dans l’estimation de la moyenne d’une population finie. L’auteur propose tout d’abord deux méthodes très simples pour estimer les probabilités de réponse individuelles; il applique ensuite ces méthodes à un modèle de superpopulation pour construire des estimateurs de la moyenne de la population. Enfin, au moyen d’une étude de Monte Carlo, il fait une première évaluation des propriétés des méthodes proposées. Les résultats de cette évaluation nous éclairent sur l’efficacité de ces méthodes.

    Date de diffusion : 1987-12-15

  • Articles et rapports : 12-001-X198700214515
    Description :

    Dans cet article, nous présentons des méthodes servant à estimer les fonctions des probabilités de cellule associées à un tableau de données multinomiales qui ont été arrondies aléatoirement selon des multiples d’un nombre donné l. Nous montrons que : (i) l’arrondissement aléatoire n’a que des effets de second ordre sur le biais et la variance; (ii) l’utilisation des estimateurs naturels des probabilités de cellule entraîne une très faible perte d’efficacité si la fréquence de la cellule est élevée par rapport à (l^2 - 1) / (6R) où R désigne le nombre de cellules dans le tableau; et (iii) il existe des estimateurs dont le biais est apparemment de taille exponentiellement faible pour les moments de ces estimateurs naturels et les polynomes des probabilités de cellule.

    Date de diffusion : 1987-12-15
Données (9)

Données (9) ((9 résultats))

  • Microdonnées à grande diffusion : 89F0002X
    Description : La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.
    Date de diffusion : 2024-04-12

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2023-12-19

  • Visualisation des données : 71-607-X2020010
    Description : L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les ensembles de données géospatiales de Statistique Canada à des niveaux géographiques variés, y compris au niveau des quartiers. Les utilisateurs peuvent visualiser les données, les cartographier thématiquement, les explorer et les analyser spatialement, de même que les exporter et les utiliser dans divers formats. Les utilisateurs peuvent aussi voir ces données superposées à des couches d’imageries satellitaires, des couches topographiques et des couches de rues.
    Date de diffusion : 2023-01-24

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22

  • Visualisation des données : 71-607-X2019010
    Description : Le Visualiseur de données sur le logement est un outil de visualisation qui permet aux utilisateurs d’explorer les données de Statistique Canada sur une carte. Ils peuvent utiliser l’outil pour consulter, comparer et exporter les données.
    Date de diffusion : 2019-10-30

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 13-220-X
    Description : Les Indicateurs nationaux du tourisme ont été parrainés par la Commission canadienne du tourisme, et visent à produire des mises à jour annuelles du Compte satellite du tourisme. Dans l'édition de 1997, ces indicateurs sont ajustés aux nouvelles données repères de 1992 et aux données revisées de 1988. Les indicateurs permettent d'actualiser l'évaluation des composantes du tourisme au Canada que sont l'offre, la demande et l'emploi. Les tableaux annuels sont estimés à l'aide des Comptes nationaux des revenus et dépenses (CRD) et de plusieurs enquêtes portant sur les branches d'activité et les voyages. Ils sont disponibles approximativement quatre semaines après la publication des CRD annuels. Des tableaux montrant les niveaux et les variations en pourcentage des estimations désaisonnalisées aux prix courants et en prix constants sont inclus. De plus, une section analytique avec des graphiques présente les séries chronologiques des premières différences, variations en pourcentage et facteurs saisonniers pour plusieurs indicateurs. La publication, qui présente les données historiques à partir de 1987, sera disponible le jour de la parution. Des nouvelles données concernant les biens et services non touristiques produits par des industries non touristiques sont maintenant incluses dans les tableaux de la demande. De même, des nouvelles données sur l'emploi touristique direct généré par les industries non touristiques sont comprises dans les tableaux sur l'emploi.
    Date de diffusion : 2003-01-08

  • Tableau : 11-516-X
    Description :

    La deuxième édition des Statistiques historiques du Canada a été produite conjointement par la Fédération canadienne des sciences sociales et Statistique Canada, en 1983. Cet ouvrage comprend environ 1 088 tableaux statistiques sur la situation sociale, économique et institutionnelle du Canada, du début de la Confédération, en 1867, au milieu des années 70. Les tableaux sont disposés en sections, lesquelles comportent une introduction qui explique le contenu de chaque section ainsi que les sources principales de données pour chaque tableau, et des notes explicatives générales concernant les statistiques. Dans la plupart des cas, la description des séries individuelles est suffisante pour permettre aux lecteurs de les utiliser sans avoir à consulter les nombreuses sources dont il est fait état dans la publication.

    La version électronique de cette publication historique est accessible dans le site Internet de Statistique Canada, à titre de document téléchargeable sans frais : texte en HTML et tous les tableaux sous forme de chiffriers électroniques individuels en format csv (qui permet le visionnement ou le téléchargement direct).

    Date de diffusion : 1999-07-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29
Analyses (1 871)

Analyses (1 871) (0 à 10 de 1 871 résultats)

  • Articles et rapports : 11-522-X202200100001
    Description : Le couplage d’enregistrements vise à mettre en évidence les paires d’enregistrements liées à la même unité et observées dans deux ensembles de données différents, disons A et B. Fellegi et Sunter (1969) proposent de mettre à l’essai chaque paire d’enregistrements, qu’elle soit générée à partir de l’ensemble de paires appariées ou non. La fonction de décision est le rapport entre m(y) et u(y), les probabilités d’observer une comparaison y d’un ensemble de k>3 variables d’identification clés dans une paire d’enregistrements, sous l’hypothèse que la paire constitue, respectivement, un appariement ou non. On estime habituellement ces paramètres au moyen de l’algorithme EM en utilisant comme données les comparaisons pour toutes les paires du produit cartésien ?=A×B. On émet l’hypothèse que ces observations (sur les comparaisons et sur l’état des paires comme appariement ou non) sont générées indépendamment des autres paires, hypothèse caractérisant la majeure partie de la littérature sur le couplage d’enregistrements et mise en œuvre dans les outils logiciels (p. ex., RELAIS, Cibella et coll. 2012). Au contraire, les comparaisons y et l’état d’appariement dans O sont dépendants de manière déterministe. Par conséquent, les estimations sur m(y) et u(y) fondées sur l’algorithme EM sont généralement mauvaises. Ce fait compromet l’efficacité de l’application de la méthode de Fellegi-Sunter, ainsi que le calcul automatique des mesures de la qualité et la possibilité d’appliquer des méthodes efficaces aux fins d’estimation du modèle sur des données couplées (p. ex. les fonctions de régression), comme dans Chambers et coll. (2015). Nous proposons d’examiner O au moyen d’un ensemble d’échantillons, chacun tiré de manière à préserver l’indépendance des comparaisons entre les paires d’enregistrements sélectionnées. Les simulations sont encourageantes.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100002
    Description : Les auteures ont utilisé le progiciel de couplage probabiliste Splink mis au point par le ministère de la Justice du Royaume-Uni pour relier les données du recensement de l’Angleterre et du pays de Galles à elles-mêmes afin de trouver des réponses en double au recensement. Un grand ensemble étalon-or des doublons confirmés du recensement était disponible, ce qui signifiait que la qualité des résultats de la mise en œuvre de Splink pouvait être assurée. Le présent article décrit la mise en œuvre et les fonctionnalités de Splink, donne des détails sur les configurations et les paramètres que nous avons utilisés pour ajuster Splink à notre projet en particulier, et donne les résultats que nous avons obtenus.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100003
    Description : L’estimation à de fins niveaux d’agrégation est nécessaire pour mieux décrire une société. Les approches fondées sur un modèle d’estimation sur petits domaines qui combinent des données d’enquête parcimonieuses à des données riches provenant de sources auxiliaires se sont révélées utiles pour améliorer la fiabilité des estimations sur petits domaines. Nous examinons ici un scénario où des estimations basées sur un modèle pour petits domaines, produit à un niveau d’agrégation donné, devaient être désagrégées pour mieux décrire la structure sociale à des niveaux plus fins. Pour ce scénario, nous avons élaboré une méthode de répartition afin de mettre en œuvre la désagrégation, surmontant les problèmes associés à la disponibilité des données et à l’élaboration de modèles à des niveaux de cette finesse. La méthode est appliquée à l’estimation de la littératie et de la numératie des adultes au niveau du comté par groupe, au moyen des données du Programme pour l’évaluation internationale des compétences des adultes (PEICA) des États-Unis. Dans cette application, les groupes sont définis en fonction de l’âge ou de la scolarité, mais la méthode pourrait être appliquée à l’estimation d’autres groupes en quête d’équité.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100004
    Description : Conformément au Plan d’action sur les données désagrégées (PADD) à long terme de Statistique Canada, plusieurs initiatives ont été mises en œuvre dans l’Enquête sur la population active (EPA). Une des initiatives les plus directes fut une augmentation ciblée dans la taille de l’échantillon mensuel de l’EPA. En outre, un programme d’enquête supplémentaire régulier a été introduit, où une série supplémentaire de questions a été posée à un sous-ensemble de répondants de l’EPA et analysée dans un cycle de production mensuel ou trimestriel. Enfin, les estimations fondées sur les méthodologies de l’estimation sur petits domaines (EPD) sont réintroduites dans l’EPA et comprendront une portée élargie avec davantage de valeur analytique qu’auparavant. Le présent article donne un aperçu de ces trois initiatives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100005
    Description : Le lissage de la variance due à l’échantillonnage est un sujet important dans l’estimation sur petits domaines. Dans le présent article, nous proposons des méthodes de lissage de la variance due à l’échantillonnage aux fins d’estimation sur petits domaines. En particulier, nous considérons la fonction de variance généralisée et les méthodes d’effet de plan aux fins de lissage de la variance due à l’échantillonnage. Nous évaluons et comparons les variances dues à l’échantillonnage lissées et les estimations sur petits domaines fondées sur des estimations de la variance lissées au moyen de l’analyse de données d’enquête de Statistique Canada. Les résultats de l’analyse de données réelles indiquent que les méthodes de lissage de la variance due à l’échantillonnage proposées fonctionnent très bien pour l’estimation sur petits domaines.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100006
    Description : L’ABS (Bureau de la statistique de l’Australie) s’est engagé à offrir un meilleur accès à un plus grand nombre de microdonnées, tout en assurant la protection des renseignements personnels et la confidentialité, grâce à son DataLab (laboratoire de données) virtuel qui aide à entreprendre des recherches complexes plus efficacement. À l’heure actuelle, pour être autorisées, les données de sortie de recherche de DataLab doivent respecter des règles strictes afin de minimiser les risques de divulgation. Or le processus d’examen manuel n’est pas rentable et peut entraîner des erreurs. Le nombre croissant de résultats statistiques provenant de différents projets peut introduire des risques de divulgation résiduelle même si ces résultats de différents projets ont respecté des règles strictes en matière de sorties. L’ABS étudie la possibilité de fournir une vérification automatique des sorties au moyen de la méthodologie de la clé de cellule de l’ABS pour s’assurer que toutes les sorties des différents projets sont protégées de façon uniforme afin de minimiser les risques de divulgation résiduelle et de réduire les coûts associés à la vérification des sorties.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100007
    Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100009
    Description : L’éducation et la formation sont reconnues comme des éléments fondamentaux du développement d’une société. Il s’agit d’un phénomène multidimensionnel complexe, dont les déterminants sont attribuables à plusieurs conditions sociales et socioéconomiques interdépendantes. Pour répondre à la demande de renseignements statistiques à l’appui de l’élaboration des politiques et de leurs processus de suivi et d’évaluation, l’Institut national italien de statistique (Istat) renouvelle le système de production de statistiques sur l’éducation et la formation en mettant en œuvre un nouveau registre statistique thématique. Ce dernier fera partie du système intégré de registres de l’Istat, ce qui permettra de relier le phénomène de l’éducation et de la formation à d’autres phénomènes pertinents, comme la transition vers le marché du travail.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100010
    Description : Grandir au Québec est une enquête longitudinale populationnelle qui a débuté au printemps 2021 à l’Institut de la statistique du Québec. Parmi les enfants visés par ce suivi longitudinal, certains éprouveront des difficultés de développement à un moment ou un autre de leur vie. Ces mêmes enfants présentent souvent des caractéristiques associées à une érosion de l’échantillon plus élevée (famille à faible revenu, faible niveau de scolarisation des parents). Le présent article décrit les deux principaux défis que nous avons rencontrés en tentant d’assurer une représentativité suffisante de ces enfants, tant dans les résultats globaux que dans les analyses de sous-populations.
    Date de diffusion : 2024-03-25
Références (363)

Références (363) (0 à 10 de 363 résultats)

  • Avis et consultations : 13-605-X
    Description : Ce produit comprend des articles sur les plus récents développements méthodologiques et conceptuels dans le Système canadien des comptes macroéconomiques ainsi que l’analyse de l’économie canadienne. Il comprend des articles qui expliquent les nouvelles méthodes, les nouveaux concepts et les nouvelles techniques statistiques utilisés afin de compiler le Système canadien des comptes macroéconomiques. Il comprend également des renseignements sur les produits nouveaux ou améliorés et fournit des mises à jour et des suppléments d’information pour les divers guides et articles analytiques portant sur une grande variété de sujets liés à l’économie canadienne.
    Date de diffusion : 2024-02-29

  • Enquêtes et programmes statistiques — Documentation : 32-26-0007
    Description : Les données du Recensement de l’agriculture fournissent des renseignements statistiques sur les exploitations et les exploitants agricoles à des niveaux géographiques fins et pour de petites sous–populations. Des activités d’évaluation de la qualité sont essentielles pour s’assurer que les données du recensement sont fiables et qu’elles répondent aux besoins des utilisateurs.

    Ce rapport fournit des renseignements sur la qualité des données relatives au Recensement de l’agriculture, comme les sources d’erreur, la détection des erreurs, les méthodes de contrôle de la divulgation, les indicateurs de la qualité des données, les taux de réponse et les taux de collecte.
    Date de diffusion : 2024-02-06

  • Enquêtes et programmes statistiques — Documentation : 75-005-M2023001
    Description : Ce document fournit des informations sur l'évolution des taux de réponse de l'Enquête sur la population active (EPA) et une discussion de l'évaluation de deux aspects de la qualité des données qui garantissent que les estimations de l'EPA continuent à fournir un portrait précis du marché du travail canadien.
    Date de diffusion : 2023-10-30

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2023-10-04

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

  • Enquêtes et programmes statistiques — Documentation : 32-26-0006
    Description : Ce rapport fournit des renseignements sur la qualité des données relatives au Couplage agriculture–population, comme les sources d’erreur, le processus d’appariement, les taux de réponse, les taux d’imputation, l’échantillonnage, la pondération, les méthodes de contrôle de la divulgation et les indicateurs de la qualité des données.
    Date de diffusion : 2023-08-25

  • Enquêtes et programmes statistiques — Documentation : 75-514-G
    Description : Le Guide de l'Enquête sur les postes vacants et les salaires contient un dictionnaire des concepts et définitions et traite de sujets tels que la méthodologie de l'enquête, la collecte et le traitement des données et la qualité des données. Le guide porte sur les deux volets de l'enquête, soit le volet sur les postes vacants, dont la fréquence est trimestrielle, et le volet sur les salaires, dont la fréquence est annuelle.
    Date de diffusion : 2023-05-25

  • Enquêtes et programmes statistiques — Documentation : 32-26-0002
    Description :

    Ce guide de référence peut être utile à la fois pour les nouveaux utilisateurs et pour les utilisateurs expérimentés qui désirent se familiariser avec le Recensement de l'agriculture et trouver des renseignements détaillés sur celui-ci.

    Le guide fournit un aperçu des activités de communication, de détermination du contenu, de collecte, de traitement, d'évaluation de la qualité des données et de diffusion du Recensement de l'agriculture, en plus de fournir une description sommaire des principaux changements apportés au recensement et d'autres informations utiles.

    Date de diffusion : 2022-04-14

  • Fichiers et documentation sur la géographie : 12-572-X
    Description :

    La Classification géographique type (CGT) fournit une structure de classification systématique pour toutes les régions géographiques au Canada. La CGT est le système de classification officielle utilisé pour le Recensement de la population et d’autres enquêtes de Statistique Canada.

    La classification est divisée en deux volumes, soit le volume I, La classification et le volume II, Cartes de référence.

    Le volume II renferme des cartes de référence indiquant les limites, les noms, les codes et l'emplacement des régions géographiques figurant dans la classification. Les cartes de référence montrent les subdivisions de recensement, les divisions de recensement, les régions métropolitaines de recensement, les agglomérations de recensement, les zones d'influence métropolitaine de recensement et les régions économiques. Les définitions de ces termes se trouvent dans le Volume I, La classification. Le volume I renferme une description de la classification et des régions géographiques normalisées connexes et comprend les noms de localité.

    Les cartes du volume II peuvent être téléchargées en format PDF à partir de notre site Web.

    Date de diffusion : 2022-02-09

  • Enquêtes et programmes statistiques — Documentation : 12-004-X
    Description :

    Les statistiques : le pouvoir des données! est une ressource Web créée en 2001 pour aider les étudiants du secondaire et les enseignants de mathématiques et de sciences de l’information à soutirer le maximum des statistiques. Au cours des 20 dernières années, ce produit est devenu l’une des références les plus populaires de Statistique Canada chez les étudiants, les enseignants et beaucoup d’autres membres de la population générale. Ce produit a été mis à jour la dernière fois en 2021.

    Date de diffusion : 2021-09-02

Browse our partners page to find a complete list of our partners and their associated products.

Date de modification :