Méthodes statistiques

Indicateurs clés

Toute modification apportera automatiquement une mise à jour au contenu de la page.

Région géographique choisie : Canada

Région géographique choisie : Terre Neuve et Labrador

Région géographique choisie : Île-du-Prince-Edouard

Région géographique choisie : Nouvelle-Écosse

Région géographique choisie : Nouveau-Brunswick

Région géographique choisie : Québec

Région géographique choisie : Ontario

Région géographique choisie : Manitoba

Région géographique choisie : Saskatchewan

Région géographique choisie : Alberta

Région géographique choisie : Colombie-Britannique

Région géographique choisie : Yukon

Région géographique choisie : Territoires du Nord-Ouest

Région géographique choisie : Nunavut

Aide à l'ordre
entrées

Résultats

Tout (2 296)

Tout (2 296) (0 à 10 de 2 296 résultats)

  • Articles et rapports : 11-522-X202200100001
    Description : Le couplage d’enregistrements vise à mettre en évidence les paires d’enregistrements liées à la même unité et observées dans deux ensembles de données différents, disons A et B. Fellegi et Sunter (1969) proposent de mettre à l’essai chaque paire d’enregistrements, qu’elle soit générée à partir de l’ensemble de paires appariées ou non. La fonction de décision est le rapport entre m(y) et u(y), les probabilités d’observer une comparaison y d’un ensemble de k>3 variables d’identification clés dans une paire d’enregistrements, sous l’hypothèse que la paire constitue, respectivement, un appariement ou non. On estime habituellement ces paramètres au moyen de l’algorithme EM en utilisant comme données les comparaisons pour toutes les paires du produit cartésien ?=A×B. On émet l’hypothèse que ces observations (sur les comparaisons et sur l’état des paires comme appariement ou non) sont générées indépendamment des autres paires, hypothèse caractérisant la majeure partie de la littérature sur le couplage d’enregistrements et mise en œuvre dans les outils logiciels (p. ex., RELAIS, Cibella et coll. 2012). Au contraire, les comparaisons y et l’état d’appariement dans O sont dépendants de manière déterministe. Par conséquent, les estimations sur m(y) et u(y) fondées sur l’algorithme EM sont généralement mauvaises. Ce fait compromet l’efficacité de l’application de la méthode de Fellegi-Sunter, ainsi que le calcul automatique des mesures de la qualité et la possibilité d’appliquer des méthodes efficaces aux fins d’estimation du modèle sur des données couplées (p. ex. les fonctions de régression), comme dans Chambers et coll. (2015). Nous proposons d’examiner O au moyen d’un ensemble d’échantillons, chacun tiré de manière à préserver l’indépendance des comparaisons entre les paires d’enregistrements sélectionnées. Les simulations sont encourageantes.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100002
    Description : Les auteures ont utilisé le progiciel de couplage probabiliste Splink mis au point par le ministère de la Justice du Royaume-Uni pour relier les données du recensement de l’Angleterre et du pays de Galles à elles-mêmes afin de trouver des réponses en double au recensement. Un grand ensemble étalon-or des doublons confirmés du recensement était disponible, ce qui signifiait que la qualité des résultats de la mise en œuvre de Splink pouvait être assurée. Le présent article décrit la mise en œuvre et les fonctionnalités de Splink, donne des détails sur les configurations et les paramètres que nous avons utilisés pour ajuster Splink à notre projet en particulier, et donne les résultats que nous avons obtenus.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100003
    Description : L’estimation à de fins niveaux d’agrégation est nécessaire pour mieux décrire une société. Les approches fondées sur un modèle d’estimation sur petits domaines qui combinent des données d’enquête parcimonieuses à des données riches provenant de sources auxiliaires se sont révélées utiles pour améliorer la fiabilité des estimations sur petits domaines. Nous examinons ici un scénario où des estimations basées sur un modèle pour petits domaines, produit à un niveau d’agrégation donné, devaient être désagrégées pour mieux décrire la structure sociale à des niveaux plus fins. Pour ce scénario, nous avons élaboré une méthode de répartition afin de mettre en œuvre la désagrégation, surmontant les problèmes associés à la disponibilité des données et à l’élaboration de modèles à des niveaux de cette finesse. La méthode est appliquée à l’estimation de la littératie et de la numératie des adultes au niveau du comté par groupe, au moyen des données du Programme pour l’évaluation internationale des compétences des adultes (PEICA) des États-Unis. Dans cette application, les groupes sont définis en fonction de l’âge ou de la scolarité, mais la méthode pourrait être appliquée à l’estimation d’autres groupes en quête d’équité.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100004
    Description : Conformément au Plan d’action sur les données désagrégées (PADD) à long terme de Statistique Canada, plusieurs initiatives ont été mises en œuvre dans l’Enquête sur la population active (EPA). Une des initiatives les plus directes fut une augmentation ciblée dans la taille de l’échantillon mensuel de l’EPA. En outre, un programme d’enquête supplémentaire régulier a été introduit, où une série supplémentaire de questions a été posée à un sous-ensemble de répondants de l’EPA et analysée dans un cycle de production mensuel ou trimestriel. Enfin, les estimations fondées sur les méthodologies de l’estimation sur petits domaines (EPD) sont réintroduites dans l’EPA et comprendront une portée élargie avec davantage de valeur analytique qu’auparavant. Le présent article donne un aperçu de ces trois initiatives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100005
    Description : Le lissage de la variance due à l’échantillonnage est un sujet important dans l’estimation sur petits domaines. Dans le présent article, nous proposons des méthodes de lissage de la variance due à l’échantillonnage aux fins d’estimation sur petits domaines. En particulier, nous considérons la fonction de variance généralisée et les méthodes d’effet de plan aux fins de lissage de la variance due à l’échantillonnage. Nous évaluons et comparons les variances dues à l’échantillonnage lissées et les estimations sur petits domaines fondées sur des estimations de la variance lissées au moyen de l’analyse de données d’enquête de Statistique Canada. Les résultats de l’analyse de données réelles indiquent que les méthodes de lissage de la variance due à l’échantillonnage proposées fonctionnent très bien pour l’estimation sur petits domaines.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100006
    Description : L’ABS (Bureau de la statistique de l’Australie) s’est engagé à offrir un meilleur accès à un plus grand nombre de microdonnées, tout en assurant la protection des renseignements personnels et la confidentialité, grâce à son DataLab (laboratoire de données) virtuel qui aide à entreprendre des recherches complexes plus efficacement. À l’heure actuelle, pour être autorisées, les données de sortie de recherche de DataLab doivent respecter des règles strictes afin de minimiser les risques de divulgation. Or le processus d’examen manuel n’est pas rentable et peut entraîner des erreurs. Le nombre croissant de résultats statistiques provenant de différents projets peut introduire des risques de divulgation résiduelle même si ces résultats de différents projets ont respecté des règles strictes en matière de sorties. L’ABS étudie la possibilité de fournir une vérification automatique des sorties au moyen de la méthodologie de la clé de cellule de l’ABS pour s’assurer que toutes les sorties des différents projets sont protégées de façon uniforme afin de minimiser les risques de divulgation résiduelle et de réduire les coûts associés à la vérification des sorties.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100007
    Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100009
    Description : L’éducation et la formation sont reconnues comme des éléments fondamentaux du développement d’une société. Il s’agit d’un phénomène multidimensionnel complexe, dont les déterminants sont attribuables à plusieurs conditions sociales et socioéconomiques interdépendantes. Pour répondre à la demande de renseignements statistiques à l’appui de l’élaboration des politiques et de leurs processus de suivi et d’évaluation, l’Institut national italien de statistique (Istat) renouvelle le système de production de statistiques sur l’éducation et la formation en mettant en œuvre un nouveau registre statistique thématique. Ce dernier fera partie du système intégré de registres de l’Istat, ce qui permettra de relier le phénomène de l’éducation et de la formation à d’autres phénomènes pertinents, comme la transition vers le marché du travail.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100010
    Description : Grandir au Québec est une enquête longitudinale populationnelle qui a débuté au printemps 2021 à l’Institut de la statistique du Québec. Parmi les enfants visés par ce suivi longitudinal, certains éprouveront des difficultés de développement à un moment ou un autre de leur vie. Ces mêmes enfants présentent souvent des caractéristiques associées à une érosion de l’échantillon plus élevée (famille à faible revenu, faible niveau de scolarisation des parents). Le présent article décrit les deux principaux défis que nous avons rencontrés en tentant d’assurer une représentativité suffisante de ces enfants, tant dans les résultats globaux que dans les analyses de sous-populations.
    Date de diffusion : 2024-03-25
Données (9)

Données (9) ((9 résultats))

  • Microdonnées à grande diffusion : 89F0002X
    Description : La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.
    Date de diffusion : 2024-02-02

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2023-12-19

  • Visualisation des données : 71-607-X2020010
    Description : L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les ensembles de données géospatiales de Statistique Canada à des niveaux géographiques variés, y compris au niveau des quartiers. Les utilisateurs peuvent visualiser les données, les cartographier thématiquement, les explorer et les analyser spatialement, de même que les exporter et les utiliser dans divers formats. Les utilisateurs peuvent aussi voir ces données superposées à des couches d’imageries satellitaires, des couches topographiques et des couches de rues.
    Date de diffusion : 2023-01-24

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22

  • Visualisation des données : 71-607-X2019010
    Description : Le Visualiseur de données sur le logement est un outil de visualisation qui permet aux utilisateurs d’explorer les données de Statistique Canada sur une carte. Ils peuvent utiliser l’outil pour consulter, comparer et exporter les données.
    Date de diffusion : 2019-10-30

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 13-220-X
    Description : Les Indicateurs nationaux du tourisme ont été parrainés par la Commission canadienne du tourisme, et visent à produire des mises à jour annuelles du Compte satellite du tourisme. Dans l'édition de 1997, ces indicateurs sont ajustés aux nouvelles données repères de 1992 et aux données revisées de 1988. Les indicateurs permettent d'actualiser l'évaluation des composantes du tourisme au Canada que sont l'offre, la demande et l'emploi. Les tableaux annuels sont estimés à l'aide des Comptes nationaux des revenus et dépenses (CRD) et de plusieurs enquêtes portant sur les branches d'activité et les voyages. Ils sont disponibles approximativement quatre semaines après la publication des CRD annuels. Des tableaux montrant les niveaux et les variations en pourcentage des estimations désaisonnalisées aux prix courants et en prix constants sont inclus. De plus, une section analytique avec des graphiques présente les séries chronologiques des premières différences, variations en pourcentage et facteurs saisonniers pour plusieurs indicateurs. La publication, qui présente les données historiques à partir de 1987, sera disponible le jour de la parution. Des nouvelles données concernant les biens et services non touristiques produits par des industries non touristiques sont maintenant incluses dans les tableaux de la demande. De même, des nouvelles données sur l'emploi touristique direct généré par les industries non touristiques sont comprises dans les tableaux sur l'emploi.
    Date de diffusion : 2003-01-08

  • Tableau : 11-516-X
    Description :

    La deuxième édition des Statistiques historiques du Canada a été produite conjointement par la Fédération canadienne des sciences sociales et Statistique Canada, en 1983. Cet ouvrage comprend environ 1 088 tableaux statistiques sur la situation sociale, économique et institutionnelle du Canada, du début de la Confédération, en 1867, au milieu des années 70. Les tableaux sont disposés en sections, lesquelles comportent une introduction qui explique le contenu de chaque section ainsi que les sources principales de données pour chaque tableau, et des notes explicatives générales concernant les statistiques. Dans la plupart des cas, la description des séries individuelles est suffisante pour permettre aux lecteurs de les utiliser sans avoir à consulter les nombreuses sources dont il est fait état dans la publication.

    La version électronique de cette publication historique est accessible dans le site Internet de Statistique Canada, à titre de document téléchargeable sans frais : texte en HTML et tous les tableaux sous forme de chiffriers électroniques individuels en format csv (qui permet le visionnement ou le téléchargement direct).

    Date de diffusion : 1999-07-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29
Analyses (1 872)

Analyses (1 872) (0 à 10 de 1 872 résultats)

  • Articles et rapports : 11-522-X202200100001
    Description : Le couplage d’enregistrements vise à mettre en évidence les paires d’enregistrements liées à la même unité et observées dans deux ensembles de données différents, disons A et B. Fellegi et Sunter (1969) proposent de mettre à l’essai chaque paire d’enregistrements, qu’elle soit générée à partir de l’ensemble de paires appariées ou non. La fonction de décision est le rapport entre m(y) et u(y), les probabilités d’observer une comparaison y d’un ensemble de k>3 variables d’identification clés dans une paire d’enregistrements, sous l’hypothèse que la paire constitue, respectivement, un appariement ou non. On estime habituellement ces paramètres au moyen de l’algorithme EM en utilisant comme données les comparaisons pour toutes les paires du produit cartésien ?=A×B. On émet l’hypothèse que ces observations (sur les comparaisons et sur l’état des paires comme appariement ou non) sont générées indépendamment des autres paires, hypothèse caractérisant la majeure partie de la littérature sur le couplage d’enregistrements et mise en œuvre dans les outils logiciels (p. ex., RELAIS, Cibella et coll. 2012). Au contraire, les comparaisons y et l’état d’appariement dans O sont dépendants de manière déterministe. Par conséquent, les estimations sur m(y) et u(y) fondées sur l’algorithme EM sont généralement mauvaises. Ce fait compromet l’efficacité de l’application de la méthode de Fellegi-Sunter, ainsi que le calcul automatique des mesures de la qualité et la possibilité d’appliquer des méthodes efficaces aux fins d’estimation du modèle sur des données couplées (p. ex. les fonctions de régression), comme dans Chambers et coll. (2015). Nous proposons d’examiner O au moyen d’un ensemble d’échantillons, chacun tiré de manière à préserver l’indépendance des comparaisons entre les paires d’enregistrements sélectionnées. Les simulations sont encourageantes.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100002
    Description : Les auteures ont utilisé le progiciel de couplage probabiliste Splink mis au point par le ministère de la Justice du Royaume-Uni pour relier les données du recensement de l’Angleterre et du pays de Galles à elles-mêmes afin de trouver des réponses en double au recensement. Un grand ensemble étalon-or des doublons confirmés du recensement était disponible, ce qui signifiait que la qualité des résultats de la mise en œuvre de Splink pouvait être assurée. Le présent article décrit la mise en œuvre et les fonctionnalités de Splink, donne des détails sur les configurations et les paramètres que nous avons utilisés pour ajuster Splink à notre projet en particulier, et donne les résultats que nous avons obtenus.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100003
    Description : L’estimation à de fins niveaux d’agrégation est nécessaire pour mieux décrire une société. Les approches fondées sur un modèle d’estimation sur petits domaines qui combinent des données d’enquête parcimonieuses à des données riches provenant de sources auxiliaires se sont révélées utiles pour améliorer la fiabilité des estimations sur petits domaines. Nous examinons ici un scénario où des estimations basées sur un modèle pour petits domaines, produit à un niveau d’agrégation donné, devaient être désagrégées pour mieux décrire la structure sociale à des niveaux plus fins. Pour ce scénario, nous avons élaboré une méthode de répartition afin de mettre en œuvre la désagrégation, surmontant les problèmes associés à la disponibilité des données et à l’élaboration de modèles à des niveaux de cette finesse. La méthode est appliquée à l’estimation de la littératie et de la numératie des adultes au niveau du comté par groupe, au moyen des données du Programme pour l’évaluation internationale des compétences des adultes (PEICA) des États-Unis. Dans cette application, les groupes sont définis en fonction de l’âge ou de la scolarité, mais la méthode pourrait être appliquée à l’estimation d’autres groupes en quête d’équité.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100004
    Description : Conformément au Plan d’action sur les données désagrégées (PADD) à long terme de Statistique Canada, plusieurs initiatives ont été mises en œuvre dans l’Enquête sur la population active (EPA). Une des initiatives les plus directes fut une augmentation ciblée dans la taille de l’échantillon mensuel de l’EPA. En outre, un programme d’enquête supplémentaire régulier a été introduit, où une série supplémentaire de questions a été posée à un sous-ensemble de répondants de l’EPA et analysée dans un cycle de production mensuel ou trimestriel. Enfin, les estimations fondées sur les méthodologies de l’estimation sur petits domaines (EPD) sont réintroduites dans l’EPA et comprendront une portée élargie avec davantage de valeur analytique qu’auparavant. Le présent article donne un aperçu de ces trois initiatives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100005
    Description : Le lissage de la variance due à l’échantillonnage est un sujet important dans l’estimation sur petits domaines. Dans le présent article, nous proposons des méthodes de lissage de la variance due à l’échantillonnage aux fins d’estimation sur petits domaines. En particulier, nous considérons la fonction de variance généralisée et les méthodes d’effet de plan aux fins de lissage de la variance due à l’échantillonnage. Nous évaluons et comparons les variances dues à l’échantillonnage lissées et les estimations sur petits domaines fondées sur des estimations de la variance lissées au moyen de l’analyse de données d’enquête de Statistique Canada. Les résultats de l’analyse de données réelles indiquent que les méthodes de lissage de la variance due à l’échantillonnage proposées fonctionnent très bien pour l’estimation sur petits domaines.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100006
    Description : L’ABS (Bureau de la statistique de l’Australie) s’est engagé à offrir un meilleur accès à un plus grand nombre de microdonnées, tout en assurant la protection des renseignements personnels et la confidentialité, grâce à son DataLab (laboratoire de données) virtuel qui aide à entreprendre des recherches complexes plus efficacement. À l’heure actuelle, pour être autorisées, les données de sortie de recherche de DataLab doivent respecter des règles strictes afin de minimiser les risques de divulgation. Or le processus d’examen manuel n’est pas rentable et peut entraîner des erreurs. Le nombre croissant de résultats statistiques provenant de différents projets peut introduire des risques de divulgation résiduelle même si ces résultats de différents projets ont respecté des règles strictes en matière de sorties. L’ABS étudie la possibilité de fournir une vérification automatique des sorties au moyen de la méthodologie de la clé de cellule de l’ABS pour s’assurer que toutes les sorties des différents projets sont protégées de façon uniforme afin de minimiser les risques de divulgation résiduelle et de réduire les coûts associés à la vérification des sorties.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100007
    Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100009
    Description : L’éducation et la formation sont reconnues comme des éléments fondamentaux du développement d’une société. Il s’agit d’un phénomène multidimensionnel complexe, dont les déterminants sont attribuables à plusieurs conditions sociales et socioéconomiques interdépendantes. Pour répondre à la demande de renseignements statistiques à l’appui de l’élaboration des politiques et de leurs processus de suivi et d’évaluation, l’Institut national italien de statistique (Istat) renouvelle le système de production de statistiques sur l’éducation et la formation en mettant en œuvre un nouveau registre statistique thématique. Ce dernier fera partie du système intégré de registres de l’Istat, ce qui permettra de relier le phénomène de l’éducation et de la formation à d’autres phénomènes pertinents, comme la transition vers le marché du travail.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100010
    Description : Grandir au Québec est une enquête longitudinale populationnelle qui a débuté au printemps 2021 à l’Institut de la statistique du Québec. Parmi les enfants visés par ce suivi longitudinal, certains éprouveront des difficultés de développement à un moment ou un autre de leur vie. Ces mêmes enfants présentent souvent des caractéristiques associées à une érosion de l’échantillon plus élevée (famille à faible revenu, faible niveau de scolarisation des parents). Le présent article décrit les deux principaux défis que nous avons rencontrés en tentant d’assurer une représentativité suffisante de ces enfants, tant dans les résultats globaux que dans les analyses de sous-populations.
    Date de diffusion : 2024-03-25
Références (363)

Références (363) (10 à 20 de 363 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2021005
    Description :

    La Direction des études analytiques et de la modélisation (DEAM) est le volet de recherche de Statistique Canada ayant pour mandat de produire des renseignements actuels, pertinents et de grande qualité sur des questions économiques, sociales et de santé qui importent aux Canadiens. La Direction fait usage stratégique de connaissances spécialisées et d’un éventail de sources de données et de techniques de modélisation pour répondre aux besoins en renseignements d’une vaste gamme de partenaires et d’intervenants du gouvernement, du milieu universitaire et du secteur public au moyen de l’analyse et de la recherche, de la modélisation et de l’analyse prédictive, et de l’élaboration de données. La Direction s’efforce de produire des recherches pertinentes, de grande qualité, actuelles, exhaustives, horizontales et intégrées, et de rendre possible l’utilisation de ses recherches grâce au renforcement des capacités et à la diffusion stratégique pour répondre aux besoins des décideurs, du milieu universitaire et du public en général.

    Ce Plan intégré pluriannuel pour la recherche, la modélisation et l’élaboration de données présente les priorités de la Direction pour les deux prochaines années.

    Date de diffusion : 2021-08-12

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2021002
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans. La BDIM comprend les dossiers administratifs d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) qui contiennent des renseignements exhaustifs sur les immigrants admis au Canada depuis 1952. Elle comprend également des données sur les résidents non permanents à qui on a délivré des permis de séjour temporaire depuis 1980. Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2021-02-01

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2019005
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans. La BDIM comprend les dossiers administratifs d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) qui contiennent des renseignements exhaustifs sur les immigrants admis au Canada depuis 1952. Elle comprend également des données sur les résidents non permanents à qui on a délivré des permis de séjour temporaire depuis 1980. Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.

    La BDIM a été diffusée en plusieurs étapes. Les sections 2.2 et 7 de ce rapport ont été révisées pour refléter les mises à jour.

    Date de diffusion : 2020-07-20

  • Avis et consultations : 98-26-0001
    Description :

    Ce livre blanc présente l’approche prévue par Statistique Canada dans le cadre du Recensement de la population de 2021. Il fournit en outre une explication claire des processus qui sous-tendent le programme du recensement, en abordant le contenu, le fonctionnement et les aspects juridiques du programme, de même que son caractère historique. Statistique Canada reconnaît qu’il est important non seulement de mener à bien le recensement, mais également de faire preuve de transparence quant à la façon dont ces efforts sont réalisés et de fournir des renseignements à cet égard. Brosser un portrait du Canada : le Recensement de la population de 2021 donne aux lecteurs un aperçu exclusif et détaillé de la façon dont les données du recensement sont recueillies et analysées, puis communiquées aux Canadiens, sous forme de renseignements statistiques de grande qualité, servant à prendre des décisions fondées sur des données probantes dans la société canadienne.

    Date de diffusion : 2020-07-20

  • Enquêtes et programmes statistiques — Documentation : 98-20-00012020020
    Description :

    Ce feuillet d’information fournit des renseignements détaillés sur la conception et la méthodologie de la composante du contenu du Test du recensement de 2019. Ce test a évalué les modifications apportées au libellé et à l’enchaînement de certaines questions, ainsi que l’ajout éventuel de nouvelles questions, afin de déterminer le contenu du Recensement de la population de 2021.

    Date de diffusion : 2020-07-20

  • Enquêtes et programmes statistiques — Documentation : 89-26-0003
    Description :

    La stratégie des données de Statistique Canada (SCDS) fournit un plan d'action pour la gestion et l'exploitation des actifs de données de l'organisme afin d'assurer leur utilisation et leur valeur optimales tout en maintenant la confiance du public. Comme Statistique Canada est le fournisseur de confiance du pays en matière de données et d'informations de haute qualité pour soutenir la prise de décisions et de politiques fondées sur des données probantes, la SCDS comprend naturellement aussi le plan de l'organisme visant à fournir un soutien et une expertise en matière de données à d'autres organisations gouvernementales (fédérales, provinciales et territoriales), à des organisations non gouvernementales, au secteur privé, au milieu universitaire et à d'autres communautés nationales et internationales).

    Le SCDS fournit une feuille de route sur la façon dont Statistique Canada continuera à gouverner et à gérer ses précieux actifs de données dans le cadre de son programme de modernisation et en conformité et en réponse à d'autres stratégies et initiatives du gouvernement fédéral. Ces stratégies fédérales comprennent la Stratégie des données pour la fonction publique fédérale, le Plan d'action national du Canada pour la transparence gouvernementale 2018-2020 et le Plan stratégique des opérations numériques du Secrétariat du Conseil du Trésor : 2018-2022.

    Date de diffusion : 2020-04-30

  • Enquêtes et programmes statistiques — Documentation : 34-26-0002
    Description :

    À partir de l'année de référence 2018, l'enquête annuelle sur les dépenses en immobilisations (CAPEX) a ajouté du contenu permettant de produire des estimations de dépenses en immobilisations par actifs d'infrastructures. En plus du contenu existant, le nouveau questionnaire demande une ventilation des dépenses par fonction (ou objectif) ainsi que la source de financement des dépenses en capital à partir des subventions publiques.

    Ce produit décrira les sources et les méthodes utilisées pour produire des estimations des dépenses en immobilisations et des réparations spécifiques aux actifs d'infrastructure et ce par fonction.

    Date de diffusion : 2020-04-01

  • Enquêtes et programmes statistiques — Documentation : 75F0002M2020001
    Description :

    La présente note définit le concept d'accédant à la propriété, employé dans l'Enquête canadienne sur le logement de 2018 (ECL). Elle comprend aussi la méthodologie utilisée pour déterminer les accédants à la propriété et fournit une analyse de sensibilité relevant d'autres méthodologies.

    Date de diffusion : 2020-01-15

  • Enquêtes et programmes statistiques — Documentation : 12-539-X
    Description :

    Ce document réunit des lignes directrices et des listes de contrôles liées à de nombreuses questions dont on doit tenir compte dans la poursuite des objectifs de qualité que sous-tend l'exécution des activités statistiques. Le document s'attarde principalement à la façon d'assurer la qualité grâce à la conception ou à la restructuration efficace et adéquate d'un projet ou d'un programme statistique, des débuts jusqu'à l'évaluation, la diffusion et la documentation des données. Ces lignes directrices sont fondées sur les connaissances et l'expérience collective d'un grand nombre d'employés de Statistique Canada. On espère que les Lignes directrices concernant la qualité seront utiles au personnel chargé de la planification et de la conception des enquêtes et d'autres projets statistiques, ainsi qu'à ceux qui évaluent et analysent les résultats de ces projets.

    Date de diffusion : 2019-12-04

  • Enquêtes et programmes statistiques — Documentation : 98-303-X
    Description :

    Le Rapport technique sur la couverture présentera l'erreur incluse dans les données du recensement provenant des personnes omises (non dénombrées) ou des personnes dénombrées plus d’une fois par le Recensement de 2016. L’erreur de couverture de la population est parmi les types d'erreurs les plus importantes, car elle a une incidence, non seulement sur l'exactitude des chiffres de population, mais également sur l'exactitude de tous les résultats des données du recensement décrivant les caractéristiques de l'univers de la population.

    Date de diffusion : 2019-11-13

Browse our partners page to find a complete list of our partners and their associated products.

Date de modification :