Techniques statistiques

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

3 facets displayed. 0 facets selected.

Enquête ou programme statistique

47 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (187)

Tout (187) (0 à 10 de 187 résultats)

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100014
    Description : Les minorités ethniques sont souvent sous-représentées dans la recherche par sondage, en raison des défis auxquels se heurtent de nombreux chercheurs et chercheuses quand ils souhaitent inclure ces populations. Bien que certaines études présentent plusieurs méthodes en effectuant une comparaison, peu d’entre elles ont directement comparé ces méthodes de façon empirique. Cela explique pourquoi les chercheurs souhaitant inclure les minorités ethniques dans leurs études ne sont pas certains des meilleures méthodes disponibles. Dans le présent article, je passe brièvement en revue les raisons d’ordre méthodologique et éthique pour lesquelles il faudrait augmenter la représentation des minorités ethniques dans la recherche en sciences sociales, ainsi que les défis que cela pose. Je présente ensuite les résultats de 10 études qui comparent empiriquement des méthodes d’échantillonnage ou de recrutement de membres de minorités ethniques. Enfin, j’aborderai certaines implications pour de futures recherches.
    Date de diffusion : 2024-03-25

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2024-01-22

  • Articles et rapports : 12-001-X202300200005
    Description : Le sous-dénombrement de la population est un des principaux obstacles avec lesquels il faut composer lors de l’analyse statistique d’échantillons d’enquête non probabilistes. Nous considérons dans le présent article deux scénarios types de sous-dénombrement, à savoir le sous-dénombrement stochastique et le sous-dénombrement déterministe. Nous soutenons que l’on peut appliquer directement les méthodes d’estimation existantes selon l’hypothèse de positivité sur les scores de propension (c’est-à-dire les probabilités de participation) pour traiter le scénario de sous-dénombrement stochastique. Nous étudions des stratégies visant à atténuer les biais lors de l’estimation de la moyenne de la population cible selon le sous-dénombrement déterministe. Plus précisément, nous examinons une méthode de population fractionnée (split-population method) fondée sur une formulation d’enveloppe convexe et nous construisons des estimateurs menant à des biais réduits. Un estimateur doublement robuste peut être construit si un sous-échantillon de suivi de l’enquête probabiliste de référence comportant des mesures sur la variable étudiée devient réalisable. Le rendement de six estimateurs concurrents est examiné au moyen d’une étude par simulations, et des questions nécessitant un examen plus approfondi sont brièvement abordées.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 11-633-X2023003
    Description : Ce document couvre les travaux universitaires et les stratégies d’estimation utilisées par les organismes nationaux de statistique. Il aborde la question de la production d’estimations géographiques détaillées au niveau du quadrillage pour le Canada en étudiant la mesure du produit intérieur brut infraprovincial et infraterritorial à l’aide du Yukon comme scénario d’essai.
    Date de diffusion : 2023-12-15

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

  • Articles et rapports : 12-001-X202300100001
    Description : Les travaux récents sur l’estimation pour domaine d’enquête permettent d’estimer les moyennes de domaine de population selon des hypothèses a priori exprimées dans des termes de contraintes d’inégalité linéaires. Par exemple, on pourrait savoir que les moyennes de population sont non décroissantes conformément aux domaines ordonnés. Il a été montré que l’imposition de contraintes donne des estimateurs ayant une plus petite variance et des intervalles de confiance plus étroits. Dans le présent article, nous considérons un test formel de l’hypothèse nulle selon laquelle toutes les contraintes sont obligatoires, par opposition à une hypothèse alternative où au moins une contrainte n’est pas obligatoire. Le test de moyennes de domaine constantes comparativement à des moyennes de domaine croissantes est un cas particulier. La puissance du test est nettement meilleure que celle du test comportant la même hypothèse nulle et une hypothèse alternative sans contrainte. Le nouveau test est utilisé sur les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges), pour montrer que les salaires sont positivement liés au niveau de scolarité du père du sujet, dans tous les domaines d’études et sur plusieurs années de cohortes.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100002
    Description : Nous envisageons ici l’analyse de régression dans le contexte de l’intégration de données. Pour combiner des renseignements partiels de sources externes, nous utilisons l’idée de calage assisté par un modèle qui introduit un modèle « de travail » réduit fondé sur les covariables observées. Ce modèle de travail réduit n’est pas nécessairement spécifié correctement, mais il peut être un outil utile pour intégrer les renseignements partiels provenant de données externes. La mise en œuvre en tant que telle est fondée sur une application nouvelle de la projection d’information et de la pondération par calage du modèle. La méthode proposée est particulièrement intéressante pour combiner des renseignements de plusieurs sources présentant différentes tendances en matière de données manquantes. La méthode est appliquée à un exemple de données réelles combinant les données d’enquête de l'enquête KNHANES (enquête nationale coréenne sur la santé et la nutrition) et les mégadonnées du NHISS (service national coréen de partage de l’assurance maladie).
    Date de diffusion : 2023-06-30

  • Articles et rapports : 11-637-X202200100007
    Description :

    Comme septième objectif défini dans le Programme de développement durable à l'horizon 2030, le Canada et les autres États membres de l'ONU se sont engagés à garantir l'accès de tous à des services fiables, durables et modernes, à un coût abordable d'ici 2030. Cette infographie de 2022 donne un aperçu des indicateurs sous-jacents au septième objectif de développement durable en faveur de l'énergie propre et d'un coût abordable, ainsi que les statistiques et sources de données utilisées pour suivre et rendre compte de cet objectif au Canada.

    Date de diffusion : 2022-12-13

  • Articles et rapports : 11-637-X202200100008
    Description :

    Comme huitième objectif défini dans le Programme de développement durable à l'horizon 2030, le Canada et les autres États membres de l'ONU se sont engagés à promouvoir une croissance économique soutenue, partagée et durable, le plein emploi productif et un travail décent pour tous d'ici 2030. Cette infographie de 2022 donne un aperçu des indicateurs sous-jacents au huitième objectif de développement durable en faveur du travail décent et de la croissance économique, ainsi que les statistiques et sources de données utilisées pour suivre et rendre compte de cet objectif au Canada.

    Date de diffusion : 2022-12-13
Données (1)

Données (1) ((1 résultat))

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22
Analyses (179)

Analyses (179) (30 à 40 de 179 résultats)

  • Articles et rapports : 11-522-X202100100008
    Description :

    Les organismes nationaux de statistique étudient de plus en plus la possibilité d'utiliser des échantillons non probabilistes en complément des échantillons probabilistes. Nous examinons le scénario où la variable d’intérêt et les variables auxiliaires sont observées à la fois dans un échantillon probabiliste et un échantillon non probabiliste. Nous cherchons à utiliser les données de l’échantillon non probabiliste pour améliorer l’efficacité des estimations pondérées par les poids d’enquête obtenues à partir de l’échantillon probabiliste. Récemment, Sakshaug, Wisniowski, Ruiz et Blom (2019) et Wisniowski, Sakshaug, Ruiz et Blom (2020) ont proposé une approche bayésienne visant à intégrer les données des deux échantillons aux fins de l’estimation des paramètres du modèle. Dans leur méthode, on utilise les données de l’échantillon non probabiliste pour déterminer la distribution a priori des paramètres du modèle et on obtient la distribution a posteriori en supposant que le plan de sondage probabiliste est ignorable (ou non informatif). Nous étendons cette approche bayésienne à la prédiction de paramètres d’une population finie dans le cadre d’un échantillonnage non ignorable (ou informatif) en nous appuyant sur des statistiques pondérées par des poids d’enquête appropriées. Nous illustrons les propriétés de notre prédicteur au moyen d’une étude par simulations.

    Mots clés : prédiction bayésienne; échantillonnage de Gibbs; échantillonnage non ignorable; intégration des données statistiques.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100027
    Description :

    Les préoccupations en matière de confidentialité constituent un obstacle à l’application d’analyses à distance, notamment l’apprentissage automatique, sur des données sensibles au sein du nuage. Dans le cadre de ce travail, nous utilisons un schéma de chiffrement totalement homomorphe à niveau pour entraîner un algorithme d’apprentissage automatique supervisé de bout en bout à classer du texte tout en protégeant la confidentialité des points de données d’entrée. Nous entraînons notre réseau neuronal à simple couche sur un important ensemble de données de simulation en fournissant une solution pratique à une tâche de classification de textes réels comprenant de multiples catégories. Pour améliorer à la fois la précision et le temps d’entraînement, nous entraînons un ensemble de tels classificateurs en parallèle par un groupage de cryptogrammes.

    Mots clés : protection des renseignements personnels, apprentissage automatique, chiffrement

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100006
    Description :

    Dans le contexte de son paradigme « données administratives d’abord », Statistique Canada donne la priorité à l’utilisation de sources autres que les enquêtes pour produire des statistiques officielles. Ce paradigme repose de façon capitale sur des sources autres que les enquêtes pouvant fournir une couverture quasi parfaite de certaines populations cibles, y compris des fichiers administratifs ou des sources de mégadonnées. Toutefois, cette couverture doit être mesurée, en appliquant par exemple la méthode de capture-recapture, selon laquelle les données sont comparées à d’autres sources présentant une bonne couverture des mêmes populations, y compris un recensement. Cependant, il s’agit d’un exercice difficile en présence d’erreurs de couplage, qui surviennent inévitablement lorsque le couplage se fonde sur des quasi-identificateurs, comme cela est généralement le cas. Pour faire face à cet enjeu, une nouvelle méthodologie est décrite, selon laquelle la méthode de capture-recapture est améliorée grâce à un nouveau modèle d’erreur fondé sur le nombre de couplages contigus à un enregistrement donné. Elle est appliquée dans le cadre d’une expérience avec des données publiques de recensement.

    Mots clés : estimation de système dual; appariement de données; couplage d’enregistrements; qualité; intégration des données; mégadonnées.

    Date de diffusion : 2021-10-22

  • Articles et rapports : 11-522-X202100100017
    Description : L’apparition de la pandémie de COVID-19 a contraint le gouvernement du Canada à fournir des renseignements pertinents et actuels pour appuyer la prise de décisions sur nombre de questions, notamment l’acquisition et le déploiement d’équipements de protection individuelle (EPI). Notre équipe a élaboré un modèle épidémiologique compartimental à partir d’une base de code existante pour projeter la demande d’EPI dans plusieurs scénarios épidémiologiques. Ce modèle a été ensuite amélioré au moyen de techniques de science des données, ce qui a permis de rapidement élaborer et diffuser les résultats du modèle pour éclairer les décisions stratégiques.

    Mots clés : COVID-19; SARS-CoV-2; modèle épidémiologique; science des données; équipement de protection individuelle (EPI); SEIR

    Date de diffusion : 2021-10-22

  • Articles et rapports : 11-522-X202100100002
    Description :

    Un cadre pour l’utilisation des processus d’apprentissage automatique de façon responsable a été élaboré à Statistique Canada. Le cadre comprend des lignes directrices pour l’usage responsable de l’apprentissage automatique et une liste de contrôle connexe, qui sont organisées en quatre thèmes : le respect des personnes; le respect des données; des méthodes éprouvées; une application rigoureuse. Les quatre thèmes mis en commun assurent l'utilisation éthique des algorithmes et des résultats de l’apprentissage automatique. Le cadre est ancré dans une vision qui cherche à créer un milieu de travail moderne et à fournir une orientation et un soutien à ceux qui utilisent les techniques d’apprentissage automatique. Il s’applique à tous les programmes et projets statistiques menés par Statistique Canada qui utilisent des algorithmes d’apprentissage automatique. Cela comprend les algorithmes d’apprentissage supervisés et non supervisés. Le cadre et les lignes directrices le supportant seront présentés dans un premier temps. Le processus de revue des projets utilisant l’apprentissage automatique, soit la façon dont le cadre est appliqué aux projets de Statistique Canada, sera ensuite expliqué. Finalement, des travaux futurs pour améliorer le cadre seront décrits.

    Mots Clés : Apprentissage automatique responsable, explicabilité, éthique

    Date de diffusion : 2021-10-15

  • Articles et rapports : 11-522-X202100100003
    Description :

    La taille et la richesse croissantes des données numériques permettent de modéliser des relations et des interactions plus complexes, ce qui est le point fort de l’apprentissage automatique. Dans notre étude, nous avons appliqué le boosting de gradient au système néerlandais d’ensembles de données statistiques sociales pour estimer les probabilités de transition vers la pauvreté et de sortie de la pauvreté. Les estimations individuelles sont raisonnables, mais la méthode combinée avec SHAP et des modèles de substitution globaux apporte des avantages, principalement : le classement simultané de centaines de caractéristiques selon leur importance, une vue détaillée de leur relation avec les probabilités de transition, et l’identification fondée sur les données de sous-populations ayant des probabilités de transition relativement élevées et faibles. En outre, nous décomposons la différence de l’importance des caractéristiques entre la population générale et les sous-populations entre un effet de fréquence et un effet de la caractéristique. Nous mettons en garde contre les possibilités de mauvaise interprétation et discutons des futurs travaux envisageables.

    Mots clés : classification; explicabilité; boosting de gradient; événement de la vie; facteurs de risque; décomposition SHAP.

    Date de diffusion : 2021-10-15

  • Articles et rapports : 11-522-X202100100014
    Description : De récents développements des modes d’administration de questionnaires et d’extraction de données ont favorisé l’utilisation d’échantillons non probabilistes, qui présentent souvent un biais de sélection découlant d’un manque de plan de sondage ou de l’autosélection des participants. Ce biais peut être traité par plusieurs ajustements, dont l’applicabilité dépend du type d’information auxiliaire disponible. Des poids de calage peuvent être utilisés lorsque seuls des totaux de population de variables auxiliaires sont disponibles. En cas de disponibilité d’une enquête de référence respectant un plan de sondage probabiliste, plusieurs méthodes peuvent être appliquées, comme l’ajustement sur le score de propension, l’appariement statistique ou l’imputation de masse, ainsi que des estimateurs doublement robustes. En cas de disponibilité d’un recensement complet de la population cible pour certaines covariables auxiliaires, des estimateurs fondés sur des modèles de superpopulation (souvent utilisés en échantillonnage probabiliste) peuvent être adaptés au cas d’échantillonnage non probabiliste. Nous avons étudié la combinaison de certaines de ces méthodes, afin de produire des estimations moins biaisées et plus efficaces, ainsi que l’utilisation de techniques de prédiction modernes (comme la classification par apprentissage automatique et des algorithmes de régression) dans les étapes de modélisation des ajustements décrits. Nous avons en outre étudié l’utilisation de techniques de sélection de variables avant l’étape de modélisation de l’ajustement sur le score de propension. Les résultats indiquent que les ajustements fondés sur la combinaison de plusieurs méthodes peuvent améliorer l’efficacité des estimations et que l’utilisation de l’apprentissage automatique et de techniques de sélection de variables peut contribuer à réduire le biais et la variance des estimateurs dans une plus grande mesure dans plusieurs situations.

    Mots clés : échantillonnage non probabiliste; calage; ajustement sur le score de propension; appariement.

    Date de diffusion : 2021-10-15

  • Articles et rapports : 12-001-X202100100004
    Description :

    À l’ère des mégadonnées, on dispose d’un nombre croissant de sources de données pour les analyses statistiques. Comme exemple important d’inférence de population finie, nous examinons une approche d’imputation pour la combinaison de données tirées d’une enquête probabiliste et de mégadonnées. Nous nous concentrons sur une situation où la variable à l’étude est observée dans les mégadonnées seulement, mais les autres variables auxiliaires sont couramment observées dans les deux sources de données. Contrairement à l’imputation habituellement utilisée pour l’analyse des données manquantes, nous créons des valeurs imputées pour toutes les unités de l’échantillon probabiliste. Une imputation massive de ce type est intéressante dans le contexte de l’intégration des données d’enquête (Kim et Rao, 2012). Nous étendons l’imputation massive comme outil d’intégration des données d’enquête et des mégadonnées ne provenant pas d’enquêtes. Nous présentons les méthodes d’imputation massive et leurs propriétés statistiques. De plus, l’estimateur d’appariement de Rivers (2007) est traité comme cas particulier. L’estimation de la variance au moyen de données obtenues par imputation massive est abordée. Les résultats de la simulation montrent que les estimateurs proposés donnent de meilleurs résultats que les estimateurs concurrents en matière de robustesse et d’efficacité.

    Date de diffusion : 2021-06-24

  • Stats en bref : 89-20-00062021001
    Description :

    En tant qu'organisme national de statistique du Canada, Statistique Canada s'est engagé à transmettre ses connaissances et son expertise afin d'aider tous les Canadiens et toutes les Canadiennes à développer leurs compétences en matière de littératie des données. Le but de la formation est de fournir aux apprenants et apprenantes de l'information sur les concepts et les compétences de base à l'égard d'un éventail de sujets liés à la littératie des données.

    La formation s'adresse aux personnes qui commencent à travailler avec les données et aux personnes qui ont une certaine expérience de travail avec les données, mais qui souhaitent mettre leurs connaissances à jour ou les approfondir. Nous vous invitons à consulter notre catalogue d'apprentissage pour en savoir plus sur nos offres, y compris une grande collection de courtes vidéos. Assurez-vous de revenir ponctuellement puisque nous allons continuer à diffuser de nouvelles formations.

    Date de diffusion : 2021-05-03

  • Stats en bref : 89-20-00062021003
    Description :

    Dans cette vidéo, les téléspectateurs apprendront les différences entre trois types de mesures : les proportions, les ratios et les taux. En outre, les téléspectateurs d’ici la fin de cette vidéo seront en mesure de déterminer comment chaque mesure est calculée et quand il est préférable d’utiliser une mesure plutôt que l’autre.

    Date de diffusion : 2021-05-03
Références (7)

Références (7) ((7 résultats))

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

  • Enquêtes et programmes statistiques — Documentation : 82-225-X200701010508
    Description :

    Aperçu du couplage des enregistrements décrit le processus utilisé dans le module de couplage des enregistrements du registre canadien du cancer. On y trouve les étapes suivantes : préparatifs avant le couplage ; pré-traitement ; couplage ; post-traitement ; analyse des groupes et choix d'une solution ; entrée des solutions ; et, traitement des solutions.

    Date de diffusion : 2008-01-18

  • Enquêtes et programmes statistiques — Documentation : 11-522-X20050019476
    Description :

    La communication montrera comment, avec les données publiées par Statistique Canada et disponibles à partir des bibliothèques membres de la CRÉPUQ, une approche d'appariement via le code postal permet de relier les données du fichier des résultats à un ensemble de variables contextuelles. Ces variables pourraient ainsi concourir à la production, à titre exploratoire, d'un indice servant à une meilleure explication de la performance différenciée des élèves des écoles. Sous l'angle des retombées, l'indice envisagé pourrait illustrer encore davantage les limites des classements d'élèves et d'écoles qui ne prennent pas suffisamment en compte ces informations.

    Date de diffusion : 2007-03-02

  • Enquêtes et programmes statistiques — Documentation : 68-514-X
    Description :

    L'approche utilisée par Statistique Canada pour la collecte et la diffusion de données économiques a évolué depuis plusieurs décennies vers un système de collecte et d'estimation fortement intégré qui alimente le cadre du Système de comptabilité nationale du Canada.

    L'élément clé de cette approche a été la création de l'Enquête unifiée auprès des entreprises, qui avait pour objet d'améliorer l'uniformité, la cohérence, l'ampleur et la profondeur des données des enquêtes-entreprises.

    L'EUE a atteint cet objectif en regroupant dans un cadre commun un grand nombre d'enquêtes-entreprises annuelles du Canada. Ce cadre comprenait une seule base de sondage, un schéma pour le plan d'échantillonnage, l'harmonisation conceptuelle du contenu des enquêtes, divers moyens d'utiliser les données administratives pertinentes, une collecte intégrée des données, des outils de traitement et d'analyse, et un entrepôt central de données.

    Date de diffusion : 2006-11-20

  • Enquêtes et programmes statistiques — Documentation : 89-612-X
    Description :

    Ce rapport comprend une description de la structure et du couplage de deux bases de données : la Banque de données administratives longitudinales (DAL) et la Base de données longitudinales sur les immigrants (BDIM). La combinaison des deux produits offre un fichier couplé de données fiscales sur les immigrants ayant obtenu le droit d'établissement et leurs données caractéristiques sur l'immigration. Le rapport souligne la façon de combiner l'information, référé ici comme DAL_BDIM, améliore et complète les bases de données actuelles et distinctes. Dans ce rapport, on compare le fichier complet de la BDIM avec l'échantillon d'immigrants pour évaluer la représentativité du fichier de l'échantillon.

    Date de diffusion : 2004-01-05

  • Enquêtes et programmes statistiques — Documentation : 81-595-M2003005
    Géographie : Canada
    Description :

    Dans ce document, on élabore des procédures techniques permettant aux ministères de l'Éducation d'établir un lien entre les tests provinciaux et les tests nationaux et internationaux afin de pouvoir comparer les normes et présenter les résultats selon une échelle commune.

    Date de diffusion : 2003-05-29

  • Enquêtes et programmes statistiques — Documentation : 85-602-X
    Description :

    L'objet du présent rapport est de faire le survol des méthodes et techniques existantes qui utilisent les identificateurs personnels en vue de réaliser le couplage des enregistrements. Ce couplage peut être décrit de façon générale comme une méthode de traitement ou de transformation des identificateurs personnels tirés des dossiers personnels enregistrés dans l'une ou plusieurs bases de données opérationnelles afin de jumeler les identificateurs et de créer un dossier composé sur un particulier. Le couplage des enregistrements ne vise pas seulement à identifier les particuliers à des fins opérationnelles, mais à établir les concordances probabilistes de degrés de fiabilité variés à des fins de rapports statistiques. Les techniques utilisées dans le cadre du couplage d'enregistrements peuvent également servir dans les enquêtes afin d'en restreindre le champ dans les bases de données, lorsque des renseignements sur les identificateurs personnels existent.

    Date de diffusion : 2000-12-05
Date de modification :