Techniques statistiques

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (121)

Tout (121) (0 à 10 de 121 résultats)

  • Articles et rapports : 11-633-X2019004
    Description :

    La présente étude montre comment estimer l’effet de la frontière canado-américaine sur le commerce de marchandises non énergétiques au niveau infraprovincial et au sein des États en utilisant le Fichier des transports terrestres de Statistique Canada et des données sur le commerce intérieur des États-Unis. Dans le cadre de l’étude, on a recours à un cadre de modèle gravitationnel afin de comparer les flux commerciaux transfrontaliers et intérieurs au sein de 201 régions du Canada et des États-Unis au cours de l’année 2012. L’étude permet de montrer que quelque 25 ans après la ratification de l’Accord de libre-échange Canada–États-Unis (prédécesseur de l’Accord de libre-échange nord-américain), le coût du commerce transfrontalier des marchandises représente toujours des droits tarifaires de 30 % sur le commerce bilatéral entre les régions du Canada et des États-Unis. La présente étude permet également de montrer la façon d’utiliser ces estimations ainsi que des méthodes générales d’équilibre de pseudo maximum de vraisemblance de Poisson pour décrire l’effet de changements dans les coûts liés à la frontière sur les structures du commerce nord-américain et du bien-être régional.

    Date de diffusion : 2019-09-24

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2019-09-24

  • Revues et périodiques : 11-633-X2019003
    Description :

    Le présent rapport donne un aperçu des définitions et des cadres de compétence de la littératie des données, ainsi que des outils d’évaluation utilisés pour la mesurer. Tout cela est fondé sur la littérature existante et les pratiques actuelles dans le monde. La littératie des données, ou la capacité de tirer des renseignements utiles des données, est un concept relativement nouveau. Cependant, on la reconnaît de plus en plus comme un ensemble de compétences essentielles à l’ère de l’information. Les approches existantes à l’égard de la mesure de la littératie des données (des outils d’autoévaluation aux mesures objectives et des évaluations individuelles aux évaluations organisationnelles) sont analysées dans le présent rapport afin d’orienter l’élaboration d’un outil d’évaluation pour la littératie des données au sein de la fonction publique canadienne.

    Date de diffusion : 2019-08-14

  • Articles et rapports : 12-001-X201900200003
    Description :

    Dans divers domaines, il est de plus en plus important de fusionner les sources d’information disponibles pour améliorer les estimations des caractéristiques de la population. En présence de plusieurs échantillons probabilistes indépendants d’une population finie, nous examinons plusieurs solutions d’estimateur combiné du total de la population, basé soit sur une combinaison linéaire d’estimateurs distincts, soit sur une méthode par échantillon combiné. L’estimateur en combinaison linéaire fondé sur des variances estimées est susceptible d’être biaisé, car les estimateurs distincts du total de la population peuvent être fortement corrélés à leurs estimateurs de la variance respectifs. Nous illustrons la possibilité d’utiliser un échantillon combiné pour estimer les variances des estimateurs distincts, ce qui donne des estimateurs de la variance groupés généraux. Ces estimateurs de la variance groupés utilisent tous les renseignements disponibles et peuvent réduire considérablement le biais d’une combinaison linéaire d’estimateurs distincts.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201900200007
    Description :

    Quand on ajuste une variable catégorique ordonnée à L > 2 niveaux à un ensemble de covariables sur données d’enquêtes à plans complexes, on suppose communément que les éléments de la population suivent un modèle simple de régression logistique cumulative (modèle de régression logistique à cotes proportionnelles). Cela signifie que la probabilité que la variable catégorique se situe à un certain niveau ou au-dessous est une fonction logistique binaire des covariables du modèle. Ajoutons, sauf pour l’ordonnée à l’origine, les valeurs des paramètres de régression logistique sont les mêmes à chaque niveau. La méthode « fondée sur le plan » classique servant à ajuster le modèle à cotes proportionnelles est fondée sur le pseudo-maximum de vraisemblance. Nous comparons les estimations calculées par cette méthode à celles d’un traitement dans un cadre basé sur un modèle robuste sensible au plan. Nous indiquons par un simple exemple numérique en quoi les estimations tirées de ces deux traitements peuvent différer. La nouvelle méthode peut facilement s’élargir pour ajuster un modèle logistique cumulatif général où l’hypothèse du parallélisme peut ne pas se vérifier. Un test de cette hypothèse peut aisément s’ensuivre.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201900200008
    Description :

    De nos jours, il y a une non-réponse élevée dans de nombreuses enquêtes-échantillons, y compris d’importantes enquêtes menées par des organismes statistiques gouvernementaux. Une collecte de données adaptative peut être avantageuse dans cette situation : il est possible de réduire le biais de non-réponse dans les estimations de l’enquête, jusqu’à un certain point, en produisant un ensemble de répondants bien équilibré. Les variables auxiliaires ont un double objectif. Utilisées au cours de la phase d’estimation, elles réduisent le biais, sans toutefois l’éliminer complètement, par une pondération ajustée par calage. Au cours de la phase précédente de collecte de données adaptative, les variables auxiliaires jouent également un rôle important : elles contribuent à réduire le déséquilibre dans l’ensemble final de répondants. Dans le contexte de cette utilisation combinée de variables auxiliaires, le présent article est consacré à un examen de l’écart entre l’estimation par calage et l’estimation sans biais (réponse complète). Nous montrons que cet écart est la somme de deux composantes. La composante réductible peut être réduite, par la collecte de données adaptative, jusqu’à zéro si une réponse parfaitement équilibrée est obtenue par rapport à un vecteur auxiliaire choisi. En revanche, la composante résistante ne varie pas ou varie peu sous l’effet d’une réponse mieux équilibrée; elle représente une partie de l’écart qu’un plan adaptatif ne permet pas d’éliminer. La taille relative de cette première composante est un indicateur de l’avantage qu’on peut tirer d’un plan de sondage adaptatif.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 11-633-X2019002
    Description :

    La collecte de données d’enquête au moyen des appareils mobiles, comme les tablettes électroniques et les téléphones intelligents, a fait son apparition au Canada. Cependant, on en sait peu au sujet de la représentativité des données recueillies au moyen de ces appareils. En mars 2017, Statistique Canada a commandé une collecte de données d’enquête par l’intermédiaire de l’application Carotte Points Santé et a inclus 11 questions dans l’enquête réalisée sur l’application mobile Carotte Points Santé (Carotte) tirées de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2017.

    Date de diffusion : 2019-06-04

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2019-05-30

  • Articles et rapports : 11-633-X2018018
    Description :

    Le présent document traite des sources de données et des méthodes utilisées pour rétropoler le produit intérieur brut (PIB) en termes de revenus, le PIB en termes de dépenses, le revenu intérieur brut réel, les taux de chômage, les taux d’amortissement et les taux d’urbanisation des provinces et territoires. Néanmoins, des estimations très précises peuvent être produites et s’avérer utiles pour comprendre l’évolution des économies des provinces et des territoires. Des techniques s’appuyant sur des variables instrumentales sont utilisées pour estimer les fluctuations historiques de ces variables économiques jusqu’en 1950.

    Date de diffusion : 2018-11-02

  • Articles et rapports : 11-633-X2018017
    Description :

    Afin de concevoir des politiques visant à promouvoir l’égalité entre les sexes en matière de leadership, l’autonomisation économique des femmes et la croissance inclusive, il est important de bien comprendre la propriété d’entreprises par des femmes ainsi que le rendement des entreprises appartenant à des femmes. Cependant, l’information sur la propriété d’entreprises selon le sexe demeure rare, en raison du manque de données exhaustives. L’étude Entreprises appartenant à des femmes au Canada (Grekou, Li et Liu, 2018), comble ce manque de données en distinguant les propriétaires d’entreprises selon leur sexe à l’aide d’un nouvel ensemble de données administratives appelé la Base de données canadienne sur la dynamique employeurs-employés. Cet ensemble de données contient des renseignements sur les propriétaires d’entreprises pour toutes les entreprises non constituées en société et les sociétés privées au Canada. Le présent document porte sur la méthodologie adoptée pour établir la structure de la propriété d’entreprises selon le sexe. Il présente ensuite des estimations de la propriété d’entreprises selon le sexe (propriétaires majoritairement masculins ou féminins et propriété à parts égales). Enfin, il analyse la sensibilité de ces estimations et les compare à celles calculées à l’aide d’autres sources de données.

    Date de diffusion : 2018-09-24
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (113)

Analyses (113) (0 à 10 de 113 résultats)

  • Articles et rapports : 11-633-X2019004
    Description :

    La présente étude montre comment estimer l’effet de la frontière canado-américaine sur le commerce de marchandises non énergétiques au niveau infraprovincial et au sein des États en utilisant le Fichier des transports terrestres de Statistique Canada et des données sur le commerce intérieur des États-Unis. Dans le cadre de l’étude, on a recours à un cadre de modèle gravitationnel afin de comparer les flux commerciaux transfrontaliers et intérieurs au sein de 201 régions du Canada et des États-Unis au cours de l’année 2012. L’étude permet de montrer que quelque 25 ans après la ratification de l’Accord de libre-échange Canada–États-Unis (prédécesseur de l’Accord de libre-échange nord-américain), le coût du commerce transfrontalier des marchandises représente toujours des droits tarifaires de 30 % sur le commerce bilatéral entre les régions du Canada et des États-Unis. La présente étude permet également de montrer la façon d’utiliser ces estimations ainsi que des méthodes générales d’équilibre de pseudo maximum de vraisemblance de Poisson pour décrire l’effet de changements dans les coûts liés à la frontière sur les structures du commerce nord-américain et du bien-être régional.

    Date de diffusion : 2019-09-24

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2019-09-24

  • Revues et périodiques : 11-633-X2019003
    Description :

    Le présent rapport donne un aperçu des définitions et des cadres de compétence de la littératie des données, ainsi que des outils d’évaluation utilisés pour la mesurer. Tout cela est fondé sur la littérature existante et les pratiques actuelles dans le monde. La littératie des données, ou la capacité de tirer des renseignements utiles des données, est un concept relativement nouveau. Cependant, on la reconnaît de plus en plus comme un ensemble de compétences essentielles à l’ère de l’information. Les approches existantes à l’égard de la mesure de la littératie des données (des outils d’autoévaluation aux mesures objectives et des évaluations individuelles aux évaluations organisationnelles) sont analysées dans le présent rapport afin d’orienter l’élaboration d’un outil d’évaluation pour la littératie des données au sein de la fonction publique canadienne.

    Date de diffusion : 2019-08-14

  • Articles et rapports : 12-001-X201900200003
    Description :

    Dans divers domaines, il est de plus en plus important de fusionner les sources d’information disponibles pour améliorer les estimations des caractéristiques de la population. En présence de plusieurs échantillons probabilistes indépendants d’une population finie, nous examinons plusieurs solutions d’estimateur combiné du total de la population, basé soit sur une combinaison linéaire d’estimateurs distincts, soit sur une méthode par échantillon combiné. L’estimateur en combinaison linéaire fondé sur des variances estimées est susceptible d’être biaisé, car les estimateurs distincts du total de la population peuvent être fortement corrélés à leurs estimateurs de la variance respectifs. Nous illustrons la possibilité d’utiliser un échantillon combiné pour estimer les variances des estimateurs distincts, ce qui donne des estimateurs de la variance groupés généraux. Ces estimateurs de la variance groupés utilisent tous les renseignements disponibles et peuvent réduire considérablement le biais d’une combinaison linéaire d’estimateurs distincts.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201900200007
    Description :

    Quand on ajuste une variable catégorique ordonnée à L > 2 niveaux à un ensemble de covariables sur données d’enquêtes à plans complexes, on suppose communément que les éléments de la population suivent un modèle simple de régression logistique cumulative (modèle de régression logistique à cotes proportionnelles). Cela signifie que la probabilité que la variable catégorique se situe à un certain niveau ou au-dessous est une fonction logistique binaire des covariables du modèle. Ajoutons, sauf pour l’ordonnée à l’origine, les valeurs des paramètres de régression logistique sont les mêmes à chaque niveau. La méthode « fondée sur le plan » classique servant à ajuster le modèle à cotes proportionnelles est fondée sur le pseudo-maximum de vraisemblance. Nous comparons les estimations calculées par cette méthode à celles d’un traitement dans un cadre basé sur un modèle robuste sensible au plan. Nous indiquons par un simple exemple numérique en quoi les estimations tirées de ces deux traitements peuvent différer. La nouvelle méthode peut facilement s’élargir pour ajuster un modèle logistique cumulatif général où l’hypothèse du parallélisme peut ne pas se vérifier. Un test de cette hypothèse peut aisément s’ensuivre.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201900200008
    Description :

    De nos jours, il y a une non-réponse élevée dans de nombreuses enquêtes-échantillons, y compris d’importantes enquêtes menées par des organismes statistiques gouvernementaux. Une collecte de données adaptative peut être avantageuse dans cette situation : il est possible de réduire le biais de non-réponse dans les estimations de l’enquête, jusqu’à un certain point, en produisant un ensemble de répondants bien équilibré. Les variables auxiliaires ont un double objectif. Utilisées au cours de la phase d’estimation, elles réduisent le biais, sans toutefois l’éliminer complètement, par une pondération ajustée par calage. Au cours de la phase précédente de collecte de données adaptative, les variables auxiliaires jouent également un rôle important : elles contribuent à réduire le déséquilibre dans l’ensemble final de répondants. Dans le contexte de cette utilisation combinée de variables auxiliaires, le présent article est consacré à un examen de l’écart entre l’estimation par calage et l’estimation sans biais (réponse complète). Nous montrons que cet écart est la somme de deux composantes. La composante réductible peut être réduite, par la collecte de données adaptative, jusqu’à zéro si une réponse parfaitement équilibrée est obtenue par rapport à un vecteur auxiliaire choisi. En revanche, la composante résistante ne varie pas ou varie peu sous l’effet d’une réponse mieux équilibrée; elle représente une partie de l’écart qu’un plan adaptatif ne permet pas d’éliminer. La taille relative de cette première composante est un indicateur de l’avantage qu’on peut tirer d’un plan de sondage adaptatif.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 11-633-X2019002
    Description :

    La collecte de données d’enquête au moyen des appareils mobiles, comme les tablettes électroniques et les téléphones intelligents, a fait son apparition au Canada. Cependant, on en sait peu au sujet de la représentativité des données recueillies au moyen de ces appareils. En mars 2017, Statistique Canada a commandé une collecte de données d’enquête par l’intermédiaire de l’application Carotte Points Santé et a inclus 11 questions dans l’enquête réalisée sur l’application mobile Carotte Points Santé (Carotte) tirées de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2017.

    Date de diffusion : 2019-06-04

  • Articles et rapports : 11-633-X2018018
    Description :

    Le présent document traite des sources de données et des méthodes utilisées pour rétropoler le produit intérieur brut (PIB) en termes de revenus, le PIB en termes de dépenses, le revenu intérieur brut réel, les taux de chômage, les taux d’amortissement et les taux d’urbanisation des provinces et territoires. Néanmoins, des estimations très précises peuvent être produites et s’avérer utiles pour comprendre l’évolution des économies des provinces et des territoires. Des techniques s’appuyant sur des variables instrumentales sont utilisées pour estimer les fluctuations historiques de ces variables économiques jusqu’en 1950.

    Date de diffusion : 2018-11-02

  • Articles et rapports : 11-633-X2018017
    Description :

    Afin de concevoir des politiques visant à promouvoir l’égalité entre les sexes en matière de leadership, l’autonomisation économique des femmes et la croissance inclusive, il est important de bien comprendre la propriété d’entreprises par des femmes ainsi que le rendement des entreprises appartenant à des femmes. Cependant, l’information sur la propriété d’entreprises selon le sexe demeure rare, en raison du manque de données exhaustives. L’étude Entreprises appartenant à des femmes au Canada (Grekou, Li et Liu, 2018), comble ce manque de données en distinguant les propriétaires d’entreprises selon leur sexe à l’aide d’un nouvel ensemble de données administratives appelé la Base de données canadienne sur la dynamique employeurs-employés. Cet ensemble de données contient des renseignements sur les propriétaires d’entreprises pour toutes les entreprises non constituées en société et les sociétés privées au Canada. Le présent document porte sur la méthodologie adoptée pour établir la structure de la propriété d’entreprises selon le sexe. Il présente ensuite des estimations de la propriété d’entreprises selon le sexe (propriétaires majoritairement masculins ou féminins et propriété à parts égales). Enfin, il analyse la sensibilité de ces estimations et les compare à celles calculées à l’aide d’autres sources de données.

    Date de diffusion : 2018-09-24

  • Articles et rapports : 12-001-X201800154927
    Description :

    L’étalonnage des séries mensuelles et trimestrielles à des données annuelles est une pratique courante adoptée par de nombreux instituts nationaux de statistique. Le problème de l’étalonnage se pose quand des données temporelles pour une même variable cible sont mesurées à différentes fréquences et qu’il est nécessaire d’éliminer les différences entre les sommes des valeurs infra-annuelles et les valeurs annuelles de référence. Plusieurs méthodes d’étalonnage sont décrites dans la littérature. La procédure d’étalonnage avec préservation des taux de croissance (PTC) est souvent considérée comme étant la meilleure. Il est généralement soutenu qu’elle a pour fondement un principe idéal de préservation du mouvement. Toutefois, nous montrons que l’étalonnage PTC présente des inconvénients appréciables qui importent pour les applications pratiques et qui ne sont pas décrits dans la littérature. Nous considérons d’autres modèles d’étalonnage qui ne souffrent pas de certains des effets indésirables de la PTC.

    Date de diffusion : 2018-06-21
Références (11)

Références (11) (0 à 10 de 11 résultats)

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2019-05-30

  • Enquêtes et programmes statistiques — Documentation : 82-225-X200701010508
    Description :

    Aperçu du couplage des enregistrements décrit le processus utilisé dans le module de couplage des enregistrements du registre canadien du cancer. On y trouve les étapes suivantes : préparatifs avant le couplage ; pré-traitement ; couplage ; post-traitement ; analyse des groupes et choix d'une solution ; entrée des solutions ; et, traitement des solutions.

    Date de diffusion : 2008-01-18

  • Enquêtes et programmes statistiques — Documentation : 11-522-X20050019476
    Description :

    La communication montrera comment, avec les données publiées par Statistique Canada et disponibles à partir des bibliothèques membres de la CRÉPUQ, une approche d'appariement via le code postal permet de relier les données du fichier des résultats à un ensemble de variables contextuelles. Ces variables pourraient ainsi concourir à la production, à titre exploratoire, d'un indice servant à une meilleure explication de la performance différenciée des élèves des écoles. Sous l'angle des retombées, l'indice envisagé pourrait illustrer encore davantage les limites des classements d'élèves et d'écoles qui ne prennent pas suffisamment en compte ces informations.

    Date de diffusion : 2007-03-02

  • Enquêtes et programmes statistiques — Documentation : 68-514-X
    Description :

    L'approche utilisée par Statistique Canada pour la collecte et la diffusion de données économiques a évolué depuis plusieurs décennies vers un système de collecte et d'estimation fortement intégré qui alimente le cadre du Système de comptabilité nationale du Canada.

    L'élément clé de cette approche a été la création de l'Enquête unifiée auprès des entreprises, qui avait pour objet d'améliorer l'uniformité, la cohérence, l'ampleur et la profondeur des données des enquêtes-entreprises.

    L'EUE a atteint cet objectif en regroupant dans un cadre commun un grand nombre d'enquêtes-entreprises annuelles du Canada. Ce cadre comprenait une seule base de sondage, un schéma pour le plan d'échantillonnage, l'harmonisation conceptuelle du contenu des enquêtes, divers moyens d'utiliser les données administratives pertinentes, une collecte intégrée des données, des outils de traitement et d'analyse, et un entrepôt central de données.

    Date de diffusion : 2006-11-20

  • Enquêtes et programmes statistiques — Documentation : 89-612-X
    Description :

    Ce rapport comprend une description de la structure et du couplage de deux bases de données : la Banque de données administratives longitudinales (DAL) et la Base de données longitudinales sur les immigrants (BDIM). La combinaison des deux produits offre un fichier couplé de données fiscales sur les immigrants ayant obtenu le droit d'établissement et leurs données caractéristiques sur l'immigration. Le rapport souligne la façon de combiner l'information, référé ici comme DAL_BDIM, améliore et complète les bases de données actuelles et distinctes. Dans ce rapport, on compare le fichier complet de la BDIM avec l'échantillon d'immigrants pour évaluer la représentativité du fichier de l'échantillon.

    Date de diffusion : 2004-01-05

  • Enquêtes et programmes statistiques — Documentation : 12-001-X20030016609
    Description :

    Pour automatiser le processus de vérification des données, il faut résoudre le problème de localisation des erreurs, c'est-à-dire la détermination des zones erronées dans un enregistrement incorrect. En 1976, Fellegi et Holt ont proposé un paradigme pour repérer automatiquement les erreurs. Au fil des ans, ce paradigme a été généralisé pour s'énoncer comme suit : on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier les valeurs des variables dont la somme des poids de fiabilité est la plus faible possible. Par poids de fiabilité d'une variable, nous entendons un nombre non négatif précisant dans quelle mesure la valeur de cette variable est jugée fiable. Étant donné ce paradigme, il faut résoudre le problème mathématique résultant. Nous examinons ici comment les méthodes de génération de sommets peuvent être utilisées pour résoudre ce problème mathématique dans le cas de données mixtes, c'est-à-dire une combinaison de données catégoriques (discrètes) et numériques (continues). Le but principal de l'article n'est pas de présenter de nouveaux résultats, mais plutôt de combiner les idées de plusieurs auteurs afin de donner une description « complète », intégrée, de l'utilisation des méthodes de génération de sommets pour résoudre le problème de localisation des erreurs dans le cas de données mixtes. Nous décrirons surtout dans notre exposé la façon dont on peut adapter aux données mixtes les méthodes élaborées pour des données numériques.

    Date de diffusion : 2003-07-31

  • Enquêtes et programmes statistiques — Documentation : 81-595-M2003005
    Géographie : Canada
    Description :

    Dans ce document, on élabore des procédures techniques permettant aux ministères de l'Éducation d'établir un lien entre les tests provinciaux et les tests nationaux et internationaux afin de pouvoir comparer les normes et présenter les résultats selon une échelle commune.

    Date de diffusion : 2003-05-29

  • Enquêtes et programmes statistiques — Documentation : 85-602-X
    Description :

    L'objet du présent rapport est de faire le survol des méthodes et techniques existantes qui utilisent les identificateurs personnels en vue de réaliser le couplage des enregistrements. Ce couplage peut être décrit de façon générale comme une méthode de traitement ou de transformation des identificateurs personnels tirés des dossiers personnels enregistrés dans l'une ou plusieurs bases de données opérationnelles afin de jumeler les identificateurs et de créer un dossier composé sur un particulier. Le couplage des enregistrements ne vise pas seulement à identifier les particuliers à des fins opérationnelles, mais à établir les concordances probabilistes de degrés de fiabilité variés à des fins de rapports statistiques. Les techniques utilisées dans le cadre du couplage d'enregistrements peuvent également servir dans les enquêtes afin d'en restreindre le champ dans les bases de données, lorsque des renseignements sur les identificateurs personnels existent.

    Date de diffusion : 2000-12-05

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12
Date de modification :