Assurance de la qualité

Aide à l'ordre
entrées

Résultats

Tout (239)

Tout (239) (210 à 220 de 239 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015029
    Description :

    Dans le cas des enquêtes longitudinales, les sujets qui font partie de l'échantillon sont observés pendant plusieurs périodes. En général, cette caractéristique produit des observations dépendantes sur le même sujet, plus des corrélations ordinaires entre sujets résultant du plan d'échantillonnage. Nombre des travaux décrits dans la littérature portent surtout sur la modélisation de la moyenne marginale d'une réponse en fonction de covariables. Liang et Zeger (1986) se sont servis d'équations d'estimation généralisées nécessitant uniquement la spécification correcte de la moyenne marginale et ont obtenu les erreurs-types des estimations des paramètres de régression et les critères connexes du test de Wald, en supposant que les mesures répétées effectuées sur un sujet de l'échantillon présentent une structure de corrélation provisoire. Rotnitzky et Jewell (1990) ont développé des tests de quasi-résultat et des corrections de Rao-Scott aux tests de quasi-résultat provisoire dans le cadre de modèles marginaux. Ces méthodes sont asymptotiquement robustes en regard de la spécification erronée de la structure des corrélations propre à un sujet, mais supposent que les sujets de l'échantillon sont indépendants, ce qui n'est pas toujours vrai dans le cas de donneées d'enquêtes longitudinales complexes fondées sur un échantillonnage stratifié à plusieurs degrés. Nous proposons des tests de Wald et des tests de quasi-score asymptotiquement valides pour les données d'enquêtes longitudinales, fondés sur la méthode de linéarisation de Taylor et sur la méthode jackknife. Nous élaborons aussi d'autres tests, fondés sur les corrections apportées par Rao-Scott à des tests naïfs qui ne tiennent pas compte des caractéristiques du plan de sondage et sur les t de Bonferroni. Ces tests sont particulièrement utiles quand le nombre réel de degrés de liberté, ordinairement considéré comme égal au nombre total d'unités primaires dans l'échantillon (grappes) moins le nombre de strates, est petit.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015034
    Description :

    Nous avons estimé un modèle de progression scolaire au secondaire à l'aide de données tirées de l'Enquête auprès des sortants (EAS) de 1991, qui a été effectuée par Statistique Canada. Les informations sur lesquelles est fondé le modèle de progression scolaire comprennent le niveau de scolarité actuel et les réponses à des questions rétrospectives portant sur les dates des évènements de scolarisation. Ces données ont permis de reconstituer de manière approximative l'historique des évènements éducatifs de chaque répondant. Le modèle de progression scolaire a été conçu pour être inclus dans un modèle plus vaste de micro-simulation à temps continu. Les principaux éléments du modèle comportent l'estimation (par âge, mois de naissance et saison, dans le cas des deux sexes et dans chaque province) des taux d'obtention de diplômes, de décrochage scolaire, de retour à l'école et d'obtention du diplôme après un décrochage. Ces estimations ont été renforcées à l'aide de données auxiliaires tirées du Recensement de 1991 et de données administratives.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015035
    Description :

    Dans le cadre d'une enquête longitudinale effectuée pendant k périodes, certaines unités peuvent être observées pour un nombre de périodes inférieur à k. Les enquêtes avec sous-échantillons se chevauchant partiellement, les enquêtes par panel pur avec non-réponse (une enquête par panel pur étant une enquête par panel non-complétée d'échantillons supplémentaires) et les enquêtes par panel complétées par des échantillons supplémentaires pour certaines périodes en sont des exemples. Nous présentons des estimateurs par régression pour des enquêtes de ce genre. Nous examinons une application aux études spéciales liées au National Resources Inventory.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015036
    Description :

    En tant que généralisation de la régression logistique, la régression logistique multivariée, introduite par Glonek et McCullagh (1995), facilite l'analyse des données longitudinales en acceptant les observations répétées et dépendantes d'une variable nominale ainsi que des jeux de réponses incomplets. L'auteur montre comment étendre cette méthode au traitement des données d'une enquête complexe et en fournit l'illustration grâce à l'Enquête sur la population active suisse. Il examine également l'incidence des poids d'échantillonnage sur l'estimation des paramètres et des erreurs-types.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015037
    Description :

    Pour des données longitudinales, les modéles mixtes sont fréquemment utilisés puisqu'ils permettent de tenir compte de la corrélation entre les observations provenant d'un même individu. Le modèle pour un mélange fini de distributions peut être considéré comme un cas particulier d'un modéle mixte. Dans ce document, on portera l'attention sur la méthode du maximum de vraisemblance. La maximisation de la fonction de vraisemblance pour un mélange fini de distributions est généralement plus ardue que dans le cas usuel d'une seule distribution et peut exiger beaucoup de temps. L'objectif de ce travail a donc consisté principalement à déterminer le(s) algorithme(s) qui satisfait(ont) au mieux les critères de temps d'exécution et d'efficacité pour trouver la solution. Pour atteindre cet objectif, on a effectué une étude de simulation. On n'a considéré que la situation dans laquelle la variable dépendante est dichotomique. Cette situation est très utile en pratique puisqu'elle sert, entre autres, à modéliser des durées discrètes telle que la durée dans l'état "faible revenu".

    Date de diffusion : 1999-10-22

  • Articles et rapports : 12-001-X19990014717
    Description :

    L'Enquête britannique sur la population active (EPA) utilise un plan d'échantillonnage avec renouvellement, chaque ménage de l'échantillon étant conservé pendant cinq trimestres consécutifs. Le fait de relier ensemble les renseignements sur les mêmes personnes d'un trimestre à l'autre produit une source potentiellement très riche des données longitudinales. Cependant, il y a de graves risques de distorsion dans les résultats du fait de cette liaison longitudinale, surtout en raison de l'érosion de l'échantillon, et des erreurs de réponse, ce qui peut produire de faux flux entre les situations au regard de l'activité économique. Le présent document décrit les premiers résultats d'investigations menées par l'Office for National Statistics (ONS) quant à la nature et à l'ampleur des problèmes.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 62F0014M1997009
    Géographie : Canada
    Description :

    Un programme d'étude visant à explorer la faisabilité d'utiliser l'approche hédonique pour effectuer des corrections de qualité pour les articles d'habillement dans l'indice des prix à la consommation (IPC) a été récemment lancé par la Division des prix. Ce document est le premier d'une série qui vise à dériver des corrections de qualité hédoniques pour les chemises de ville pour hommes. On construit d'abord une base de données des caractéristiques de qualité, à partir de laquelle on estime deux modèles hédoniques expérimentaux. Un de ces modèles sert ensuite à produire des corrections de qualité hédoniques pour toutes les substitutions de chemises survenues après mai 1995 et jusqu'en juin 1996. On compare ensuite ces valeurs avec les corrections de qualité utilisées dans l'IPC officiel. Bien que les résultats ne soient que préliminaires, trois importantes conclusions peuvent déjà être dégagées. Tout d'abord, les corrections de qualité dérivées par l'approche hédonique par opposition à l'approche traditionnelle sont très différentes, au moins au niveau des substitutions individuelles. Il serait, toutefois, prématuré de tenter de dire laquelle des deux approches est la plus exacte. En second lieu, il faudra une amélioration considérable de l'intégrité des données sur les caractéristiques de qualité pour que l'approche hédonique puisse jamais être considérée comme viable dans la production courante de l'IPC. Enfin, l'amélioration de la source des données sur les caractéristiques de qualité serait utile, que l'approche hédonique soit ou non retenue pour les corrections de qualité. Cela pourrait notamment se faire par l'adoption de la formule de la liste de contrôle, qui est la procédure actuellement en vigueur aux États-Unis et en Suède.

    Date de diffusion : 1999-05-13

  • Articles et rapports : 62F0014M1998011
    Géographie : Canada
    Description :

    Ce document est le deuxième d'une série qui fait le point sur les résultats d'une étude ayant pour objet d'explorer la faisabilité d'utiliser l'approche hédonique pour apporter des corrections de qualité à la composante de l'habillement de l'indice des prix à la consommation (IPC). Dans cette phase de l'étude, nous avons élaboré deux listes de contrôle préliminaires pour obtenir des prix et des caractéristiques de qualité sur les chemises de ville pour hommes et les vestons sport pour hommes. On a ensuite employé ces listes pour recueillir des données sur place à l'égard d'échantillons étendus de l'IPC pour ces deux articles. Jusqu'à maintenant, la base de données sur les chemises de ville pour hommes a servi à dériver un modèle hédonique. Voici les principales conclusions qu'on peut faire jusqu'ici : 1) les listes de contrôle constituent une amélioration marquée par rapport à la méthode d'observation actuelle, et elle devrait être poursuivie pour tous les articles d'habillement de l'IPC; 2) si l'approche hédonique de correction de qualité des articles d'habillement doit être officiellement adoptée, il faudra alors augmenter la taille des échantillons de l'IPC, du moins de façon périodique, afin de permettre une estimation; 3) nous avons besoin d'une plus grande expérience de l'approche hédonique en mode de recherche, en utilisant des articles d'habillement plus complexes, avant de pouvoir dire si cette approche devrait officiellement remplacer la méthode actuelle de correction de qualité des articles d'habillement.

    Date de diffusion : 1999-05-13

  • Articles et rapports : 62F0014M1998012
    Géographie : Canada
    Description :

    Le présent document examine les méthodes d'ajustement utilisées pour tenir compte de la variation de qualité dans l'Indice des Prix à la Consommation canadien pour la période 1989-1994. On y constate que, dans la plupart des cas, la pratique canadienne actuelle fait en sorte que le remplacement d'un produit par un autre, d'une variété de produit par une autre ou d'un point de vente par un autre n'ait aucune répercussion sur l'indice global. Les principales exceptions à ce résultat surviennent au moment du remplacement des variétés de produits qui ne sont achetés qu'occasionnellement, et lorsqu'à la suite d'un choix au jugé, il est établi que le ratio de qualité de l'ancienne variété par rapport à la nouvelle ne correspond pas au ratio de leurs prix. Dans ces cas, il y a sur l'indice un effet ascendant ou descendant, selon que la variation de prix signalée est plus élevée ou plus basse que la variation de qualité. Au cours de ces six années visées par cette étude, il y a eu une corrélation entre le rapport des prix d'une variété et ses remplacements et le mouvement de l'indice qui résulte du choix au jugé. Le sens et l'ampleur de la répercussion sur l'indice dépend en grande partie du fait qu'un article est remplacé par un autre dont le prix est plus élevé ou plus bas. Pour ces raisons, le papier conclut que plus d'attention devrait être consacrée à faire en sorte que la sélection de produits soit plus représentative des ventes actuelles que dans le passé.

    Date de diffusion : 1999-05-13

  • Enquêtes et programmes statistiques — Documentation : 12-001-X19980024349
    Description :

    La mesure des flux bruts de la population active est un objectif important des enquêtes continues sur la population active effectuées par un grand nombre d'offices nationaux de la statistique. Cependant, il est bien connu que l'estimation de ces flux peut être compliquée par une non-réponse, des erreurs de mesure, un renouvellement de l'échantillon et des effets complexes du plan de sondage. Le présent article, inspiré par des modèles de non-réponse dans les enquêtes sur les ménages, porte sur l'estimation des flux bruts tout en apportant des ajustements en fonction de la non-réponse dont il faut tenir compte. Les approches antérieures basées sur un modèle en ce qui concerne l'estimation des flux bruts supposaient que la non-réponse était un processus au niveau de la personne. Nous proposons une catégorie de modèles qui permettent une non-réponse dont il faut tenir compte au niveau du ménage. On a recours à une étude en simulation pour démontrer que les estimations des flux bruts de la population active au niveau de la personne provenant des données d'enquêtes sur les ménages peuvent être biaisées et que les estimations en fonction de modèles au niveau du ménage peuvent permettre de réduire ce biais.

    Date de diffusion : 1999-01-14
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (161)

Analyses (161) (0 à 10 de 161 résultats)

  • Revues et périodiques : 75F0002M
    Description :

    Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.

    Date de diffusion : 2019-06-21

  • Articles et rapports : 13-604-M2019001
    Description :

    Cette documentation donne un aperçu d’une première étape vers un programme plus complet d’estimations des répartitions annuelles pour le secteur des ménages dans les comptes macroéconomiques canadiens. Elle présente également la méthodologie utilisée pour élaborer, dans les CERSM, des répartitions du patrimoine pour le secteur des ménages des comptes du bilan national (CBN) pour les années de référence 2010 à 2018.

    Date de diffusion : 2019-03-27

  • Articles et rapports : 13-604-M2018087
    Description :

    Statistique Canada publie régulièrement des indicateurs macroéconomiques sur les actifs, les passifs et la valeur nette des ménages dans le cadre des comptes du bilan national (CBN) trimestriels. Ces comptes correspondent aux plus récentes normes internationales et constituent la source des estimations du patrimoine national pour tous les secteurs de l’économie, y compris les ménages, les institutions sans but lucratif, les administrations publiques et les sociétés, de même que la position du Canada en matière de richesse par rapport au reste du monde. Bien que les CBN fournissent des renseignements de grande qualité sur la position globale des ménages relativement aux autres secteurs économiques, ils ne possèdent pas la granularité requise pour comprendre les vulnérabilités de certains groupes particuliers et les conséquences qui en résultent sur le plan du bien-être économique et de la stabilité financière.

    Date de diffusion : 2018-03-22

  • Stats en bref : 11-001-X201711116381
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-04-21

  • Articles et rapports : 11-522-X201700014711
    Description :

    Après le Recensement de 2010, le U.S. Census Bureau a mené deux projets de recherche distincts, en vue d’apparier des données d’enquête et des bases de données. Dans le cadre d’une étude, on a procédé à un appariement avec la base de données du tiers Accurint, et dans un autre cas, avec les fichiers du National Change of Address (NCOA) du U.S. Postal Service. Dans ces deux projets, nous avons évalué l’erreur de réponse dans les dates de déménagement déclarées en comparant les dates de déménagement autodéclarées et les enregistrements de la base de données. Nous avons fait face aux mêmes défis dans le cadre des deux projets. Le présent document aborde notre expérience de l’utilisation des « mégadonnées », en tant que source de comparaison pour les données d’enquête, ainsi que les leçons que nous avons apprises pour des projets futurs similaires à ceux que nous avons menés.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014722
    Description :

    Le U.S. Census Bureau cherche des façons d’intégrer des données administratives dans les opérations des recensements décennaux et des enquêtes. Pour mener ces travaux, il est essentiel de comprendre la couverture de la population dans les dossiers administratifs. À partir de données administratives fédérales et de tiers couplées avec celles de l’American Community Survey (ACS), nous évaluons dans quelle mesure les dossiers administratifs fournissent des données sur les personnes nées à l’étranger dans l’ACS, et nous utilisons des techniques de régression logistique multinomiale pour évaluer les caractéristiques de celles qui figurent dans les dossiers administratifs par rapport à celles qui n’y figurent pas. Nous avons déterminé que, dans l’ensemble, les dossiers administratifs fournissent une bonne couverture des personnes nées à l’étranger dans notre échantillon pour lesquelles un appariement peut être déterminé. La probabilité de figurer dans les dossiers administratifs semble être liée aux processus d’assimilation des immigrants : la naturalisation, une meilleure connaissance de la langue anglaise, le niveau de scolarité, et un emploi à temps plein étant associés à une plus grande probabilité de figurer dans les dossiers administratifs. Ces résultats laissent supposer qu’au fur et à mesure que les immigrants s’adaptent à la société américaine et s’y intègrent, ils sont plus susceptibles de participer aux processus et aux programmes gouvernementaux et commerciaux pour lesquels nous incluons des données. Nous explorons ensuite la couverture des dossiers administratifs pour les deux groupes raciaux/ethniques les plus importants de notre échantillon, à savoir les personnes nées à l’étranger de race hispanique et de race asiatique unique non hispanique, en déterminant encore une fois que les caractéristiques liées à l’assimilation sont associées à une couverture des deux groupes dans les dossiers administratifs. Toutefois, nous observons que le contexte du quartier a des répercussions différentes sur les personnes d’origine hispanique et asiatique.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014723
    Description :

    Le U.S. Census Bureau est à la recherche de façons d’utiliser les dossiers administratifs dans les opérations d’enquête et les opérations décennales afin de réduire les coûts et le fardeau des répondants, tout en préservant la qualité des données. Parmi les utilisations possibles des dossiers administratifs figure l’utilisation des données en l’absence de réponses sur la race et l’origine hispanique. Lorsque les dossiers administratifs fédéraux et de tiers sont compilés, les réponses concernant la race et l’origine hispanique ne sont pas toujours les mêmes pour la même personne dans les différentes sources de dossiers administratifs. Nous explorons différents ensembles de règles opérationnelles servant à attribuer une réponse pour la race et l’origine hispanique lorsque ces réponses diffèrent entre les sources. Nous décrivons aussi les caractéristiques des personnes dont les données sur la race et l’origine hispanique correspondent, ne correspondent pas et sont manquantes pour plusieurs variables démographiques, des ménages et contextuelles. Nous avons déterminé que les personnes appartenant à des minorités, et plus particulièrement les personnes d’origine hispanique, sont plus susceptibles d’avoir des réponses sur l’origine hispanique et la race qui ne correspondent pas dans les dossiers administratifs que dans le Recensement de 2010. Les Hispaniques sont moins susceptibles d’avoir des données manquantes sur l’origine hispanique, mais plus susceptibles d’avoir des données manquantes sur la race dans les dossiers administratifs. Les Asiatiques non hispaniques et les habitants des îles du Pacifique non hispaniques sont plus susceptibles d’avoir des données manquantes sur la race et l’origine hispanique dans les dossiers administratifs. Les personnes plus jeunes, les locataires, les personnes vivant dans des ménages de deux personnes ou plus, les personnes qui ont répondu au recensement dans le cadre de l’opération de suivi de la non-réponse ainsi que les personnes résidant dans des régions urbaines sont plus susceptibles d’avoir des réponses sur la race et l’origine ethnique qui ne correspondent pas.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014724
    Description :

    À l’Institut national de santé publique du Québec, le Système intégré de surveillance des maladies chroniques du Québec (SISMACQ) est utilisé quotidiennement depuis environ quatre ans. Les bénéfices de ce système sont nombreux pour mesurer plus précisément l’ampleur des maladies, pour évaluer adéquatement l’utilisation des services de santé et pour identifier certains groupes à risque. Or, au fil des mois, divers problèmes sont apparus et ont nécessité une réflexion plus ou moins longue et élaborée. Des problèmes touchant différentes sphères d’activité, du jumelage à la qualité des données en passant par la coordination entre de multiples utilisateurs et le respect des obligations légales. Cette présentation a pour objet de décrire les principaux défis associés à l’utilisation des données du SISMACQ, ainsi que de présenter quelques pistes de solution. Sera notamment abordé le traitement de cinq sources de données qui proviennent non seulement de cinq sources différentes, mais dont l’utilité première n’est pas la surveillance des maladies chroniques. La qualité variable des données, autant entre fichiers qu’à l’intérieur d’un même fichier, sera aussi discutée. Certaines situations reliées à l’utilisation simultanée du système par plusieurs utilisateurs seront aussi exposées. Des exemples d’analyses sur de grands ensembles de données ayant causé des tracas seront donnés. Également, quelques défis entourant la divulgation et le respect des ententes légales seront brièvement évoqués.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014743
    Description :

    Le couplage probabiliste est susceptible de donner des erreurs d’appariement telles que les faux positifs et les faux négatifs . Dans de nombreux cas, ces erreurs peuvent être mesurées fiablement par des vérifications manuelles, c’est-à-dire l’inspection visuelle d’un échantillon de paires d’enregistrements pour déterminer si elles sont appariées. Nous décrivons un cadre pour la bonne exécution de ces vérifications qui se fonde sur un échantillon probabiliste de paires, des vérifications indépendantes répétées de mêmes paires et une analyse de classes latentes pour tenir compte des erreurs de vérification manuelle.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014758
    Description :

    "Plusieurs secteurs de compétence au Canada, y compris l’Ontario, utilisent dans leurs modèles de financement des données sur les soins de santé axées sur les patients. Ces initiatives peuvent influencer la qualité de ces données, tant de façon positive que négative, les personnes ayant tendance à accorder davantage d’attention aux données et à leur qualité lorsqu’elles servent à prendre des décisions financières. La formule de financement de l’Ontario utilise des données de plusieurs bases de données nationales hébergées par l’Institut canadien d’information sur la santé (ICIS). Ces bases de données fournissent des renseignements sur les activités et le statut clinique des patients pour un continuum de soins. Comme les modèles de financement peuvent influencer le comportement du codage, l’ICIS collabore avec le Ministère ontarien de la santé et des soins de longue durée, afin d’évaluer et de contrôler la qualité de ces données. L’ICIS utilise un logiciel de forage des données et des techniques de modélisation (qui sont souvent associées aux « mégadonnées »), afin de déceler les anomalies dans les données pour plusieurs facteurs. Les modèles déterminent les tendances de codage clinique « typiques » pour des groupes clés de patients (p. ex. les patients vus dans des unités de soins spéciaux ou renvoyés chez eux pour des soins à domicile), afin que des valeurs aberrantes puissent être déterminées, lorsque les patients ne s’inscrivent pas dans la tendance attendue. Une composante clé de la modélisation est la segmentation des données selon les caractéristiques du patient, du fournisseur et de l’hôpital, afin de tenir compte des différences principales dans la prestation des soins de santé et les populations de patients dans la province. L’analyse de l’ICIS a permis d’identifier plusieurs hôpitaux dont les pratiques de codage semblent changer ou être significativement différentes par rapport à celles de leur groupe de pairs. Des examens plus poussés sont requis pour comprendre pourquoi ces différences existent et pour élaborer des stratégies appropriées pour atténuer les variations. "

    Date de diffusion : 2016-03-24
Références (80)

Références (80) (0 à 10 de 80 résultats)

  • Enquêtes et programmes statistiques — Documentation : 12-606-X
    Description :

    Ceci est une trouse destiné à aider des producteurs et des utilisateurs de données à l'externe de Statistique Canada.

    Date de diffusion : 2017-09-27

  • Enquêtes et programmes statistiques — Documentation : 91F0015M2017013
    Description :

    Au moyen d’un couplage d’enregistrements, le présent article compare le lieu de résidence indiqué dans le Recensement de 2011 à celui du fichier T1 sur la famille (T1FF) de 2010. Il en ressort que si le niveau de correspondance du lieu de résidence est relativement élevé en général, il fléchit, parfois de manière importante, pour certaines franges de la population.

    Date de diffusion : 2017-09-26

  • Enquêtes et programmes statistiques — Documentation : 12-586-X
    Description : Le Cadre d’assurance de la qualité (CAQ) est l’outil de gouvernance de niveau le plus élevé pour la gestion de la qualité à Statistique Canada. Il fournit un aperçu des stratégies de gestion de la qualité et d’atténuation des risques adoptées par les différents secteurs de programme de l’organisme. Le CAQ est utilisé conjointement avec les pratiques de gestion de Statistique Canada, comme celles décrites dans les Lignes directrices concernant la qualité.
    Date de diffusion : 2017-04-21

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014707
    Description :

    L’Enquête sur la population active (EPA) est une enquête menée auprès d’environ 56 000 ménages, qui fournit des renseignements sur le marché du travail au Canada. La piste de vérification est une option de programmation Blaise pour les enquêtes comme l’EPA, avec interviews assistées par ordinateur (IAO), qui crée des fichiers comprenant chaque frappe au clavier, des résultats de vérification des données ainsi qu’une indication horaire de chaque tentative de collecte faite auprès de tous les ménages. La combinaison d’une enquête de grande taille et d’une source aussi complète de paradonnées ouvre la porte à une analyse approfondie de la qualité des données, mais entraîne aussi des défis au chapitre des mégadonnées. Comment peut-on extraire des renseignements utiles de ce grand ensemble de frappes au clavier et d’indications horaires? Comment cela peut-il contribuer à évaluer la qualité de la collecte des données de l’EPA? La présentation décrira certains des défis qui se sont posés et les solutions qui ont été utilisées pour les relever, ainsi que les résultats de l’analyse de la qualité des données.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014716
    Description :

    Les données administratives, selon leur source et leur objectif original, peuvent être considérées comme plus fiables au chapitre de l’information que les données recueillies dans le cadre d’une enquête. Elles ne nécessitent pas qu’un répondant soit présent et comprenne le libellé des questions, et elles ne sont pas limitées par la capacité du répondant à se rappeler des événements rétrospectivement. La présente communication compare certaines données d’enquête, comme des variables démographiques, tirées de l’Étude longitudinale et internationale des adultes (ELIA), à diverses sources administratives pour lesquelles des ententes de couplage avec l’ELIA sont en place. La correspondance entre les sources de données, et certains des facteurs qui pourraient l’affecter, sont analysés pour divers aspects de l’enquête.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014717
    Description :

    Les fichiers comprenant des données couplées du Système d’information sur les étudiants postsecondaires (SIEP) de Statistique Canada et des données fiscales peuvent servir à examiner les trajectoires des étudiants qui poursuivent des études postsecondaires (EPS) et leurs résultats sur le marché du travail par la suite. D’une part, les données administratives sur les étudiants couplées de façon longitudinale peuvent fournir des renseignements agrégés sur les trajectoires des étudiants pendant leurs études postsecondaires, comme les taux de persévérance, les taux de diplomation, la mobilité, etc. D’autre part, les données fiscales peuvent compléter le SIEP et fournir des renseignements sur les résultats au chapitre de l’emploi, comme la rémunération moyenne et médiane ou la progression de la rémunération selon le secteur d’emploi (industrie), le domaine d’études, le niveau de scolarité et/ou d’autres données démographiques, année après année suivant l’obtention du diplôme. Deux études longitudinales pilotes ont été menées au moyen de données administratives sur les étudiants postsecondaires d’établissements des Maritimes, qui ont été couplées de façon longitudinale et avec le fichier de données fiscales de Statistique Canada (le fichier sur la famille T1) pour les années pertinentes. Cet article met d’abord l’accent sur la qualité des renseignements compris dans les données administratives et sur la méthode utilisée pour mener ces études longitudinales et calculer des indicateurs. En deuxième lieu, elle portera sur certaines limites liées à l’utilisation de données administratives, plutôt que de données d’enquête, pour définir certains concepts.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014725
    Description :

    Les données fiscales sont de plus en plus exploitées pour la mesure et l’analyse de la population et de ses caractéristiques. Un des enjeux soulevés par l’utilisation croissante de ce type de données concerne la définition du concept du lieu de résidence. Si le recensement se base sur le concept du lieu habituel de résidence, les données fiscales nous renseignent sur l’adresse postale des déclarants. Au moyen d’un couplage d’enregistrements entre le recensement, l’Enquête nationale auprès des ménages et les données fiscales du fichier T1 sur la famille, cette étud

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014726
    Description :

    La migration interne constitue l’une des composantes de l’accroissement démographique estimées à Statistique Canada. Elle est estimée en comparant l’adresse des individus au début et à la fin d’une période donnée. Les principales données exploitées sont celles de la Prestation fiscale canadienne pour enfants et celles du fichier T1 sur la famille. La qualité des adresses et la couverture de sous-populations plus mobiles jouent un rôle capital dans le calcul d’estimations de bonne qualité. L’objectif de cet article est de présenter les résultats d’évaluations reliées à ces aspects, profitant de l’accès à un plus grand nombre de sources de données fiscales à Statistique Canada.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 12-001-X201200111680
    Description :

    Les données d'enquête peuvent être falsifiées par les intervieweurs, la fabrication de données étant la forme de falsification la plus flagrante. Même un petit nombre d'interviews contrefaites peuvent fausser gravement les résultats d'analyses empiriques subséquentes. Outre l'exécution de réinterviews, certaines approches statistiques ont été proposées pour repérer ce genre de comportement frauduleux. À l'aide d'un petit ensemble de données, le présent article illustre comment la classification automatique, qui n'est ordinairement pas employée dans ce contexte, pourrait être utilisée pour repérer les intervieweurs qui falsifient les tâches qui leur sont assignées. Plusieurs indicateurs sont combinés pour classer les intervieweurs « à risque » en se fondant uniquement sur les données recueillies. Cette classification multivariée semble supérieure à l'utilisation d'un seul indicateur tel que la loi de Benford.

    Date de diffusion : 2012-06-27

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2011001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2009. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2011-06-16
Date de modification :