Assurance de la qualité

Aide à l'ordre
entrées

Résultats

Tout (239)

Tout (239) (190 à 200 de 239 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015684
    Description :

    Il arrive souvent qu'on recueille, de façon pratiquement simultaée, la même information sur plusieurs enquêtes différentes. En France, cela est institutionnalisé dans les enquêtes auprès des ménages qui comportent un tronc commun de variables portant sur la situation démographique, l'emploi, le logement et les revenus. Ces variables sont des cofacteurs importants des variables d'intérêt de chacune des enquêtes et leur utilisation judicieuse peut permettre un renforcement des estimations dans chacune d'elle. Les techniques de calage sur information incertaine peuvent s'appliquer de façon naturelle dans ce contexte. Cela revient à rechercher le meilleur estimateur sans biais des variables communes et à caler chacune des enquêtes sur cet estimateur. Il se trouve que l'estimateur ainsi obtenu dans chaque enquête est toujours un estimateur linéaire dont les pondérations sont faciles à expliciter, que la variance s'obtient sans problème nouveau de même que l'estimation de variance. Si on veut compléter la panoplie des estimateurs par régression, on peut aussi voir cette technique comme un estimateur par ridge-regression, ou encore comme une estimation par régression bayésienne.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015686
    Description :

    Deux instruments, à savoir les carnets et les interviews sur place, sont utilisés dans le cadre de la U.S. Consumer Expenditure Survey pour recueillir des données sur un grand nombre de catégories de dépenses de consommation. Il importe donc de bien se servir de ces données pour évaluer les dépenses moyennes et les paramètres connexes. On peut procéder de trois façons, à savoir 1) utiliser uniquement les données provenant des carnets, 2) utiliser uniquement les données provenant des interviews et 3)utiliser la méthode généralisée des moindres carrés, ou une méthode connexe, pour combiner les données provenant des carnets et des interviews. Jusqu'à présent, le U.S. Bureau of Labor Statistics s'est concentré sur les options 1) et 2) pour calculer les estimations au niveau des codes à cinq ou à six chiffres du Système de classification universelle. L'évaluation et la mise en oeuvre éventuelle de l'option 3) dépendent de plusieurs facteurs, y compris les biais de mesure qui pourraient entacher les données des carnets et des interviews, la grandeur empirique de ces biais comparativement aux erreurs-types des estimateurs habituels de la moyenne, ainsi que le degré d'homogénéité de ces biais d'une strate et d'une période à l'autre. Le présent article débute par l'examen de certains problèmes posés par les options 1) à 3), qui est suivi par la description d'une méthode généralisée des moindres carrés relativement simple permettant d'appliquer l'option 3) et enfin par une discussion des tests diagnostiques nécessaires pour évaluer la faisabilité et l'efficacité relative de la méthode généralisée des moindres carrés.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015688
    Description :

    Des données de sources multiples sont couplées pour examiner les liens géographique et temporel entre la pollution atmosphérique et l'asthme. Ces sources incluent les dossiers administratifs établis par 59 cabinets de médecins généralistes répartis à travers l'Angleterre et le Pays de Galles au sujet d'un demi million de patients venus à la consultation pour cause d'asthme, ainsi que des renseignements socioéconomiques recueillis dans le cadre d'une enquête par interview. Les codes postaux permettent de coupler ces données à celles sur i) la densité routière calculée pour les routes locales, ii) les émissions estimatives de dioxyde de soufre et d'oxydes d'azote, iii) la concentration de fumée noire, de dioxyde de soufre, de dioxyde d'azote et d'autres polluants mesurée ou interpolée aux emplacements des cabinets de médecins. Parallèlement, on analyse des séries chronologiques de Poisson, en tenant compte des variations entre cabinets de médecins, pour examiner les corrélations quotidiennes dans le cas des cabinets situés près des stations de surveillance de la qualité de l'air. Les analyses préliminaires montrent une association faible, en général non significative, entre les taux de consultations et les marqueurs de pollution. On examine les problèmes méthodologiques que posent la combinaison de données de ce genre et l'interprétation des résultats.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015690
    Description :

    La construction de l'échantillon virtuel est réalisé en deux étapes. La première consiste, en partant d'un panel maître, à effectuer une Analyse des Correspondances Multiples (ACM) sur des variables fondamentales pour l'étude. Puis, on génére aléatoirement des individus muets à partir de la distribution de chaque facteur significatif de l'analyse. Enfin, pour chaque individu, on génére une valeur pour chaque variable fondamentale la plus liée à un des facteurs précédents. Cette méthode assure un tirage indépendant d'ensembles de variables. La seconde étape consiste à greffer un certain nombre d'autres bases de données, dont on donnera les propriétés requises. On génére une variable à rajouter à l'aide de sa distribution estimée, avec un modèle linéaire généralisé en fonction des variables communes et celles qui ont déjà été rajoutées. Le même procédé est alors utilisé pour greffer les autres échantillons. Nous avons appliqué cette méthode pour générer un échantillon virtuel à partir de deux enquêtes. L'échantillon virtuel généré a été validé à l'aide de tests de comparaison d'échantillons. Les résultats obtenus sont positifs et montrent la faisabilité de cette méthode.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015692
    Description :

    Les tarifs d'électricité qui varient selon la période de la journée, appelés aussi tarifs horaires ou tarifs multiples, sont susceptibles d'accroître considérablement l'efficacité économique du marché de l'énergie. Plusieurs services publics d'électricité ont étudié les effets économiques des programmes de tarification selon la période de consommation offerts à leur clientèle résidentielle. On recourt ici à la méta-analyse pour regrouper les résultats de trente-huit programmes distincts en vue d'étudier l'effet des tarifs multiples sur la demande d'électricité. Quatre constations importantes se dégagent de l'analyse. Premièrement, le rapport entre le tarif de période de pointe et le tarif en période creuse doit être élevé pour que l'effet sur la demande de pointe soit important. Deuxièmement, les tarifs de période de pointe ontune incidence relativement plus importante sur la demande en été qu'en hiver. Troisièmement, les tarifs sont relativement plus efficaces s'ils sont sur une base permanente plutôt qu'expérimentale. Quatrièmement, la perception de frais en fonction de la demande concurrence les tarifs multiples ordinaires sur la demande de pointe.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015694
    Description :

    Nous nous servons de données sur 14 populations de saumons coho pour estimer les paramètres essentiels à la gestion des peuplements de poissons. L'estimation de paramètres à partir d'ensembles individuels de données étant inefficace et parfois fortement biaisée, nous recherchons des méthodes permettant de surmonter ces problèmes. La combinaison d'ensembles de données au moyen de modèles non linéaires à effets mixtes donne de meilleurs résultats, mais oblige à étudier les problèmes d'influence et de robustesse. Aux fins de comparaison, nous obtenons des estimations robustes. Nous étudions aussi la robustesse du modèle au moyen d'une famille de formes fonctionnelles de rechange. Les résultats permettent de calculer facilement les limites d'exploitation et pourraient contribuer à prevenir l'épuisement des peuplements de poissons. Des méthodes semblables peuvent être appliquées dans d'autres contextes où l'estimation de paramètres fait partie d'un processus de prise de décision plus général.

    Date de diffusion : 2000-03-02

  • Articles et rapports : 12-001-X19990024876
    Description :

    Leslie Kish décrit les possibilités de combinaison de données d'enquêtes menées auprès de différentes populations, ainsi que les défis que cela pose. Mentionnons, à titre d'exemple, les enquêtes multinationales dans le cadre desquelles on combine, à des fins de comparaison et d'analyse, les données d'enquêtes menées dans plusieurs pays et les données d'enquêtes périodiques cumulées de la même population. Par ailleurs, il compare et met en contraste la combinaison des enquêtes et la combinaison des expériences.

    Date de diffusion : 2000-03-01

  • Articles et rapports : 12-001-X19990024877
    Description :

    Gordon Brackstone aborde d'abord la question de la qualité des produits d'un bureau de statistique national. Il définit six dimensions de la qualité des données: la pertinence, l'exactitude, la rapidité de diffusion de l'information, la possibilité d'interprétation et la cohérence. Puis, il décrit les composantes d'un appareil de gestion de qualité.

    Date de diffusion : 2000-03-01

  • Enquêtes et programmes statistiques — Documentation : 92-370-X
    Description :

    Description de la série

    Cette série comprend cinq produits de référence générale - l'Avant-goût des produits et services; le Catalogue; le Dictionnaire; Le recensement en bref et les Rapports techniques - ainsi que des produits de référence géographique - GéoSuite et les Cartes de référence.

    Description du produit

    Les rapports techniques traitent de la qualité des données du recensement de 1996, une entreprise vaste et complexe. Bien que tous les efforts possibles aient été déployés pour maintenir les normes de qualité élevées à toutes les étapes du recensement, il existe néanmoins un certain degré d'erreur dans les résultats. Chaque rapport examine les opérations de collecte et de traitement et fournit les résultats relatifs à l'évaluation de la qualité des données, de même que des notes relatives à la comparabilité historique des données.

    Les rapports techniques s'adressent aux utilisateurs déjà familiers avec les données du recensement, ainsi qu'aux spécialistes : ils sont cependant rédigés de façon à être utiles à tous les utilisateurs de données du recensement. La plupart des rapports techniques ont été annulés, sauf Âge, sexe, état matrimonial et union libre, Couverture et Échantillonnage et pondération. En plus d'être disponibles comme publications bilingues, vous les retrouverez gratuitement dans Internet, dans les deux langues officielles.

    Ce rapport porte sur les erreurs de couverture, qui sont survenues lorsque des personnes, des ménages, des logements ou des familles ont été omis lors du recensement ou dénombrés par erreur. Les erreurs de couverture constituent l'un des plus importants types d'erreur lors du recensement, étant donné qu'elles touchent non seulement la précision des chiffres des divers univers du recensement mais aussi la précision de toutes les données du recensement portant sur les caractéristiques de ces univers. À l'aide de ces renseignements, les utilisateurs peuvent évaluer les risques entourant des conclusions ou des décisions fondées sur les données du recensement.

    Date de diffusion : 1999-12-14

  • Avis et consultations : 11-522-X19980015010
    Description :

    En 1994, Statistique Canada a implanté une nouvelle enquête longitudinale à caractère social auprès de 23 000 enfants répartis dans 13 500 ménages. L'enquête longitudinale nationale sur les enfants et les jeunes a pour but de mesurer le développement et le bien-être des enfants jusqu'à l'âge adulte. Pour ce faire, l'enquête recueille de l'information au sujet de l'enfant, ses parents, son voisinage, son environnement familial et scolaire. Il s'en suit que les données reçues pour chaque enfant proviennent de plusieurs répondants, tant parents qu'enseignants, ce qui ajoute au risque de divulgation. Pour établir un juste équilibre entre le respect de la confidentialité et la capacité analytique des données diffusées, l'enquête produit trois fichiers de microdonnées ayant un contenu plus ou moins riche. Le fichier le plus complet n'est disponible que par accès à distance. Ainsi les chercheurs n'ont pas directement accès aux données mais envoient leurs demandes d'analyses sous forme de programme informatique qui sont excécutés par des employés de Statistique Canada. Les résultats de ces analyses sont scrutés avant d'être renvoyés aux chercheurs. La présentation porte sur les différents risques de divulgation d'une telle enquête et des moyens de les atténuer.

    Date de diffusion : 1999-10-22
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (161)

Analyses (161) (0 à 10 de 161 résultats)

  • Revues et périodiques : 75F0002M
    Description :

    Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.

    Date de diffusion : 2019-06-21

  • Articles et rapports : 13-604-M2019001
    Description :

    Cette documentation donne un aperçu d’une première étape vers un programme plus complet d’estimations des répartitions annuelles pour le secteur des ménages dans les comptes macroéconomiques canadiens. Elle présente également la méthodologie utilisée pour élaborer, dans les CERSM, des répartitions du patrimoine pour le secteur des ménages des comptes du bilan national (CBN) pour les années de référence 2010 à 2018.

    Date de diffusion : 2019-03-27

  • Articles et rapports : 13-604-M2018087
    Description :

    Statistique Canada publie régulièrement des indicateurs macroéconomiques sur les actifs, les passifs et la valeur nette des ménages dans le cadre des comptes du bilan national (CBN) trimestriels. Ces comptes correspondent aux plus récentes normes internationales et constituent la source des estimations du patrimoine national pour tous les secteurs de l’économie, y compris les ménages, les institutions sans but lucratif, les administrations publiques et les sociétés, de même que la position du Canada en matière de richesse par rapport au reste du monde. Bien que les CBN fournissent des renseignements de grande qualité sur la position globale des ménages relativement aux autres secteurs économiques, ils ne possèdent pas la granularité requise pour comprendre les vulnérabilités de certains groupes particuliers et les conséquences qui en résultent sur le plan du bien-être économique et de la stabilité financière.

    Date de diffusion : 2018-03-22

  • Stats en bref : 11-001-X201711116381
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-04-21

  • Articles et rapports : 11-522-X201700014711
    Description :

    Après le Recensement de 2010, le U.S. Census Bureau a mené deux projets de recherche distincts, en vue d’apparier des données d’enquête et des bases de données. Dans le cadre d’une étude, on a procédé à un appariement avec la base de données du tiers Accurint, et dans un autre cas, avec les fichiers du National Change of Address (NCOA) du U.S. Postal Service. Dans ces deux projets, nous avons évalué l’erreur de réponse dans les dates de déménagement déclarées en comparant les dates de déménagement autodéclarées et les enregistrements de la base de données. Nous avons fait face aux mêmes défis dans le cadre des deux projets. Le présent document aborde notre expérience de l’utilisation des « mégadonnées », en tant que source de comparaison pour les données d’enquête, ainsi que les leçons que nous avons apprises pour des projets futurs similaires à ceux que nous avons menés.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014722
    Description :

    Le U.S. Census Bureau cherche des façons d’intégrer des données administratives dans les opérations des recensements décennaux et des enquêtes. Pour mener ces travaux, il est essentiel de comprendre la couverture de la population dans les dossiers administratifs. À partir de données administratives fédérales et de tiers couplées avec celles de l’American Community Survey (ACS), nous évaluons dans quelle mesure les dossiers administratifs fournissent des données sur les personnes nées à l’étranger dans l’ACS, et nous utilisons des techniques de régression logistique multinomiale pour évaluer les caractéristiques de celles qui figurent dans les dossiers administratifs par rapport à celles qui n’y figurent pas. Nous avons déterminé que, dans l’ensemble, les dossiers administratifs fournissent une bonne couverture des personnes nées à l’étranger dans notre échantillon pour lesquelles un appariement peut être déterminé. La probabilité de figurer dans les dossiers administratifs semble être liée aux processus d’assimilation des immigrants : la naturalisation, une meilleure connaissance de la langue anglaise, le niveau de scolarité, et un emploi à temps plein étant associés à une plus grande probabilité de figurer dans les dossiers administratifs. Ces résultats laissent supposer qu’au fur et à mesure que les immigrants s’adaptent à la société américaine et s’y intègrent, ils sont plus susceptibles de participer aux processus et aux programmes gouvernementaux et commerciaux pour lesquels nous incluons des données. Nous explorons ensuite la couverture des dossiers administratifs pour les deux groupes raciaux/ethniques les plus importants de notre échantillon, à savoir les personnes nées à l’étranger de race hispanique et de race asiatique unique non hispanique, en déterminant encore une fois que les caractéristiques liées à l’assimilation sont associées à une couverture des deux groupes dans les dossiers administratifs. Toutefois, nous observons que le contexte du quartier a des répercussions différentes sur les personnes d’origine hispanique et asiatique.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014723
    Description :

    Le U.S. Census Bureau est à la recherche de façons d’utiliser les dossiers administratifs dans les opérations d’enquête et les opérations décennales afin de réduire les coûts et le fardeau des répondants, tout en préservant la qualité des données. Parmi les utilisations possibles des dossiers administratifs figure l’utilisation des données en l’absence de réponses sur la race et l’origine hispanique. Lorsque les dossiers administratifs fédéraux et de tiers sont compilés, les réponses concernant la race et l’origine hispanique ne sont pas toujours les mêmes pour la même personne dans les différentes sources de dossiers administratifs. Nous explorons différents ensembles de règles opérationnelles servant à attribuer une réponse pour la race et l’origine hispanique lorsque ces réponses diffèrent entre les sources. Nous décrivons aussi les caractéristiques des personnes dont les données sur la race et l’origine hispanique correspondent, ne correspondent pas et sont manquantes pour plusieurs variables démographiques, des ménages et contextuelles. Nous avons déterminé que les personnes appartenant à des minorités, et plus particulièrement les personnes d’origine hispanique, sont plus susceptibles d’avoir des réponses sur l’origine hispanique et la race qui ne correspondent pas dans les dossiers administratifs que dans le Recensement de 2010. Les Hispaniques sont moins susceptibles d’avoir des données manquantes sur l’origine hispanique, mais plus susceptibles d’avoir des données manquantes sur la race dans les dossiers administratifs. Les Asiatiques non hispaniques et les habitants des îles du Pacifique non hispaniques sont plus susceptibles d’avoir des données manquantes sur la race et l’origine hispanique dans les dossiers administratifs. Les personnes plus jeunes, les locataires, les personnes vivant dans des ménages de deux personnes ou plus, les personnes qui ont répondu au recensement dans le cadre de l’opération de suivi de la non-réponse ainsi que les personnes résidant dans des régions urbaines sont plus susceptibles d’avoir des réponses sur la race et l’origine ethnique qui ne correspondent pas.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014724
    Description :

    À l’Institut national de santé publique du Québec, le Système intégré de surveillance des maladies chroniques du Québec (SISMACQ) est utilisé quotidiennement depuis environ quatre ans. Les bénéfices de ce système sont nombreux pour mesurer plus précisément l’ampleur des maladies, pour évaluer adéquatement l’utilisation des services de santé et pour identifier certains groupes à risque. Or, au fil des mois, divers problèmes sont apparus et ont nécessité une réflexion plus ou moins longue et élaborée. Des problèmes touchant différentes sphères d’activité, du jumelage à la qualité des données en passant par la coordination entre de multiples utilisateurs et le respect des obligations légales. Cette présentation a pour objet de décrire les principaux défis associés à l’utilisation des données du SISMACQ, ainsi que de présenter quelques pistes de solution. Sera notamment abordé le traitement de cinq sources de données qui proviennent non seulement de cinq sources différentes, mais dont l’utilité première n’est pas la surveillance des maladies chroniques. La qualité variable des données, autant entre fichiers qu’à l’intérieur d’un même fichier, sera aussi discutée. Certaines situations reliées à l’utilisation simultanée du système par plusieurs utilisateurs seront aussi exposées. Des exemples d’analyses sur de grands ensembles de données ayant causé des tracas seront donnés. Également, quelques défis entourant la divulgation et le respect des ententes légales seront brièvement évoqués.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014743
    Description :

    Le couplage probabiliste est susceptible de donner des erreurs d’appariement telles que les faux positifs et les faux négatifs . Dans de nombreux cas, ces erreurs peuvent être mesurées fiablement par des vérifications manuelles, c’est-à-dire l’inspection visuelle d’un échantillon de paires d’enregistrements pour déterminer si elles sont appariées. Nous décrivons un cadre pour la bonne exécution de ces vérifications qui se fonde sur un échantillon probabiliste de paires, des vérifications indépendantes répétées de mêmes paires et une analyse de classes latentes pour tenir compte des erreurs de vérification manuelle.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 11-522-X201700014758
    Description :

    "Plusieurs secteurs de compétence au Canada, y compris l’Ontario, utilisent dans leurs modèles de financement des données sur les soins de santé axées sur les patients. Ces initiatives peuvent influencer la qualité de ces données, tant de façon positive que négative, les personnes ayant tendance à accorder davantage d’attention aux données et à leur qualité lorsqu’elles servent à prendre des décisions financières. La formule de financement de l’Ontario utilise des données de plusieurs bases de données nationales hébergées par l’Institut canadien d’information sur la santé (ICIS). Ces bases de données fournissent des renseignements sur les activités et le statut clinique des patients pour un continuum de soins. Comme les modèles de financement peuvent influencer le comportement du codage, l’ICIS collabore avec le Ministère ontarien de la santé et des soins de longue durée, afin d’évaluer et de contrôler la qualité de ces données. L’ICIS utilise un logiciel de forage des données et des techniques de modélisation (qui sont souvent associées aux « mégadonnées »), afin de déceler les anomalies dans les données pour plusieurs facteurs. Les modèles déterminent les tendances de codage clinique « typiques » pour des groupes clés de patients (p. ex. les patients vus dans des unités de soins spéciaux ou renvoyés chez eux pour des soins à domicile), afin que des valeurs aberrantes puissent être déterminées, lorsque les patients ne s’inscrivent pas dans la tendance attendue. Une composante clé de la modélisation est la segmentation des données selon les caractéristiques du patient, du fournisseur et de l’hôpital, afin de tenir compte des différences principales dans la prestation des soins de santé et les populations de patients dans la province. L’analyse de l’ICIS a permis d’identifier plusieurs hôpitaux dont les pratiques de codage semblent changer ou être significativement différentes par rapport à celles de leur groupe de pairs. Des examens plus poussés sont requis pour comprendre pourquoi ces différences existent et pour élaborer des stratégies appropriées pour atténuer les variations. "

    Date de diffusion : 2016-03-24
Références (80)

Références (80) (60 à 70 de 80 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015018
    Description :

    Dans la présente communication, nous décrivons une méthode pour le traitement de données longitudinales concernant des personnes qui font partie de plus d'une unité, à un niveau supérieur, et au sujet desquelles il manque des renseignements pour l'identification des unités auxquelles appartiennent ces personnes. Dans le domaine de l'éducation, par exemple, un élève peut être classé comme appartenant tour à tour à une école primaire et à une école secondaire en particulier, mais dans le cas de certains élèves, il se peut qu'on ne connaisse ni le nom de l'école primaire, ni celui de l'école secondaire. De manière analogue, dans le cadre d'une étude longitudinale, des élèves peuvent changer d'école ou de classe entre deux périodes et appartenir ainsi à plus d'une unité de niveau supérieur. La méthode utilisée pour modéliser ces structures est une généralisation d'un modèle à effets aléatoires et à niveaux multiples de recoupement.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015020
    Description :

    Fin 1993, Eurostat a pris la décision de lancer un panel communautaire de ménages. La première vague, réalisée en 1994 dans les douze pays de l'Union, a touché en France environ 7.300 ménages, comportant un peu plus de 14.000 adultes de 17 ans ou plus. Chaque individu devait alors être suivi et interrogé chaque année, même en cas de déménagement. Les individus disparaissant de l'échantillon présentent un profil particulier. Dans une première partie, nous présentons le schéma d'évolution de notre échantillon ainsi qu'une analyse des caractéristiques principales des non-répondants. Nous proposons ensuite deux modèles de correction de la non-réponse par catégories homogènes. Nous décrivons ensuite les distributions des poids longitudinaux obtenus selon les deux modèles, et des poids transversaux dérivés, calculés selon la méthode de partage des poids. Nous comparons enfin les valeurs de quelques indicateurs estimés à l'aide de l'un ou l'autre jeu de pondérations.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015021
    Description :

    Le U.S. Bureau of the Census a apporté des modifications importantes au plan de sondage de la Survey of Income and Program Participation (SIPP). Ces modifications importantes ont commencé à être appliquées au panel qui a débuté en 1996. Comme le plan de sondage révisé met l'accent sur les applications longitudinales plutôt que transversales, le Census Bureau s'est efforcé de comprendre et de résoudre le problème de biais dû à la lisière, qui est courant dans le cas des enquêtes longitudinales. Parallèlement au remaniement fondamental et administratif de l'enquête, le Census Bureau est en train d'améliorer les méthodes de traitement des données servant à produire les fichiers de microdonnées à grande diffusion. Les produits de données de chaque vague sont soumis à des vérifications et à des imputations longitudinales plutôt que transversales, avec transfert de données d'une vague précédente pour remplacer celles qui manquent dans la vague courante. Les produits de données longitudinales seront améliorés tant par le remaniement de l'enquête que par les nouvelles méthodes de traitement. Les méthodes simples d'imputation des données au cours du temps seront remplacées par des méthodes plus raffinées qui tendent à atténuer le problème du biais dû à la lisière. L'échantillon longitudinal sera agrandi de façon à inclure plus d'observations sur des personnes qui étaient des non-répondants durant une ou plusieurs vagues. On appliquera des poids longitudinaux aux fichiers pour soutenir l'analyse longitudinale axée sur les personnes pour les années civiles ou pour de plus longues périodes (jusqu'à quatre ans).

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015022
    Description :

    La présente communication élargit et développe la méthode proposée par Pfeffermann, Skinner et Humphreys (1998) pour l'estimation de mouvements bruts en présence d'erreurs de classification. L'élément principal de la méthode en question est l'utilisation de renseignements complémentaires au niveau des individus, ce qui permet d'éviter de recourir à des données de validation pour l'estimation des taux d'erreur de classification. Les développements contenus dans la présente communication sont l'établissement de conditions permettant l'identification de modèles, une étude des caracéristiques de la qualité de l'ajustement d'un modèle et des modifications à la vraisemblance de l'échantillon afin de tenir compte des données manquantes et de l'échantillonnage informatif. Ces développements sont illustrés par une petite simulation fondée sur la méthode de Monte Carlo.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015023
    Description :

    L'étude de la mobilité sociale, par exemple entre situations sur le marché du travail ou entre niveaux de revenus, s'appuie souvent sur l'analyse de matrices de mobilité. Lorsqu'on compare ces matrices de transition, en vue d'évaluer les changements de comportements, on oublie souvent que les données sont issues d'une enquête par sondage, et qu'elles sont par conséquent affectées d'une variance d'échantillonnage. De même, on postule que les réponses collectées correspondent à la vraie valeur.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015024
    Description :

    Une étude longitudinale d'une cohorte d'élèves de l'école secondaire est menée dans une région de l'Italie depuis 1986 afin d'étudier la transition entre l'école et le marché du travail. Les renseignements ont été collectés à chaque étape au moyen d'un questionnaire envoyé par la poste et, à l'étape finale, au moyen d'une interview en salle de classe au cours de laquelle on a posé des questions rétrospectives portant sur l'ensemble de la période d'observation. Les flux bruts entre différents états discrets - toujours dans le système scolaire, sur le marché du travail mais inactif, sur le marché du travail et actif - peuvent ensuite être estimés à la fois à partir de donées prospectives et rétrospectives, et l'effet de mémoire peut être évalué. De plus, les conditions observées au moyen des deux techniques différentes peuvent être considérées comme deux indicateurs de la condition réelle non observable, ce qui nous amène à la spécification et à l'estimation d'un modèle de catégorie latente. Dans ce cadre de référence, une hypothèse de chaïne markovienne peut être introduite et évaluée de maniére à estimer les probabilités de transition entre les états, une fois ceux-ci corrigés ou les erreurs de classification. Puisque les renseignements collectés par la poste présentent une proportion importante de données manquantes sous forme de non-réponse d'unités, nous introduisons aussi la catégorie manquante dans le modèle applicable aux données prospectives.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015026
    Description :

    Le but de la présente étude est d'utiliser les données de panel de la Current Population Survey (CPS) pour examiner les effets de la non-réponse des unités. Étant donné que la plupart des non-répondants à la CPS sont des répondants durant au moins un mois de présence dans l'échantillon, on peut se servir des données relatives aux autres mois pour comparer les caractéristiques des personnes qui participent entièrement au panel avec les caractéristiques des non-répondants, ainsi que pour évaluer les méthodes de correction pour tenir compte de la non-réponse. Dans la présente communication, nous présentons des analyses fondées sur les données de panel de la CPS pour illustrer les effets de la non-réponse des unités. Après avoir apporté les corrections nécessaires pour tenir compte de l'absence de réponse, nous effectuons également des comparaisons visantà évaluer l'incidence de ces corrections. En outre, nous analysons la signification des constatations et les propositions de recherche ultérieure.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015027
    Description :

    La diffusion des résultats des enquêtes annuelles d'entreprise comporte immanquablement des statistiques en évolution. Comme l'univers économique est de plus en plus mouvant, une simple différence d'agrégats entre n-l et n ne suffit plus à décrire synthétiquement ce qui s'est passé. Le module de calcul d'évolution de la nouvelle génération d'EAE divise l'évolution en diverses composantes (naissances, cessations, changements de secteur), et détermine une évolution à champ constant en accordant une importance particulière aux restructurations. Les difficultés essentielles résident dans la détermination des sous-échantillons, la repondération, le recalage sur des évolutions calculables, et la prise en compte des restructurations.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015028
    Description :

    Nous abordons le problème de l'estimation des statistiques sur la dynamique du revenu calculées d'après les données d'enquêtes longitudinales complexes. En outre, nous comparons deux estimateurs (fondés sur le plan d'échantillonnage) de proportions longitudinales et de taux de transition, du point de vue de la variabilité, dans le cas de taux d'érosion élevé. Un des estimateurs est fondé sur des échantillons transversaux pour l'estimation des bornes de catégories de revenu à chaque période, ainsi que sur un échantillon longitudinal pour l'estimation des dénombrements longitudinaux. L'autre estimateur est entièrement fondé sur l'échantillon longitudinal pour l'estimation des bornes de catégories et pour les dénombrements longitudinaux. Nous établissons des estimateurs de variance par la linéarisation de Taylor, tant pour l'estimateur longitudinal que pour l'estimateur mixte, dans le cas où l'on présume qu'il n'y a aucun changement dans la population, et pour l'estimateur mixte, dans le cas où la population subit des changements.

    Date de diffusion : 1999-10-22

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015029
    Description :

    Dans le cas des enquêtes longitudinales, les sujets qui font partie de l'échantillon sont observés pendant plusieurs périodes. En général, cette caractéristique produit des observations dépendantes sur le même sujet, plus des corrélations ordinaires entre sujets résultant du plan d'échantillonnage. Nombre des travaux décrits dans la littérature portent surtout sur la modélisation de la moyenne marginale d'une réponse en fonction de covariables. Liang et Zeger (1986) se sont servis d'équations d'estimation généralisées nécessitant uniquement la spécification correcte de la moyenne marginale et ont obtenu les erreurs-types des estimations des paramètres de régression et les critères connexes du test de Wald, en supposant que les mesures répétées effectuées sur un sujet de l'échantillon présentent une structure de corrélation provisoire. Rotnitzky et Jewell (1990) ont développé des tests de quasi-résultat et des corrections de Rao-Scott aux tests de quasi-résultat provisoire dans le cadre de modèles marginaux. Ces méthodes sont asymptotiquement robustes en regard de la spécification erronée de la structure des corrélations propre à un sujet, mais supposent que les sujets de l'échantillon sont indépendants, ce qui n'est pas toujours vrai dans le cas de donneées d'enquêtes longitudinales complexes fondées sur un échantillonnage stratifié à plusieurs degrés. Nous proposons des tests de Wald et des tests de quasi-score asymptotiquement valides pour les données d'enquêtes longitudinales, fondés sur la méthode de linéarisation de Taylor et sur la méthode jackknife. Nous élaborons aussi d'autres tests, fondés sur les corrections apportées par Rao-Scott à des tests naïfs qui ne tiennent pas compte des caractéristiques du plan de sondage et sur les t de Bonferroni. Ces tests sont particulièrement utiles quand le nombre réel de degrés de liberté, ordinairement considéré comme égal au nombre total d'unités primaires dans l'échantillon (grappes) moins le nombre de strates, est petit.

    Date de diffusion : 1999-10-22
Date de modification :