Recherche par mot-clé

Aide à l'ordre
entrées

Résultats

Tout (88)

Tout (88) (10 à 20 de 88 résultats)

  • Articles et rapports : 12-001-X200800110610
    Description :

    Un nouvel estimateur par la régression généralisée d'un total de population finie basé sur la méthode de transformation de Box-Cox et son estimateur de la variance sont proposés sous un plan général de sondage à probabilités inégales. En étant convergent par rapport au plan de sondage, l'estimateur proposé retient la propriété de robustesse de l'estimateur GREG, même si le modèle sous jacent est défaillant. En outre, la méthode de Box-Cox permet de trouver automatiquement une transformation raisonnable de la variable dépendante en se servant des données. La robustesse et l'efficacité du nouvel estimateur sont évaluées analytiquement et par des études en simulation de Monte Carlo.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110611
    Description :

    En échantillonnage de populations finies, on dispose souvent d'information a priori sous la forme de renseignements partiels sur une variable auxiliaire, dont on connaît, par exemple, la moyenne. Dans de tels cas, on utilise fréquemment l'estimateur par le ratio et l'estimateur par la régression pour estimer la moyenne de population de la caractéristique d'intérêt. La loi a posteriori de Pólya a été établie à titre d'approche bayésienne non informative de l'échantillonnage. Son application est indiquée quand on ne dispose que de peu d'information a priori, voire aucune, au sujet de la population. Ici, nous montrons que cette loi peut être étendue afin d'y intégrer divers types d'information a priori partielle au sujet des variables auxiliaires. Nous verrons que cette approche produit généralement des méthodes ayant de bonnes propriétés fréquentistes, même dans certains cas où les méthodes fréquentistes classiques sont difficiles à appliquer.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110612
    Description :

    Lehtonen et Veijanen (1999) ont proposé un nouvel estimateur par la régression généralisée (GREG) assisté par modèle d'une moyenne de petit domaine sous un modèle à deux niveaux. Ils ont montré que l'estimateur proposé donne de meilleurs résultats que l'estimateur GREG habituel en ce qui concerne le biais relatif absolu moyen et l'erreur relative absolue médiane moyenne. Nous calculons l'erreur quadratique moyenne (EQM) du nouvel estimateur GREG sous le modèle à deux niveaux et nous la comparons à celle de l'estimateur fondé sur le meilleur prédicteur linéaire sans biais (BLUP). Nous présentons aussi des résultats empiriques concernant l'efficacité relative des estimateurs. Nous montrons que le nouvel estimateur GREG a de meilleures propriétés que l'estimateur GREG habituel en ce qui concerne l'EQM moyenne et l'erreur relative absolue moyenne. Nous montrons aussi que, parce qu'il emprunte de l'information aux petits domaines apparentés, l'estimateur EBLUP donne des résultats nettement meilleurs que l'estimateur GREG habituel et que le nouvel estimateur GREG. Nous fournissons les résultats de simulation sous un modèle, ainsi qu'en population finie réelle.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110614
    Géographie : Canada
    Description :

    L'Enquête sur la population active (EPA) réalisée au Canada permet de produire des estimations mensuelles du taux de chômage aux niveaux national et provincial. Le programme de l'EPA diffuse aussi des estimations du chômage pour des régions infraprovinciales, comme les régions métropolitaines de recensement (RMR) et les centres urbains (CU). Cependant, pour certaines de ces régions infraprovinciales, les estimations directes ne sont pas fiables, parce que la taille de l'échantillon est assez petite. Dans le contexte de l'EPA, l'estimation pour de petites régions a trait à l'estimation des taux de chômage pour des régions infraprovinciales telles que les RMR/CU à l'aide de modèles pour petits domaines. Dans le présent article, nous discutons de divers modèles, dont celui de Fay Herriot et des modèles transversaux ainsi que chronologiques. En particulier, nous proposons un modèle non linéaire intégré à effets mixtes sous un cadre hiérarchique bayésien (HB) pour l'estimation du taux de chômage d'après les données de l'EPA. Nous utilisons les données mensuelles sur les bénéficiaires de l'assurance emploi (a. e.) au niveau de la RMR ou du CU comme covariables auxiliaires dans le modèle. Nous appliquons une approche HB ainsi que la méthode d'échantillonnage de Gibbs pour obtenir les estimations des moyennes et des variances a posteriori des taux de chômage au niveau de la RMR ou du CU. Le modèle HB proposé produit des estimations fondées sur un modèle fiables si l'on s'en tient à la réduction du coefficient de variation. Nous présentons dans l'article une analyse d'ajustement du modèle et une comparaison des estimations fondées sur le modèle aux estimations directes.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110615
    Description :

    Nous considérons les taux d'échantillonnage optimaux dans des plans d'échantillonnage par élément, quand l'analyse prévue est la régression linéaire pondérée par les poids de sondage et que les paramètres à estimer sont des combinaisons linéaires des coefficients de régression provenant d'un ou de plusieurs modèles. Nous commençons par élaborer des méthodes en supposant que des renseignements exacts sur les variables du plan existent dans la base de sondage, puis nous les généralisons à des situations où l'information pour certaines variables du plan n'est disponible que sous forme d'agrégat pour des groupes de sujets éventuels ou provient de données inexactes ou périmées. Nous envisageons également un plan d'échantillonnage pour l'estimation de combinaisons de coefficients provenant de plus d'un modèle. Une généralisation supplémentaire permet d'utiliser des combinaisons flexibles de coefficients choisies pour améliorer l'estimation d'un effet tout en en contrôlant un autre. Les applications éventuelles comprennent l'estimation des moyennes pour plusieurs ensembles de domaines chevauchants, ou l'amélioration des estimations pour des sous populations telles que les races minoritaires par échantillonnage non proportionnel des régions géographiques. Dans le contexte de la conception d'un sondage sur les soins reçus par les cancéreux (l'étude CanCORS) qui a motivé nos travaux, l'information éventuelle sur les variables du plan d'échantillonnage comprenait des données de recensement au niveau de l'îlot sur la race/ethnicité et la pauvreté, ainsi que des données au niveau individuel. Pour un emplacement de l'étude, un plan d'échantillonnage avec probabilités inégales en utilisant les adresses résidentielles des sujets et des données de recensement réduirait la variance de l'estimateur d'un effet du revenu de 25 %, ou de 38 % si la race des sujets avait été connue également. Par pondération flexible des contrastes du revenu selon la race, la variance de l'estimateur serait réduite de 26 % en utilisant les adresses résidentielles seulement et de 52 % en utilisant les adresses et les races. Nos méthodes seraient utiles dans les études où l'on considère un suréchantillonnage géographique selon la race ethnicité ou les caractéristiques socioéconomiques, ou dans toute étude où les caractéristiques pour lesquelles des données sont disponibles dans les bases de sondage sont mesurées avec une erreur.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110616
    Description :

    Dans le cas de données multivariées complètes, l'algorithme BACON (Billor, Hadi et Vellemann 2000) donne une estimation robuste de la matrice de covariance. La distance de Mahalanobis correspondante peut être utilisée pour la détection des observations aberrantes multivariées. Quand des items manquent, l'algorithme EM est un moyen commode d'estimer la matrice de covariance à chaque étape d'itération de l'algorithme BACON. Dans l'échantillonnage en population finie, l'algorithme EM doit être amélioré pour estimer la matrice de covariance de la population plutôt que de l'échantillon. Une version de l'algorithme EM pour données d'enquête suivant un modèle normal multivarié, appelée algorithme EEM (espérance estimée/maximisation), est proposée. La combinaison des deux algorithmes, dénommée algorithme BACON EEM, est appliquée à deux ensembles de données et comparée à d'autres méthodes.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110618
    Description :

    La National Health and Nutrition Examination Survey (NHANES) fait partie d'une série de programmes ayant trait à la santé parrainés par le National Center for Health Statistics des États-Unis. Une caractéristique unique de la NHANES est que tous les répondants de l'échantillon sont soumis à un examen médial complet. Afin de normaliser la façon dont ils sont effectués, ces examens ont lieu dans des centres d'examen mobiles (CEM). L'examen comprend des mesures physiques, des tests tels que l'examen de la vue et des dents, ainsi que le prélèvement d'échantillons de sang et d'urine pour des analyses biologiques. La NHANES est une enquête annuelle continue sur la santé réalisée auprès de la population civile des États-Unis ne résidant pas en établissement. Les principaux objectifs analytiques comprennent l'estimation du nombre et du pourcentage de personnes dans la population des États-Unis et dans des sous groupes désignés qui présentent certaines maladies et certains facteurs de risque. Le plan d'échantillonnage de la NHANES doit permettre d'établir un juste équilibre entre les exigences liées à l'obtention d'échantillons annuels et pluriannuels efficaces et la souplesse requise pour pouvoir modifier les paramètres essentiels du plan afin de mieux adapter l'enquête au besoin des chercheurs et des décideurs qui élaborent les politiques en matière de santé. Le présent article décrit les défis associés à la conception et à la mise en oeuvre d'un processus d'échantillonnage permettant d'atteindre les objectifs de la NHANES.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110619
    Description :

    La prédiction sur petits domaines fondée sur des effets aléatoires, appelée (MPLSBE), est une méthode de construction d'estimations pour de petites régions géographiques ou de petites sous populations en utilisant les données d'enquête existantes. Souvent, le total des prédicteurs sur petits domaines est forcé d'être égal à l'estimation par sondage directe et ces prédicteurs sont alors dits calés. Nous passons en revue plusieurs prédicteurs calés et présentons un critère qui unifie leur calcul. Nous dérivons celui qui est l'unique meilleur prédicteur linéaire sans biais sous ce critère et discutons de l'erreur quadratique moyenne des prédicteurs calés. L'imposition de la contrainte comporte implicitement la possibilité que le modèle de petit domaine soit spécifié incorrectement et que les prédicteurs présentent un biais. Nous étudions des modèles augmentés contenant une variable explicative supplémentaire pour lesquels les prédicteurs sur petits domaines ordinaires présentent la propriété d'autocalage. Nous démontrons à l'aide de simulations que les prédicteurs calés ont un biais un peu plus faible que le prédicteur MPLSBE habituel. Cependant, si le biais est une préoccupation, une meilleure approche consiste à utiliser un modèle augmenté contenant une variable auxiliaire supplémentaire qui est fonction de la taille du domaine. Dans les simulations, les prédicteurs fondés sur le modèle augmenté ont une EQM plus petite que MPLSBE quand le modèle incorrect est utilisé pour la prédiction. De surcroît, l'EQM augmente très légèrement comparativement à celle de MPLSBE si la variable auxiliaire est ajoutée au modèle correct.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110642
    Description :

    La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 11-522-X200600110370
    Description :

    De nombreux pays mènent des enquêtes portant spécifiquement sur la santé de leur population. Puisque la santé tient une place de premier plan dans la plupart des aspects de la vie, des données sur la santé sont également recueillies dans des enquêtes auprès de la population qui traitent d'autres sujets. Les enquêtes sur la santé de la population comprennent généralement la santé physique et mentale, la santé dentaire, les incapacités, la toxicomanie, les facteurs de risque pour la santé, la nutrition, la promotion de la santé, l'utilisation et la qualité des soins de santé, la protection en matière de santé et les coûts. Certaines enquêtes portent sur des problèmes de santé bien précis, alors que d'autres visent à évaluer l'état général de santé. La santé est souvent une composante importante des études longitudinales, notamment dans les cohortes de naissance et les cohortes vieillissantes. Les renseignements sur la santé peuvent être recueillis par l'entremise des déclarations faites par les répondants (sur eux-mêmes et parfois sur d'autres), d'examens médicaux ou de mesures biologiques. L'exactitude des renseignements sur la santé déclarés par les répondants soulève des préoccupations réelles. La logistique, le coût et la collaboration des répondants sont des considérations de taille lorsque les renseignements sont recueillis par des examens médicaux. Enfin, les questions d'éthique et de protection de la vie privée sont souvent importantes, surtout lorsque de l'ADN et des biomarqueurs sont en cause. La comparabilité internationale des mesures de la santé gagne en importance. Le présent article analyse la méthodologie de diverses enquêtes sur la santé et examine les défis que pose la collecte de données exactes dans ce domaine.

    Date de diffusion : 2008-03-17
Données (1)

Données (1) ((1 résultat))

  • Tableau : 71-585-X
    Description :

    Ce compendium fournit les données de la nouvelle Enquête sur le milieu de travail et les employés (EMTE) qui est effectuée par Statistique Canada avec le soutien de Développement des ressources humaines Canada L'EMTE compte deux volets: (1) une enquête auprès des établissements sur les changements organisationnels, la formation et d' autres pratiques en matière de ressources humaines, les stratégies d'entreprise ainsi que le roulement de la main-d'oeuvre au sein du milieu de travail; et (2) une enquête auprès des employés de ces mêmes milieux de travail, afin de recueillir des données sur leurs salaires, leurs heures de travail, le genre de travail qu'ils effectuent, le capital humain, l'utilisation de la technologie et la formation. Il en résulte une riche source nouvelle de renseignements interreliés sur les milieux de travail et leurs employés.

    Date de diffusion : 2008-09-24
Analyses (84)

Analyses (84) (70 à 80 de 84 résultats)

  • Articles et rapports : 11-522-X200600110452
    Géographie : Canada, Province ou territoire
    Description :

    Des renseignements exacts sur le moment de l'accès aux soins de santé mentale primaires sont d'importance capitale pour permettre de cerner les facteurs éventuellement modifiables qui pourraient faciliter la gestion permanente et en temps opportun des soins. Comme il n'existe pas de mesure "idéale" de l'utilisation des soins de santé mentale, il est utile de savoir comment les points forts, les lacunes et les limites des différentes sources de données influent sur les résultats des études. La présente étude compare deux mesures des données sur l'utilisation des soins de santé mentale primaires à l'échelle de la population, soit le volet Santé mentale et bien être de l'Enquête sur la santé dans les collectivités canadiennes (ESCC, cycle 1.2) et les dossiers d'assurance maladie dans la province de la Colombie Britannique. Elle porte sur les quatre questions suivantes : 1) La prévalence sur 12 mois des contacts avec les omnipraticiens concernant des problèmes de santé mentale est elle la même d'après les données d'enquête et les données administratives? (2) Quel est le niveau de concordance entre les données d'enquête et les données administratives en ce qui concerne les contacts avec un omnipraticien pour des problèmes de santé mentale durant les 12 mois précédant l'interview d'enquête? (3) Le niveau de concordance est il constant au cours de la période de 12 mois ou bien baisse t il au cours de sous périodes plus éloignées durant la période de 12 mois? (4) Quelles sortes de caractéristiques des répondants, y compris les troubles mentaux, sont associées à la concordance ou à l'absence de concordance? Les résultats de cette étude fourniront des renseignements utiles sur la façon d'utiliser et d'interpréter chaque mesure de l'utilisation des soins de santé. En outre, cette étude contribuera de façon utile aux recherches sur le plan d'enquête et à celles qui visent à améliorer les méthodes d'utilisation des données administratives aux fins de recherches sur les services de santé mentale.

    Date de diffusion : 2008-03-17

  • Articles et rapports : 11-522-X200600110453
    Description :

    Les enquêtes nationales sur l'alimentation et la nutrition fournissent des renseignements essentiels pour comprendre la relation complexe qui existe entre la santé et l'alimentation au sein de la population. Bon nombre de ces enquêtes ont recours à la méthodologie du rappel alimentaire de 24 heures qui permet de connaître de façon détaillée tous les aliments et boissons consommés au cours d'une journée. Ce sont souvent les apports d'aliments et d'éléments nutritifs à long terme qui revêtent un intérêt, et il existe plusieurs techniques permettant d'estimer les apports habituels de la population. Ces techniques exigent qu'au moins un rappel alimentaire de 24 heures soit effectué auprès d'au moins un sous-ensemble de la population afin de pouvoir estimer la variabilité des apports chez une même personne. La détermination du nombre de personnes nécessaires pour constituer un rappel est une étape importante du plan d'enquête, dans la mesure où il faut reconnaître qu'un nombre trop faible de personnes participant au rappel peut compromettre la capacité à évaluer l'apport habituel, mais qu'un nombre élevé de rappels est coûteux et représente un fardeau supplémentaire pour les répondants. Ce document de recherche se penche sur les questions statistiques liées au nombre de personnes participant au rappel en évaluant l'incidence du nombre de ces personnes sur la stabilité et l'incertitude de l'estimation de la variabilité chez une même personne et en donnant une indication de ce que ce nombre devrait être.

    Date de diffusion : 2008-03-17

  • Articles et rapports : 11-522-X200600110524
    Description :

    Les courbes de croissance sont utilisées par les professionnels de la santé afin de déterminer si la croissance d'un enfant ou d'un foetus, par exemple, se situe dans les limites normales. Les graphiques de croissance employés à l'heure actuelle au Canada pour la taille, le poids et l'indice de masse corporelle (IMC) sont fondés sur des données américaines. Des courbes de croissance pour les enfants peuvent maintenant être établies d'après les données les plus récentes disponibles au Canada. L'une des méthodes servant à estimer et à tracer les courbes de croissance est la méthode Lambda-Mu-Sigma (LMS). Cette dernière a été utilisée dans le cadre de diverses études réalisées par l'Organisation mondiale de la santé, le Royaume-Uni et les États-Unis afin d'établir des courbes de croissance de référence pour les enfants. Dans cet article, la méthode LMS est utilisée pour estimer les courbes de croissance en percentiles de l'IMC au moyen de données transversales pondérées du cycle 2.2 de l'Enquête sur la santé dans les collectivités canadiennes. Cet article porte sur l'IMC des enfants, l'une des mesures anthropométriques les plus couramment utilisées pour évaluer la croissance et l'obésité.

    Date de diffusion : 2008-03-17

  • Articles et rapports : 12-001-X200700210488
    Description :

    Le calage est le thème central de nombreux articles récents sur l'estimation dans le contexte de l'échantillonnage. Des expressions telles que « méthode de calage » et « estimateur par calage » sont fréquentes. Comme tiennent à le souligner les auteurs de ces articles, le calage offre un moyen systématique d'intégrer des données auxiliaires dans la procédure.

    Le calage est devenu un instrument méthodologique important dans la production de statistiques à grande échelle. Plusieurs organismes statistiques nationaux ont conçu des logiciels de calcul des poids, qui sont généralement calés sur les données auxiliaires disponibles dans les registres administratifs et d'autres sources de données fiables. Le présent article fait le point sur la méthode de calage en mettant l'accent sur les progrès accomplis depuis une dizaine d'années. Le nombre d'études sur le calage augmente rapidement et nous abordons ici certaines des questions soulevées.

    L'article débute par une définition de la méthode de calage, suivie d'une revue des caractéristiques importantes de cette méthode. L'estimation par calage est comparée à l'estimation par la régression (généralisée), qui est un autre moyen, conceptuellement différent, de tenir compte de l'information auxiliaire. Vient ensuite une discussion des aspects mathématiques du calage, y compris les méthodes permettant d'éviter les poids extrêmes. Dans les premières sections sont décrites des applications simples de la méthode, c'est-à-dire l'estimation d'un total de population sous échantillonnage direct, à une seule phase. Puis est envisagée la généralisation à des paramètres et à des plans d'échantillonnage plus complexes. Un trait commun de ces plans (à au moins deux phases ou deux degrés) est que l'information auxiliaire disponible peut comporter plusieurs composantes ou couches. L'application du calage dans de tels cas d'information composite est passée en revue. Plus loin, des exemples sont donnés pour illustrer comment les résultats de l'approche du calage peuvent différer de ceux obtenus grâce aux approches établies antérieurement. Enfin sont discutées des applications du calage en présence d'erreurs non dues à l'échantillonnage, en particulier les méthodes de correction du biais de non-réponse.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210489
    Description :

    L'état de données manquantes peut prendre diverses formes. Dans cet exposé, nous nous attardons à la non-réponse des unités et tentons de corriger cet état par une pondération appropriée. Le cas empirique que nous présentons vise l'échantillonnage à deux phases. En première phase, on a fait enquête auprès d'un grand échantillon à l'aide d'un questionnaire plutôt général. Au terme de cette phase, l'intervieweur a demandé aux répondants s'ils désiraient participer à une seconde phase où, avec un questionnaire plus détaillé, on se concentrerait sur un certain nombre de thèmes venant de la première phase. Cette procédure crée trois mécanismes de données manquantes. La difficulté est de savoir comment pondérer le plus exactement possible les répondants de la seconde phase par souci de cohérence des données issues des deux phases. Nous analyserons d'abord les différences de données manquantes propres à un tel scénario en trois temps en nous reportant à des données d'enquête auprès des personnes et nous comparerons ensuite divers modes de pondération. Notre recommandation est d'utiliser toutes les données auxiliaires disponibles le mieux possible. On obtient un bon résultat en mêlant les deux méthodes classiques avec d'abord une pondération de propension à répondre et ensuite un calage sur la distribution connue de la population.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210490
    Description :

    L'Enquête européenne sur le revenu et les conditions de vie (Statistics on Income and Living Conditions, SILC) a remplacé le Panel européen à partir de 2004. Elle permet de produire des statistiques annuelles sur la répartition des revenus, ainsi que sur la pauvreté et l'exclusion sociale. Cette enquête longitudinale, dont la collecte a eu lieu pour la première fois en France en mai 2004, touche tous les individus de plus de 15 ans occupant les 16 000 logements tirés dans l'échantillon-maître et la base de sondage des logements neufs. Tous ces individus sont suivis au cours du temps, même lorsqu'ils changent de logement. L'enquête doit aussi fournir des estimations transversales de qualité.

    Afin de limiter la charge des enquêtés, le plan de sondage préconisé pour SILC par Eurostat est un schéma rotatif basé sur quatre panels d'une durée de quatre ans chacun avec remplacement d'un panel tous les ans. La France a néanmoins choisi de porter la durée de ses panels à neuf années. Le plan de sondage rotatif permet de répondre aux besoins longitudinaux et transversaux de l'enquête. Cependant, il pose des défis en matière de pondération.

    Après un rappel du contexte de l'inférence lorsqu'on pratique une enquête longitudinale, l'article traite des pondérations longitudinales et transversales, qui sont conçues de manière à produire des estimateurs approximativement sans biais.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210491
    Description :

    La poststratification est une méthode courante d'estimation dans le cas des enquêtes ménages. Les cellules sont créées d'après les caractéristiques qui sont connues pour tous les répondants de l'échantillon et pour lesquelles il existe des dénombrements de contrôle externes provenant d'un recensement ou d'une autre source. Les inverses des corrections par poststratification sont habituellement appelés ratios de couverture. La couverture de certains groupes démographiques peut être sensiblement inférieure à 100 % et la poststratification est destinée à corriger les biais résultant d'une couverture insatisfaisante. Une méthode standard de poststratification consiste à regrouper ou à combiner certaines cellules lorsque les tailles d'échantillon sont inférieures à un minimum donné ou que les corrections des poids sont supérieures à un maximum donné. Le regroupement peut accroître ou réduire la variance d'une estimation, mais pourrait simultanément augmenter son biais. Nous étudions les effets, sur le biais et la variance, de ce type de regroupement dynamique des cellules du point de vue théorique et par simulation en utilisant une population basée sur la National Health Interview Survey de 2003. Nous proposons deux estimateurs possibles qui réduisent l'importance des corrections des poids lorsque les cellules sont regroupées.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210492
    Description :

    Les sondages à bases multiples ont été proposés au départ pour favoriser la réduction des coûts dans un contexte d'optimalité. Alors que les sondages de populations spéciales, rares et difficiles à échantillonner prennent de l'importance, il arrive souvent, en pratique, que l'on ne dispose pas d'une liste unique des unités de la population comme base de sondage. Récemment, des plans de sondage à bases multiples ont été proposés dans la littérature afin d'accroître la couverture de la population, d'améliorer les taux de réponse et de saisir les différences et les sous groupes. Diverses approches de l'estimation d'après des bases de sondage multiples ont été présentées, toutes fondées sur la partition virtuelle de l'ensemble de bases de sondage chevauchantes disponibles en domaines disjoints. Par conséquent, la classification correcte des unités d'échantillonnage dans les domaines est requise pour les applications pratiques. Dans le présent article, nous proposons un estimateur pour bases de sondage multiples fondé sur une approche de multiplicité. Les estimateurs fondés sur la multiplicité requièrent moins d'information sur l'appartenance d'une unité à un domaine et ne sont donc pas sensibles aux erreurs de classification. En outre, l'estimateur proposé est analytiquement simple, si bien qu'il est facile à appliquer et que sa variance est donnée exactement. Nous présentons aussi les résultats empiriques d'une grande étude par simulation conçue pour comparer l'estimateur fondé sur la multiplicité aux principaux estimateurs concurrents.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210493
    Description :

    Dans le présent article, nous étudions le problème de l'estimation de la variance pour un ratio de deux totaux quand l'imputation hot deck aléatoire marginale est utilisée pour remplacer les données manquantes. Nous considérons deux approches d'inférence. Dans la première, l'établissement de la validité d'un modèle d'imputation est nécessaire. Dans la seconde, la validité d'un modèle d'imputation n'est pas nécessaire, mais il faut estimer les probabilités de réponse, auquel cas il est nécessaire d'établir la validité d'un modèle de non réponse. Nous obtenons les estimateurs de la variance sous deux cadres distincts, à savoir le cadre à deux phases habituel et le cadre inversé.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X200700210494
    Description :

    L'Australian Bureau of Statistics vient de développer un système généralisé d'estimation pour traiter les données de ses enquêtes entreprises annuelles et infra annuelles de grande portée. Les plans de sondage de ces enquêtes comportent d'un grand nombre de strates, un échantillonnage aléatoire simple dans les strates, des fractions d'échantillonnage non négligeables, ainsi qu'un chevauchement d'échantillons pour des périodes consécutives et peuvent faire l'objet de modifications de la base de sondage. Un défi important consistait à choisir la méthode d'estimation de la variance répondant le mieux aux critères suivants : être valide pour une grande gamme d'estimateurs (par exemple, ratio et régression généralisée), nécessiter un temps de calcul limité, être facilement adaptable à divers plans de sondage et estimateurs, et avoir de bonnes propriétés théoriques en ce qui concerne le biais et la variance. Le présent article décrit le bootstrap rééchelonné sans remise (BRSR) qui a été mis en oeuvre par l'ABS et montre qu'il est sensiblement plus efficace que le bootstrap rééchelonné avec remise (BRAR) de Rao et Wu (1988). Les principaux avantages du bootstrap comparativement à d'autres estimateurs de variance par rééchantillonnage sont son efficacité (c'est à dire son exactitude par unité d'espace de mémorisation) et la simplicité relative avec laquelle il peut être spécifié dans un système. Le présent article décrit l'estimateur de variance du bootstrap BRSR pour les estimations ponctuelles et les estimations des changements qui peut être exprimé comme une fonction des moyennes de population finie. Les résultats des simulations entreprises dans le cadre du processus d'évaluation montrent que le BRSR est plus efficace que le BRAR, particulièrement dans les situations où la taille des échantillons dans les strates peut être aussi petite que 5.

    Date de diffusion : 2008-01-03
Références (3)

Références (3) ((3 résultats))

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2009001
    Géographie : Province ou territoire
    Description :

    Ce guide présente de l'information qui intéresse les utilisateurs des données provenant de l'Enquête sur les dépenses des ménages, nous avons obtenu des renseignements sur les habitudes de dépense, les caractéristiques des logements et de l'équipement ménager des ménages canadiens. L'enquête a porté sur les ménages privés des dix provinces. (Dans le but de réduire le fardeau de réponse pour les ménages du nord, l'EDM est menée dans le nord seulement tous les deux ans, débutant a partir de 1999.)

    Ce guide comprend les définitions des termes et des variables de l'enquête, ainsi que des descriptions de la méthode, la qualité des données, et le contenu de tableaux standards de données. Il contient aussi une section décrivant les différentes statistiques pouvant être créées au moyen des données sur les dépenses (p. ex. part du budget, part du marché, et agrégat de dépenses).

    Date de diffusion : 2008-12-22

  • Enquêtes et programmes statistiques — Documentation : 75F0002M199201A
    Description :

    À partir de janvier 1994, l'Enquête sur la dynamique du travail et du revenu (EDTR) va suivre un panel de familles et d'individus durant une période d'au moins six ans afin de cerner leurs expériences de travail ainsi que les changements monétaires et familiaux. Un document intitulé "Contenu de l'Enquête sur la dynamique du travail et du revenu: document de travail " a été distribué en février 1992.

    Ce document servait de base pour consulter les utilisateurs concernés. Lors de ce processus, le contenu a subi plusieurs modifications. Un test à grande échelle de l'EDTR sera effectué en février et mai 1993 pour évaluer le nouveau contenu.

    Ce présent document porte sur le contenu touchant la démographique et le travail qui sera utilisé pour le test.

    Date de diffusion : 2008-10-21

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2008001
    Géographie : Province ou territoire
    Description :

    Ce guide présente de l'information qui intéresse les utilisateurs des données provenant de l'Enquête sur les dépenses des ménages (EDM) de 2005. Les données ont été recueillies au moyen d'entrevues personnelles menées en janvier, en février et en mars 2006, à l'aide d'un questionnaire papier. Nous avons obtenu des renseignements sur les habitudes de dépense, les caractéristiques des logements et de l'équipement ménager des ménages canadiens en 2005. L'enquête a porté sur les ménages privés des dix provinces et des trois territoires du Nord. (Dans le but de réduire le fardeau de réponse pour les ménages du nord, l'EDM est menée dans le nord seulement tous les deux ans, débutant a partir de 1999.)

    Ce guide comprend les définitions des termes et des variables de l'enquête, ainsi que des descriptions de la méthode, la qualité des données, et le contenu de tableaux standards de données. Il contient aussi une section décrivant les différentes statistiques pouvant être créées au moyen des données sur les dépenses (p. ex. part du budget, part du marché, et agrégat de dépenses).

    Date de diffusion : 2008-02-26
Date de modification :