Inférence et fondements

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 1 facets selected.

Géographie

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (92)

Tout (92) (80 à 90 de 92 résultats)

  • Articles et rapports : 12-001-X199500214398
    Description :

    En nous fondant sur 14 enquêtes menées dans six pays, nous présentons la constatation empirique de l’existence et de l’ampleur des effets du plan de sondage (eps) pour cinq plans appartenant à deux types principaux. Le premier type a trait à eps (p_i – p_j), la différence de deux proportions d’une variable polytomique de trois catégories ou plus. Le deuxième type utilise les tests de chi carré pour l’analyse des différences entre deux échantillons. Nous montrons que pour toutes les variables et pour tous les plans, eps (p_i – p_j) \cong [eps (p_i) + eps (p_j)] / 2 constituent de bonnes approximations. Ces résultats sont empiriques, et les exceptions prouvent qu’il ne peut s’agir de simples inégalités analytiques. Il convient de signaler que ces résultats restent valables malgré les grandes variations des valeurs d’eps entre les variables et entre les catégories d’une même variable. Ils montrent en outre la nécessité d’utiliser des méthodes de traitement adaptées aux échantillons d’enquêtes pour l’analyse des données d’enquête, même lorsqu’on a affaire à des statistiques analytiques. En outre, ils permettent d’utiliser des approximations d’eps (p_i – p_j) tirées des valeurs plus facilement accessibles d’eps (p_i).

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500114408
    Description :

    On étudie le problème de l’estimation de la médiane d’une population finie quand une variable auxiliaire est présente. On propose des estimateurs ponctuels et des estimateurs par intervalle fondés sur une approche bayesienne non informative. L’estimateur ponctuel est comparé à d’autres estimateurs possibles et l’on constate qu’il donne de bons résultats dans diverses situations.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199200214487
    Description :

    Dans cet article, on étudie la notion de robustesse appliquée à la randomisation et à l’inférence fondée sur un modèle pour des enquêtes descriptives et analytiques. Le manque de robustesse qui caractérise les méthodes basées sur un modèle peut être compensé en partie par un plan de sondage élaboré avec soin. À partir de méthodes de lissage, les auteurs proposent des méthodes d’analyse robustes basées sur un modèle.

    Date de diffusion : 1992-12-15

  • Articles et rapports : 12-001-X199200214488
    Description :

    Dans de nombreux cas de sondage de populations finies, le plan peut être optimal, c’est-à-dire qu’il minimise la variance du meilleur estimateur linéaire sans biais suivant un modèle de travail particulier, mais laissera à désirer au point de vue de la robustesse - l’estimateur aura de fortes chances d’être affecté d’un biais si le modèle de travail est incorrect. Cependant, il existe d’importants modèles selon lesquels le plan de sondage assure efficience et robustesse. Nous présentons un théorème qui définit ces modèles et les plans optimaux qui s’y rattachent.

    Date de diffusion : 1992-12-15

  • Articles et rapports : 12-001-X199100214504
    Description :

    Les enquêtes par quotas simples ou marginaux sont analysées par deux méthodes : (1) modélisation des comportements (modèle de superpopulation) et estimation par prédiction et (2) modélisation de l’échantillonnage (sondage aléatoire simple sous contraintes) et estimation dérivée de la distribution échantillonnale. Dans les deux cas on précise les limites de la théorie, à l’intérieur de laquelle on établit des formules de variance et d’estimation de variance quand on mesure des totaux. Une extension de la méthode des quotas (quotas non-proportionnels) est, au passage, décrite et analysée. Elle autorise, dans certains cas, une très nette amélioration de la précision des enquêtes. Les mérites de la méthode des quotas sont comparés à ceux de l’échantillonnage aléatoire. Ce dernier reste indispensable dans le cas d’enquêtes de grande taille dans le cadre de la Statistique officielle.

    Date de diffusion : 1991-12-16

  • Articles et rapports : 12-001-X199100114521
    Description :

    L’auteur définit des fonctions de vraisemblance marginales et des fonctions de vraisemblance conditionnelles approximatives pour les paramètres de corrélation d’un modèle de régression linéaire normal à erreurs corrélées. L’auteur se sert du principe de vraisemblance pour déterminer des fonctions de vraisemblance marginales et des fonctions de vraisemblance conditionnelles approximatives pour les paramètres de corrélation dans un plan d’échantillonnage répété (échantillonnage aléatoire simple et plans plus complexes).

    Date de diffusion : 1991-06-14

  • Articles et rapports : 12-001-X199000114561
    Description :

    Cette note de Morris H. Hansen présente une discussion des quatre articles de la section spéciale « Histoire et questions actuelles dans le domaine des recensements et des sondages » par : i) J.N.K. Rao and D.R. Bellhouse, ii) S.E. Fienberg and J.M. Tanur, iii) B.A. Bailar, and iv) L. Kish.

    Date de diffusion : 1990-06-15

  • Articles et rapports : 12-001-X199000114560
    Description :

    À l’origine, les recherches en théorie et pratique des sondages étaient surtout orientées vers l’élaboration de plans de sondage efficaces et de méthodes d’estimation de total ou de moyenne de population tout aussi efficaces. Par la suite, on s’est attaché à faire une analyse critique des fondements théoriques de l’estimation fondée sur les sondages et on a proposé des modèles d’inférence pour les totaux ou les moyennes. Durant les dix dernières années, des progrès sensibles ont été réalisés dans l’élaboration de méthodes d’analyse de données d’enquête qui tiennent compte de la complexité du plan de sondage. Dans cet article, nous passons en revue quelques-unes des étapes de cette évolution et nous en faisons l’évaluation.

    Date de diffusion : 1990-06-15

  • Articles et rapports : 12-001-X198900214568
    Description :

    L’auteur analyse par une étude de Monte Carlo des méthodes de construction d’intervalles de confiance simultanés pour k > 2 proportions selon un modèle d’échantillonnage en grappes à deux degrés. Parmi les intervalles de confiance étudiés, citons i) les intervalles multinomiaux ordinaires, ii) les intervalles de Scheffé fondés sur des estimations-échantillon des variances de proportions de case, iii) les intervalles de Quesenberry-Hurst adaptés à des données agglomérées au moyen des corrections de premier et de second degré de X^2 de Rao et Scott, iv) les intervalles de Bonferroni simples, v) les intervalles de Bonferroni fondés sur des transformations des proportions estimées, et vi) les intervalles de Bonferroni calculés au moyen des niveaux critiques du test t de Student. L’étude de Monte Carlo révèle que, dans plusieurs situations, le niveau de confiance réel des intervalles multinomiaux est largement inférieur au niveau théorique. Les intervalles les plus efficaces au point de vue du niveau de confiance et de la symétrie des taux d’erreur (notion découlant d’un principe avancé par Jennings) sont les intervalles de Bonferroni fondés sur le critère t et soumis aux transformations logarithmique et logit. Parmi les intervalles de type Scheffé, les plus efficaces sont les intervalles de Quesenberry-Hurst modifiés par la correction de premier degré de Rao-Scott.

    Date de diffusion : 1989-12-15

  • Articles et rapports : 12-001-X198500114364
    Description :

    L’auteur jette un regard critique sur les méthodes traditionnelles d’inférence dans les enquêtes par sondage. Il souligne la nécessité de faire reposer l’inférence sur des sous-ensembles identifiables de la population. Utilisant des échantillons aléatoires de tailles diverses, il apporte un certain nombre d’exemples concrets d’inférences dépendant de la configuration réelle de l’échantillon ainsi que les problèmes qui peuvent y être associés. Parmi les exemples choisis, mentionnons l’estimation d’une moyenne de population suivant un échantillonnage aléatoire simple, l’estimation d’une moyenne de population en présence d’observations aberrantes, l’estimation du total et de la moyenne d’un domaine, l’estimation de la moyenne d’une population dans le contexte d’une stratification double et l’estimation d’une moyenne de population suivant des plans de sondage généraux. Enfin, l’auteur analyse le biais conditionnel et la variance conditionnelle des estimateurs de la moyenne d’une population (de la moyenne ou du total d’un domaine) de même que les intervalles de confiance correspondants.

    Date de diffusion : 1985-06-14
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (92)

Analyses (92) (50 à 60 de 92 résultats)

  • Articles et rapports : 12-002-X20050018030
    Description :

    Il arrive souvent qu'on veuille utiliser des microdonnées d'enquête pour déterminer si le taux de fréquence d'une caractéristique donnée dans une sous-population est le même que celui dans l'ensemble de la population. Le présent document expose diverses façons de procéder pour faire des inférences au sujet d'une différence entre les taux et montre si et comment ces options peuvent être mises en oeuvre dans trois différents progiciels d'enquête. Tous les progiciels illustrés, soit SUDAAN, WesVar et Bootvar, peuvent utiliser les poids bootstrap fournis par l'analyste pour procéder à l'estimation de la variance.

    Date de diffusion : 2005-06-23

  • Articles et rapports : 12-001-X20040027753
    Description :

    Les échantillonneurs se méfient souvent des approches d'inférence fondées sur un modèle, parce qu'ils craignent que soient commises des erreurs de spécification lorsque les modèles sont appliqués à de grands échantillons provenant de populations complexes. Nous soutenons que le paradigme de l'inférence fondée sur un modèle peut donner de très bons résultats dans les conditions d'enquête, à condition que les modèles soient choisis de façon à tenir compte du plan d'échantillonnage et d'éviter de faire des hypothèses fortes au sujet des paramètres. L'estimateur d'Horvitz Thompson (HT) est un estimateur simple sans biais par rapport au plan de sondage du total de population finie. Du point de vue de la modélisation, l'estimateur HT fonctionne bien lorsque les ratios des valeurs de la variable de résultat et des probabilités d'inclusion sont interchangeables. Si cette hypothèse n'est pas satisfaite, l'estimateur HT peut être très inefficace. Dans Zheng et Little (2003, 2004), nous avons utilisé des fonctions splines pénalisées (p splines) pour modéliser des relations à variation lisse entre le résultat et les probabilités d'inclusion sous échantillonnage à un degré avec probabilité proportionnelle à la taille (PPT). Nous avons montré que les estimateurs fondés sur un modèle à fonction p spline sont généralement plus efficaces que l'estimateur HT et peuvent fournir des intervalles de confiance plus étroits dont la couverture est proche du niveau de confiance nominal. Dans le présent article, nous étendons cette approche aux plans d'échantillonnage à deux degrés. Nous utilisons un modèle mixte fondé sur une p spline qui est ajusté à une relation non paramétrique entre les moyennes des unités primaires d'échantillonnage (UPE) et une mesure de la taille des UPE, et auquel sont intégrés des effets aléatoires pour modéliser la mise en grappes. Pour l'estimation de la variance, nous considérons les méthodes d'estimation de la variance fondées sur un modèle bayésien empirique, la méthode du jackknife et la méthode des répliques répétées équilibrées (BRR). Des études en simulation portant sur des données simulées et des échantillons tirés des microdonnées à grande diffusion du Recensement de 1990 montrent que l'estimateur fondé sur un modèle à fonction p spline donne de meilleurs résultats que l'estimateur HT et que les estimateurs linéaires assistés par un modèle. Les simulations montrent aussi que les méthodes d'estimation de la variance produisent des intervalles de confiance dont la couverture est satisfaisante. Fait intéressant, ces progrès peuvent être observés pour un plan d'échantillonnage courant à probabilités de sélection égales, où la sélection à la première étape est PPT et où les probabilités de sélection à la deuxième étape sont proportionnelles à l'inverse des probabilités de sélection à la première étape, et où l'estimateur HT mène à la moyenne non pondérée. Dans les situations favorisant le plus l'utilisation de l'estimateur HT, les estimateurs fondés sur un modèle ont une efficacité comparable.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 11-522-X20030017700
    Description :

    Ce document propose un cadre utile pour examiner l'incidence des écarts modérés à partir de conditions idéalisées. On présente également des critères d'évaluation pour les estimateurs ponctuels et les estimateurs d'intervalles.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20030017722
    Description :

    Dans ce document, on montre comment adapter les cadres de travail basés sur le plan de sondage et basés sur un modèle dans le cas de l'échantillonnage à deux degrés

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20020016708
    Description :

    Cette étude traite de l'analyse des données d'enquêtes complexes sur la santé par des méthodes de modélisation multivariées. L'étude porte principalement sur diverses méthodes basées sur le plan d'échantillonnage ou basées sur un modèle qui visent à tenir compte de la complexité du plan d'échantillonnage, y compris la mise en grappes, la stratification et la pondération. Les méthodes étudiées incluent la modélisation linéaire généralisée fondée sur la pseudo-méthode de vraisemblance et les équations d'estimations généralisées, les modèles linéaires mixtes estimés par le maximum de vraisemblance restreint et les techniques hiérarchiques bayesiennes basées sur les méthodes de simulation de Monte Carlo d'une chaîne de Markov (MCMC). On compare empiriquement les méthodes sur des données provenant d'une grande enquête comprenant une interview sur la santé et un examen physique réalisés en Finlande en 2000 (Health 2000 Study).

    Les données de la Health 2000 Study ont été recueillies au moyen d'interviews sur place, de questionnaires et d'examens cliniques. L'enquête a été réalisée auprès d'un échantillon en grappes stratifié à deux degrés. Le plan d'échantillonnage comportait des corrélations intra grappes positives pour nombre de variables étudiées. En vue d'une étude plus approfondie, on a choisi un petit nombre de variables tirées des volets de l'interview sur la santé et de l'examen clinique. Dans de nombreux cas, les diverses méthodes ont produit des résultats numériques comparables et appuyés des conclusions statistiques similaires. Celles qui ne tenaient pas compte de la complexité du plan d'échantillonnage ont parfois produit des conclusions contradictoires. On discute aussi de l'application des méthodes lors de l'utilisation de logiciels statistiques standards.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016717
    Description :

    Aux États-Unis, la National Health and Nutrition Examination Survey (NHANES) est couplée à la National Health Interview Survey (NHIS) au niveau de l'unité primaire d'échantillonnage (les mêmes comtés, mais pas nécessairement les mêmes personnes, participent aux deux enquêtes). La NHANES est réalisée auprès d'environ 5 000 personnes par année, tandis que la NHIS l'est auprès d'environ 100 000 personnes par année. Dans cet article, on expose les propriétés de modèles qui permettent d'utiliser les données de la NHIS et des données administratives comme information auxiliaire pour estimer les valeurs des variables étudiées dans le cadre de la NHANES. La méthode, qui est apparentée aux modèles régionaux de Fay Herriot (1979) et aux estimateurs par calage de Deville et Sarndal (1992), tient compte des plans de sondage dans la structure de l'erreur.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016719
    Description :

    Dans cette étude, on examine les méthodes de modélisation utilisées pour les données sur la santé publique. Les spécialistes de la santé publique manifestent un regain d'intérêt pour l'étude des effets de l'environnement sur la santé. Idéalement, les études écologiques ou contextuelles explorent ces liens au moyen de données sur la santé publique étoffées de données sur les caractéristiques environnementales à l'aide de modèles multiniveaux ou hiérarchiques. Dans ces modèles, le premier niveau correspond aux données des personnes sur la santé et le deuxième, aux données des collectivités. La plupart des données sur la santé publique proviennent d'enquêtes à plan d'échantillonnage complexe qui obligent, lors de l'analyse, à tenir compte de la mise en grappes, de la non-réponse et de la post-stratification pour obtenir des estimations représentatives de la prévalence des comportements posant un risque pour la santé.

    Cette étude est basée sur le Behavioral Risk Factor Surveillance System (BRFSS). Il s'agit d'un système américain de surveillance des facteurs de risque pour la santé selon l'État exploité par les Centers for Disease Control and Prevention en vue d'évaluer chaque année les facteurs de risque pour la santé chez plus de 200 000 adultes. Les données du BRFSS sont maintenant produites à l'échelle de la région métropolitaine statistique (MSA pour metropolitan statistical area) et fournissent des données de qualité sur la santé pour les études des effets de l'environnement. Les exigences conjuguées du plan d'échantillonnage et des analyses à plusieurs niveaux compliquent encore davantage les analyses à l'échelle de la MSA combinant les données sur la santé et sur l'environnement.

    On compare trois méthodes de modélisation dans le cadre d'une étude sur l'activité physique et certains facteurs environnementaux à l'aide de données du BRFSS de 2000. Chaque méthode décrite ici est un moyen valide d'analyser des données d'enquête à plan d'échantillonnage complexe complétées de données environnementales, quoique chacune tienne compte de façon différente du plan d'échantillonnage et de la structure multiniveau des données. Ces méthodes conviennent donc à l'étude de questions légèrement différentes.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016727
    Description :

    Les données tirées du recensement sont largement utilisées pour procéder à la répartition et au ciblage des ressources aux échelons national, régional et local. Au Royaume-Uni, un recensement de la population est mené tous les 10 ans. En s'éloignant de la date du recensement, les données du recensement deviennent périmées et moins pertinentes, ce qui rend la répartition des ressources moins équitable. Dans cette étude, on analyse les différentes méthodes pour résoudre ce problème.

    Plusieurs méthodes aréolaires ont été mises au point pour produire des estimations postcensitaires, y compris la technique d'estimation préservant la structure mise au point par Purcell et Kish (1980). Cette étude porte sur la méthode de modélisation linéaire variable pour produire des estimations postcensitaires. On teste la validité de la méthode au moyen de données simulées à partir du registre de population de la Finlande et on applique la technique aux données britanniques pour produire des estimations mises à jour pour plusieurs indicateurs du recensement de 1991.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016730
    Description :

    Une vaste gamme de modèles utilisés dans le domaine de la recherche sociale et économique peuvent être représentés en spécifiant une structure paramétrique pour les covariances des variables observées. L'existence de logiciels tels que LISREL (Jöreskog et Sörbom, 1988) et EQS (Bentler, 1995) a permis d'ajuster ces modèles aux données d'enquêtes dans de nombreuses applications. Dans cet article, on étudie deux inférences au sujet de ce genre de modèle en utilisant des données d'enquêtes à plan d'échantillonnage complexe. On examine les preuves de l'existence de biais d'échantillon fini dans l'estimation des paramètres et les moyens de réduire ces biais (Altonji et Segal, 1996), ainsi que les questions connexes de l'efficacité de l'estimation, de l'estimation de l'erreur type et des tests. On utilise des données longitudinales provenant de la British Household Panel Survey en guise d'illustration. La collecte de ces données étant sujette à l'érosion de l'échantillon, on examine aussi comment utiliser des poids de non réponse dans la modélisation.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016731
    Description :

    En recherche behavioriste, diverses techniques sont utilisées pour prédire les scores des répondants pour des facteurs ou des concepts que l'on ne peut observer directement. La satisfaction concernant l'emploi, le stress au travail, l'aptitude à poursuivre des études de deuxième ou de troisième cycle et les aptitudes mathématiques des enfants en sont des exemples. Les méthodes utilisées couramment pour modéliser ce genre de concepts incluent l'analyse factorielle, la modélisation d'équation structurelle, les échelles psychométriques classiques et la théorie de la réponse à l'item, et, pour chaque méthode, il existe souvent plusieurs stratégies distinctes permettant de produire des scores individuels. Cependant, les chercheurs se satisfont rarement de simples mesures de ces concepts. Souvent, ils utilisent des scores dérivés en tant que variables dépendantes ou indépendantes dans la régression multiple, l'analyse de la variance et de nombreuses autres procédures multivariées. Bien que ces applications de scores dérivés puissent produire des estimations biaisées des paramètres des modèles structuraux, ces difficultés sont mal comprises et souvent ignorées. Nous passerons en revue les publications qui traitent de la question, en mettant l'accent sur les méthodes de la TRI, en vue de déterminer quels sont les domaines problématiques et de formuler des questions à étudier dans l'avenir.

    Date de diffusion : 2004-09-13
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :