Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

7 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (8)

Tout (8) ((8 résultats))

  • Articles et rapports : 12-001-X202100200006
    Description :

    Le calage fondé sur l’échantillon se produit quand les poids d’une enquête sont calés pour contrôler les totaux aléatoires, au lieu de représenter les totaux fixes au niveau de la population. Les totaux de contrôle peuvent être estimés à partir de différentes phases de la même enquête ou d’une autre enquête. En cas de calage fondé sur l’échantillon, pour que l’estimation de la variance soit valide, il est nécessaire de tenir compte de la contribution de l’erreur due à l’estimation des totaux de contrôle. Nous proposons une nouvelle méthode d’estimation de la variance qui utilise directement les poids de rééchantillonnage de deux enquêtes, dont une sert à fournir des totaux de contrôle pour le calage des autres poids d’enquête. Aucune restriction n’est établie quant à la nature des deux méthodes de rééchantillonnage et il n’est pas nécessaire de calculer d’estimation de la variance-covariance, ce qui simplifie la mise en œuvre pratique de la méthode proposée. Nous fournissons la description générale de la méthode utilisée pour les enquêtes comportant deux méthodes de rééchantillonnage arbitraire avec un nombre de répliques différent. Il est démontré que l’estimateur de la variance obtenu est convergent pour la variance asymptotique de l’estimateur calé, quand le calage est effectué au moyen de l’estimation par la régression ou la méthode itérative du quotient (raking). La méthode est illustrée dans une application réelle, dans laquelle il faut harmoniser la composition démographique de deux enquêtes pour améliorer la comparabilité des estimations de l’enquête.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 12-001-X202000200002
    Description :

    Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X201400214118
    Description :

    L’agrégation bootstrap est une puissante méthode de calcul utilisée pour améliorer la performance des estimateurs inefficaces. Le présent article est le premier à explorer l’utilisation de l’agrégation bootstrap dans l’estimation par sondage. Nous y examinons les effets de l’agrégation bootstrap sur les estimateurs d’enquête non différenciables, y compris les fonctions de répartition de l’échantillon et les quantiles. Les propriétés théoriques des estimateurs d’enquête agrégés par bootstrap sont examinées sous le régime fondé sur le plan de sondage et le régime fondé sur le modèle. En particulier, nous montrons la convergence par rapport au plan des estimateurs agrégés par bootstrap et obtenons la normalité asymptotique des estimateurs dans un contexte fondé sur le modèle. L’article explique comment la mise en oeuvre de l’agrégation bootstrap des estimateurs d’enquête peut tirer parti des répliques produites pour l’estimation par sondage de la variance, facilitant l’application de l’agrégation bootstrap dans les enquêtes existantes. Un autre défi important dans la mise en oeuvre de l’agrégation bootstrap en contexte d’enquête est l’estimation de la variance pour les estimateurs agrégés par bootstrap eux-mêmes, et nous examinons deux façons possibles d’estimer la variance. Les expériences par simulation révèlent une amélioration de l’estimateur par agrégation bootstrap proposé par rapport à l’estimateur original et comparent les deux approches d’estimation de la variance.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201100211610
    Description :

    Dans cet article, l'auteur présente une discussion sur chacun des trois articles de la compilation spéciale du US Census Bureau.

    Date de diffusion : 2011-12-21

  • Articles et rapports : 12-001-X200900211039
    Description :

    La pondération par la propension à répondre est une méthode de rajustement pour tenir compte de la non-réponse totale dans les enquêtes. Une forme de mise en oeuvre de cette méthode consiste à diviser les poids d'échantillonnage par les estimations de la probabilité que les unités échantillonnées répondent à l'enquête. Habituellement, ces estimations sont obtenues par ajustement de modèles paramétriques, tels qu'une régression logistique. Les estimateurs corrigés résultants peuvent devenir biaisés si les modèles paramétriques sont spécifiés incorrectement. Afin d'éviter les erreurs de spécification du modèle, nous considérons l'estimation non paramétrique des probabilités de réponse par la régression par polynômes locaux. Nous étudions les propriétés asymptotiques de l'estimateur résultant sous quasi randomisation. Nous évaluons en pratique le comportement de la méthode proposée de correction de la non-réponse en nous servant de données de la NHANES.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 11-536-X200900110810
    Description :

    La post-stratification est souvent utilisée pour améliorer la précision des estimateurs d'enquêtes lorsqu'on dispose d'information auxiliaire catégorique de sources à l'extérieur de l'enquête. Dans les enquêtes sur les ressources naturelles, de tels renseignements sont souvent obtenus des données de télédétection, classés en catégories et affichés sous forme de tables de pixels. Ces tables peuvent être construites en fonction des modèles de classification adaptés aux données-échantillons. La post-stratification des données-échantillons fondée sur les catégories dérivées des données-échantillons (« post-stratification endogène ») contrevient à plusieurs hypothèses de la post-stratification standard, et est généralement considérée comme non valide en tant que méthode d'estimation fondée sur le plan. Dans la présentation, les propriétés de l'estimateur de post-stratification endogène sont dérivées dans le cas d'un modèle linéaire généralisé adapté à l'échantillon. La cohérence du plan de l'estimateur de post-stratification endogène est établie conformément à certaines conditions modérées. On établit la cohérence et la normalité asymptotique de l'estimateur de post-stratification endogène dans le cadre d'un modèle de superpopulation. Des exercices de simulation démontrent que l'effet pratique de l'adaptation d'un modèle aux données d'enquête avant la post-stratification est faible, même dans le cas des échantillons relativement petits.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 12-001-X20070019850
    Description :

    De l'information auxiliaire est souvent utilisée pour améliorer la précision des estimateurs des moyennes et des totaux de population finie grâce à des techniques d'estimation par le ratio ou par la régression linéaire. Les estimateurs résultants ont de bonnes propriétés théoriques et pratiques, dont l'invariance, le calage et la convergence par rapport au plan de sondage. Cependant, il n'est pas toujours certain que les modèles de ratio et les modèles linéaires sont de bonnes approximations de la relation réelle entre les variables auxiliaires et la variable d'intérêt, ce qui cause une perte d'efficacité si le modèle n'est pas approprié. Dans le présent article, nous expliquons comment on peut étendre l'estimation par la régression afin d'intégrer des modèles de régression semi­paramétriques dans le cas de plans de sondage simples ainsi que plus complexes. Tout en retenant les bonnes propriétés théoriques et pratiques des modèles linéaires, les modèles semi­paramétriques reflètent mieux les relations complexes entre les variables, ce qui se traduit souvent par des gains importants d'efficacité. Nous illustrerons l'applicabilité de l'approche à des plans de sondage complexes comportant de nombreux types de variables auxiliaires en estimant plusieurs caractéristiques liées à l'acidification dans le cas d'une enquête sur les lacs du Nord­Est des États­Unis.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20040016993
    Description :

    L'estimateur à cellules de pondération corrige la non réponse totale par subdivision de l'échantillon en groupes homogènes (cellules) et application d'une correction par quotient aux répondants compris dans chaque cellule. Les études antérieures des propriétés statistiques des estimateurs à cellules de pondération se fondaient sur l'hypothèse que ces cellules correspondent à des cellules de population connues dont les caractéristiques sont homogènes. Dans le présent article, nous étudions les propriétés de l'estimateur à cellules de pondération sous un modèle de probabilité de réponse qui ne nécessite pas la spécification correcte de cellules de population homogènes. Nous supposons plutôt que la probabilité de réponse est une fonction lisse, mais par ailleurs non spécifiée, d'une variable auxiliaire connue. Sous ce modèle plus général, nous étudions la robustesse de l'estimateur à cellules de pondération à la spécification incorrecte du modèle. Nous montrons que, même si les cellules de population sont inconnues, l'estimateur est convergent par rapport au plan d'échantillonnage et au modèle de réponse. Nous décrivons l'effet du nombre de cellules de pondération sur les propriétés asymptotiques de l'estimateur. Au moyen d'expériences de simulation, nous explorons les propriétés de population finie de l'estimateur. Pour conclure, nous donnons certaines lignes directrices concernant le choix de la taille des cellules et de leur nombre pour l'application pratique de l'estimation fondée sur des cellules de pondération lorsqu'on ne peut spécifier ces cellules a priori.

    Date de diffusion : 2004-07-14
Stats en bref (0)

Stats en bref (0) (0 résultat)

Aucun contenu disponible actuellement

Articles et rapports (8)

Articles et rapports (8) ((8 résultats))

  • Articles et rapports : 12-001-X202100200006
    Description :

    Le calage fondé sur l’échantillon se produit quand les poids d’une enquête sont calés pour contrôler les totaux aléatoires, au lieu de représenter les totaux fixes au niveau de la population. Les totaux de contrôle peuvent être estimés à partir de différentes phases de la même enquête ou d’une autre enquête. En cas de calage fondé sur l’échantillon, pour que l’estimation de la variance soit valide, il est nécessaire de tenir compte de la contribution de l’erreur due à l’estimation des totaux de contrôle. Nous proposons une nouvelle méthode d’estimation de la variance qui utilise directement les poids de rééchantillonnage de deux enquêtes, dont une sert à fournir des totaux de contrôle pour le calage des autres poids d’enquête. Aucune restriction n’est établie quant à la nature des deux méthodes de rééchantillonnage et il n’est pas nécessaire de calculer d’estimation de la variance-covariance, ce qui simplifie la mise en œuvre pratique de la méthode proposée. Nous fournissons la description générale de la méthode utilisée pour les enquêtes comportant deux méthodes de rééchantillonnage arbitraire avec un nombre de répliques différent. Il est démontré que l’estimateur de la variance obtenu est convergent pour la variance asymptotique de l’estimateur calé, quand le calage est effectué au moyen de l’estimation par la régression ou la méthode itérative du quotient (raking). La méthode est illustrée dans une application réelle, dans laquelle il faut harmoniser la composition démographique de deux enquêtes pour améliorer la comparabilité des estimations de l’enquête.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 12-001-X202000200002
    Description :

    Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X201400214118
    Description :

    L’agrégation bootstrap est une puissante méthode de calcul utilisée pour améliorer la performance des estimateurs inefficaces. Le présent article est le premier à explorer l’utilisation de l’agrégation bootstrap dans l’estimation par sondage. Nous y examinons les effets de l’agrégation bootstrap sur les estimateurs d’enquête non différenciables, y compris les fonctions de répartition de l’échantillon et les quantiles. Les propriétés théoriques des estimateurs d’enquête agrégés par bootstrap sont examinées sous le régime fondé sur le plan de sondage et le régime fondé sur le modèle. En particulier, nous montrons la convergence par rapport au plan des estimateurs agrégés par bootstrap et obtenons la normalité asymptotique des estimateurs dans un contexte fondé sur le modèle. L’article explique comment la mise en oeuvre de l’agrégation bootstrap des estimateurs d’enquête peut tirer parti des répliques produites pour l’estimation par sondage de la variance, facilitant l’application de l’agrégation bootstrap dans les enquêtes existantes. Un autre défi important dans la mise en oeuvre de l’agrégation bootstrap en contexte d’enquête est l’estimation de la variance pour les estimateurs agrégés par bootstrap eux-mêmes, et nous examinons deux façons possibles d’estimer la variance. Les expériences par simulation révèlent une amélioration de l’estimateur par agrégation bootstrap proposé par rapport à l’estimateur original et comparent les deux approches d’estimation de la variance.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201100211610
    Description :

    Dans cet article, l'auteur présente une discussion sur chacun des trois articles de la compilation spéciale du US Census Bureau.

    Date de diffusion : 2011-12-21

  • Articles et rapports : 12-001-X200900211039
    Description :

    La pondération par la propension à répondre est une méthode de rajustement pour tenir compte de la non-réponse totale dans les enquêtes. Une forme de mise en oeuvre de cette méthode consiste à diviser les poids d'échantillonnage par les estimations de la probabilité que les unités échantillonnées répondent à l'enquête. Habituellement, ces estimations sont obtenues par ajustement de modèles paramétriques, tels qu'une régression logistique. Les estimateurs corrigés résultants peuvent devenir biaisés si les modèles paramétriques sont spécifiés incorrectement. Afin d'éviter les erreurs de spécification du modèle, nous considérons l'estimation non paramétrique des probabilités de réponse par la régression par polynômes locaux. Nous étudions les propriétés asymptotiques de l'estimateur résultant sous quasi randomisation. Nous évaluons en pratique le comportement de la méthode proposée de correction de la non-réponse en nous servant de données de la NHANES.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 11-536-X200900110810
    Description :

    La post-stratification est souvent utilisée pour améliorer la précision des estimateurs d'enquêtes lorsqu'on dispose d'information auxiliaire catégorique de sources à l'extérieur de l'enquête. Dans les enquêtes sur les ressources naturelles, de tels renseignements sont souvent obtenus des données de télédétection, classés en catégories et affichés sous forme de tables de pixels. Ces tables peuvent être construites en fonction des modèles de classification adaptés aux données-échantillons. La post-stratification des données-échantillons fondée sur les catégories dérivées des données-échantillons (« post-stratification endogène ») contrevient à plusieurs hypothèses de la post-stratification standard, et est généralement considérée comme non valide en tant que méthode d'estimation fondée sur le plan. Dans la présentation, les propriétés de l'estimateur de post-stratification endogène sont dérivées dans le cas d'un modèle linéaire généralisé adapté à l'échantillon. La cohérence du plan de l'estimateur de post-stratification endogène est établie conformément à certaines conditions modérées. On établit la cohérence et la normalité asymptotique de l'estimateur de post-stratification endogène dans le cadre d'un modèle de superpopulation. Des exercices de simulation démontrent que l'effet pratique de l'adaptation d'un modèle aux données d'enquête avant la post-stratification est faible, même dans le cas des échantillons relativement petits.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 12-001-X20070019850
    Description :

    De l'information auxiliaire est souvent utilisée pour améliorer la précision des estimateurs des moyennes et des totaux de population finie grâce à des techniques d'estimation par le ratio ou par la régression linéaire. Les estimateurs résultants ont de bonnes propriétés théoriques et pratiques, dont l'invariance, le calage et la convergence par rapport au plan de sondage. Cependant, il n'est pas toujours certain que les modèles de ratio et les modèles linéaires sont de bonnes approximations de la relation réelle entre les variables auxiliaires et la variable d'intérêt, ce qui cause une perte d'efficacité si le modèle n'est pas approprié. Dans le présent article, nous expliquons comment on peut étendre l'estimation par la régression afin d'intégrer des modèles de régression semi­paramétriques dans le cas de plans de sondage simples ainsi que plus complexes. Tout en retenant les bonnes propriétés théoriques et pratiques des modèles linéaires, les modèles semi­paramétriques reflètent mieux les relations complexes entre les variables, ce qui se traduit souvent par des gains importants d'efficacité. Nous illustrerons l'applicabilité de l'approche à des plans de sondage complexes comportant de nombreux types de variables auxiliaires en estimant plusieurs caractéristiques liées à l'acidification dans le cas d'une enquête sur les lacs du Nord­Est des États­Unis.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20040016993
    Description :

    L'estimateur à cellules de pondération corrige la non réponse totale par subdivision de l'échantillon en groupes homogènes (cellules) et application d'une correction par quotient aux répondants compris dans chaque cellule. Les études antérieures des propriétés statistiques des estimateurs à cellules de pondération se fondaient sur l'hypothèse que ces cellules correspondent à des cellules de population connues dont les caractéristiques sont homogènes. Dans le présent article, nous étudions les propriétés de l'estimateur à cellules de pondération sous un modèle de probabilité de réponse qui ne nécessite pas la spécification correcte de cellules de population homogènes. Nous supposons plutôt que la probabilité de réponse est une fonction lisse, mais par ailleurs non spécifiée, d'une variable auxiliaire connue. Sous ce modèle plus général, nous étudions la robustesse de l'estimateur à cellules de pondération à la spécification incorrecte du modèle. Nous montrons que, même si les cellules de population sont inconnues, l'estimateur est convergent par rapport au plan d'échantillonnage et au modèle de réponse. Nous décrivons l'effet du nombre de cellules de pondération sur les propriétés asymptotiques de l'estimateur. Au moyen d'expériences de simulation, nous explorons les propriétés de population finie de l'estimateur. Pour conclure, nous donnons certaines lignes directrices concernant le choix de la taille des cellules et de leur nombre pour l'application pratique de l'estimation fondée sur des cellules de pondération lorsqu'on ne peut spécifier ces cellules a priori.

    Date de diffusion : 2004-07-14
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :