Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

7 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (8)

Tout (8) ((8 résultats))

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201200211753
    Description :

    Dans les études longitudinales, la non-réponse est souvent de nature non monotone. Dans le cas de la Survey of Industrial Research and Development (SIRD), il est raisonnable de supposer que le mécanisme de non-réponse dépend des valeurs antérieures, en ce sens que la propension à répondre au sujet d'une variable étudiée au point t dans le temps dépend de la situation de réponse ainsi que des valeurs observées ou manquantes de la même variable aux points dans le temps antérieurs à t. Puisque cette non-réponse n'est pas ignorable, l'approche axée sur la vraisemblance paramétrique est sensible à la spécification des modèles paramétriques s'appuyant sur la distribution conjointe des variables à différents points dans le temps et sur le mécanisme de non-réponse. La non-réponse non monotone limite aussi l'application des méthodes de pondération par l'inverse de la propension à répondre. En écartant toutes les valeurs observées auprès d'un sujet après la première valeur manquante pour ce dernier, on peut créer un ensemble de données présentant une non-réponse monotone ignorable, puis appliquer les méthodes établies pour la non-réponse ignorable. Cependant, l'abandon de données observées n'est pas souhaitable et peut donner lieu à des estimateurs inefficaces si le nombre de données écartées est élevé. Nous proposons d'imputer les réponses manquantes par la régression au moyen de modèles d'imputation créés prudemment sous le mécanisme de non-réponse dépendante des valeurs antérieures. Cette méthode ne requiert l'ajustement d'aucun modèle paramétrique sur la distribution conjointe des variables à différents points dans le temps ni sur le mécanisme de non-réponse. Les propriétés des moyennes estimées en appliquant la méthode d'imputation proposée sont examinées en s'appuyant sur des études en simulation et une analyse empirique des données de la SIRD.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X200900211043
    Description :

    Les enquêtes-entreprises sont souvent réalisées selon un plan d'échantillonnage aléatoire simple stratifié à un degré sans remise comportant certaines strates à tirage complet. Bien que l'on recoure habituellement à l'ajustement de la pondération pour traiter la non-réponse totale, la variabilité due à la non-réponse est parfois omise en pratique quand on estime les variances. Cette situation pose surtout problème lorsqu'il existe des strates à tirage complet. Nous élaborons des estimateurs de variance qui sont convergents quand le nombre d'unités échantillonnées est grand dans chaque classe de pondération, en utilisant les méthodes du jackknife, de la linéarisation et du jackknife modifié. Nous commençons par appliquer les estimateurs ainsi obtenus à des données empiriques provenant de l'Annual Capital Expenditures Survey réalisé par le U.S. Census Bureau, puis nous examinons leur performance dans une étude en simulation.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200800210756
    Description :

    Dans les enquêtes longitudinales, la non-réponse survient souvent selon un schéma non monotone. Nous considérons l'estimation des moyennes dépendantes du temps sous l'hypothèse que le mécanisme de non-réponse dépend de la dernière valeur. Puisque cette dernière valeur peut elle-même manquer quand la non-réponse est non monotone, le mécanisme de non-réponse examiné est non ignorable. Nous proposons une méthode d'imputation qui consiste à établir d'abord certains modèles d'imputation par la régression en fonction du mécanisme de non-réponse, puis à appliquer l'imputation par la régression non paramétrique. Nous supposons que les données longitudinales suivent une chaîne de Markov admettant des moments finis de deuxième ordre. Aucune autre contrainte n'est imposée à la distribution conjointe des données longitudinales et à leurs indicateurs de non-réponse. La variance est estimée par une méthode du bootstrap. Nous présentons certains résultats de simulation et un exemple concernant une enquête sur l'emploi.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X20070019855
    Description :

    Dans les sondages en grappes, la non réponse concernant une variable dépend souvent d'un effet aléatoire au niveau de la grappe et n'est donc pas ignorable. Les estimateurs de la moyenne de population obtenus par imputation par la moyenne ou par repondération sous l'hypothèse de non réponse ignorable sont alors biaisés. Nous proposons un estimateur sans biais de la moyenne de population obtenu par imputation ou par repondération dans chaque grappe échantillonnée ou dans un groupe de grappes échantillonnées ayant une caractéristique commune. Nous présentons certains résultats obtenus par simulation en vue d'étudier les propriétés de l'estimateur proposé.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20020016421
    Description :

    Comme dans la plupart des autres enquêtes, il y a souvent un phénomène de non-réponse dans la Current Employment Survey effectuée tous les mois aux États-Unis par le Bureau of Labor Statistics (BLS). En général, les estimateurs pour un mois donné seront plus efficients si on procède à une imputation à l'aide des données déclarées des mois antérieurs que si on fait abstraction des non-répondants et qu'on modifie la pondération de l'enquête en conséquence. Il faut cependant dire que l'imputation influe aussi sur l'estimation de variance; si on traite les valeurs imputées comme des valeurs déclarées et qu'on applique une méthode type d'estimation de la variance, les estimateurs de variance seront entachés d'un biais négatif. Dans cet article, on propose un certain nombre de ces estimateurs par regroupement en demi-échantillons équilibrés et par réimputation afin de tenir compte de l'imputation. On présente certains résultats de simulation pour le rendement de l'échantillon de taille finie des estimateurs par données d'imputation et leurs estimateurs de variance.

    Date de diffusion : 2002-07-05

  • Articles et rapports : 12-001-X20010026095
    Description :

    Nous discutons de l'application du bootstrap avec une étape de réimputation en vue de tenir compte de la variance due à l'imputation (Shao et Sitter 1996) dans le cas d'un échantillonnage stratifié à plusieurs degrès. Nous proposons une méthode bootstrap modifiée qui ne nécessite pas de rééchelonnement si bien que la méthode de Shao et Sitter peut être appliquée au cas de l'imputation aléatoire lorsque la taille de l'échantillon de strate de premier degré est très petite. La méthode que nous proposons est une méthode unifiée, applicable quelle que soit la méthode d'imputation (aléatoire on non aléatoire), la taille de la strate (petite ou grande), le genre d'estimateur (lisse ou non lisse) ou le genre de problème (estimation de la variance ou estimation de la distribution d'échantillonnage). En outre, nous discutons de l'approximation de Monte Carlo qu'il convient d'utiliser pour la variance bootstrap lorsque l'on conjugue la réimputation à des méthodes de rééchantillonnage. Dans ces conditions, on doit agir plus prudemment qu'à l'ordinaire. Nous obtenons des résultats comparables pour la méthode des répliques équilibrées répétées qui est souvent utilisée dans le contexte des enquêtes et peut être considérée comme une approximation analytique du bootstrap. Enfin, nous présentons certains résultats d'étude en simulation afin d'examiner les propriétés de l'échantillon de taille finie et divers estimateurs de la variance applicables en cas d'imputation des données.

    Date de diffusion : 2002-02-28

  • Articles et rapports : 12-001-X20000015180
    Description :

    L'imputation est une méthode utilisée couramment pour compenser l'effet de la non-réponse lors de l'analyse des données d'enquête. Fondée sur des données auxiliaires, l'imputation peut produire des estimateurs plus efficaces que ceux construits en ne tenant compte ni de la non-réponse ni de la repondération. Nous étudions et comparons l'erreur quadratique moyenne d'estimateurs d'enquête fondés sur des données imputées par trois méthodes distinctes, c'est-à-dire la méthode courante d'imputation par quotient et deux méthodes cold deck fréquemment appliquées aux enquêtes de nature économique réalisées par le U.S. Census Bureau et par le U.S. Bureau of Labor Statistics.

    Date de diffusion : 2000-08-30
Stats en bref (0)

Stats en bref (0) (0 résultat)

Aucun contenu disponible actuellement

Articles et rapports (8)

Articles et rapports (8) ((8 résultats))

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201200211753
    Description :

    Dans les études longitudinales, la non-réponse est souvent de nature non monotone. Dans le cas de la Survey of Industrial Research and Development (SIRD), il est raisonnable de supposer que le mécanisme de non-réponse dépend des valeurs antérieures, en ce sens que la propension à répondre au sujet d'une variable étudiée au point t dans le temps dépend de la situation de réponse ainsi que des valeurs observées ou manquantes de la même variable aux points dans le temps antérieurs à t. Puisque cette non-réponse n'est pas ignorable, l'approche axée sur la vraisemblance paramétrique est sensible à la spécification des modèles paramétriques s'appuyant sur la distribution conjointe des variables à différents points dans le temps et sur le mécanisme de non-réponse. La non-réponse non monotone limite aussi l'application des méthodes de pondération par l'inverse de la propension à répondre. En écartant toutes les valeurs observées auprès d'un sujet après la première valeur manquante pour ce dernier, on peut créer un ensemble de données présentant une non-réponse monotone ignorable, puis appliquer les méthodes établies pour la non-réponse ignorable. Cependant, l'abandon de données observées n'est pas souhaitable et peut donner lieu à des estimateurs inefficaces si le nombre de données écartées est élevé. Nous proposons d'imputer les réponses manquantes par la régression au moyen de modèles d'imputation créés prudemment sous le mécanisme de non-réponse dépendante des valeurs antérieures. Cette méthode ne requiert l'ajustement d'aucun modèle paramétrique sur la distribution conjointe des variables à différents points dans le temps ni sur le mécanisme de non-réponse. Les propriétés des moyennes estimées en appliquant la méthode d'imputation proposée sont examinées en s'appuyant sur des études en simulation et une analyse empirique des données de la SIRD.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X200900211043
    Description :

    Les enquêtes-entreprises sont souvent réalisées selon un plan d'échantillonnage aléatoire simple stratifié à un degré sans remise comportant certaines strates à tirage complet. Bien que l'on recoure habituellement à l'ajustement de la pondération pour traiter la non-réponse totale, la variabilité due à la non-réponse est parfois omise en pratique quand on estime les variances. Cette situation pose surtout problème lorsqu'il existe des strates à tirage complet. Nous élaborons des estimateurs de variance qui sont convergents quand le nombre d'unités échantillonnées est grand dans chaque classe de pondération, en utilisant les méthodes du jackknife, de la linéarisation et du jackknife modifié. Nous commençons par appliquer les estimateurs ainsi obtenus à des données empiriques provenant de l'Annual Capital Expenditures Survey réalisé par le U.S. Census Bureau, puis nous examinons leur performance dans une étude en simulation.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200800210756
    Description :

    Dans les enquêtes longitudinales, la non-réponse survient souvent selon un schéma non monotone. Nous considérons l'estimation des moyennes dépendantes du temps sous l'hypothèse que le mécanisme de non-réponse dépend de la dernière valeur. Puisque cette dernière valeur peut elle-même manquer quand la non-réponse est non monotone, le mécanisme de non-réponse examiné est non ignorable. Nous proposons une méthode d'imputation qui consiste à établir d'abord certains modèles d'imputation par la régression en fonction du mécanisme de non-réponse, puis à appliquer l'imputation par la régression non paramétrique. Nous supposons que les données longitudinales suivent une chaîne de Markov admettant des moments finis de deuxième ordre. Aucune autre contrainte n'est imposée à la distribution conjointe des données longitudinales et à leurs indicateurs de non-réponse. La variance est estimée par une méthode du bootstrap. Nous présentons certains résultats de simulation et un exemple concernant une enquête sur l'emploi.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X20070019855
    Description :

    Dans les sondages en grappes, la non réponse concernant une variable dépend souvent d'un effet aléatoire au niveau de la grappe et n'est donc pas ignorable. Les estimateurs de la moyenne de population obtenus par imputation par la moyenne ou par repondération sous l'hypothèse de non réponse ignorable sont alors biaisés. Nous proposons un estimateur sans biais de la moyenne de population obtenu par imputation ou par repondération dans chaque grappe échantillonnée ou dans un groupe de grappes échantillonnées ayant une caractéristique commune. Nous présentons certains résultats obtenus par simulation en vue d'étudier les propriétés de l'estimateur proposé.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20020016421
    Description :

    Comme dans la plupart des autres enquêtes, il y a souvent un phénomène de non-réponse dans la Current Employment Survey effectuée tous les mois aux États-Unis par le Bureau of Labor Statistics (BLS). En général, les estimateurs pour un mois donné seront plus efficients si on procède à une imputation à l'aide des données déclarées des mois antérieurs que si on fait abstraction des non-répondants et qu'on modifie la pondération de l'enquête en conséquence. Il faut cependant dire que l'imputation influe aussi sur l'estimation de variance; si on traite les valeurs imputées comme des valeurs déclarées et qu'on applique une méthode type d'estimation de la variance, les estimateurs de variance seront entachés d'un biais négatif. Dans cet article, on propose un certain nombre de ces estimateurs par regroupement en demi-échantillons équilibrés et par réimputation afin de tenir compte de l'imputation. On présente certains résultats de simulation pour le rendement de l'échantillon de taille finie des estimateurs par données d'imputation et leurs estimateurs de variance.

    Date de diffusion : 2002-07-05

  • Articles et rapports : 12-001-X20010026095
    Description :

    Nous discutons de l'application du bootstrap avec une étape de réimputation en vue de tenir compte de la variance due à l'imputation (Shao et Sitter 1996) dans le cas d'un échantillonnage stratifié à plusieurs degrès. Nous proposons une méthode bootstrap modifiée qui ne nécessite pas de rééchelonnement si bien que la méthode de Shao et Sitter peut être appliquée au cas de l'imputation aléatoire lorsque la taille de l'échantillon de strate de premier degré est très petite. La méthode que nous proposons est une méthode unifiée, applicable quelle que soit la méthode d'imputation (aléatoire on non aléatoire), la taille de la strate (petite ou grande), le genre d'estimateur (lisse ou non lisse) ou le genre de problème (estimation de la variance ou estimation de la distribution d'échantillonnage). En outre, nous discutons de l'approximation de Monte Carlo qu'il convient d'utiliser pour la variance bootstrap lorsque l'on conjugue la réimputation à des méthodes de rééchantillonnage. Dans ces conditions, on doit agir plus prudemment qu'à l'ordinaire. Nous obtenons des résultats comparables pour la méthode des répliques équilibrées répétées qui est souvent utilisée dans le contexte des enquêtes et peut être considérée comme une approximation analytique du bootstrap. Enfin, nous présentons certains résultats d'étude en simulation afin d'examiner les propriétés de l'échantillon de taille finie et divers estimateurs de la variance applicables en cas d'imputation des données.

    Date de diffusion : 2002-02-28

  • Articles et rapports : 12-001-X20000015180
    Description :

    L'imputation est une méthode utilisée couramment pour compenser l'effet de la non-réponse lors de l'analyse des données d'enquête. Fondée sur des données auxiliaires, l'imputation peut produire des estimateurs plus efficaces que ceux construits en ne tenant compte ni de la non-réponse ni de la repondération. Nous étudions et comparons l'erreur quadratique moyenne d'estimateurs d'enquête fondés sur des données imputées par trois méthodes distinctes, c'est-à-dire la méthode courante d'imputation par quotient et deux méthodes cold deck fréquemment appliquées aux enquêtes de nature économique réalisées par le U.S. Census Bureau et par le U.S. Bureau of Labor Statistics.

    Date de diffusion : 2000-08-30
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :