Analyses
Filtrer les résultats par
Search HelpMot(s)-clé(s)
Année de publication
Auteur(s)
Résultats
Tout (11)
Tout (11) (0 to 10 of 11 results)
- Articles et rapports : 12-001-X202500200001Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).Date de diffusion : 2025-12-23
- Articles et rapports : 12-001-X202500200011Description : On propose une approche hiérarchique bayésienne approximative pour laquelle on utilise la famille exponentielle naturelle avec fonction de variance quadratique en combinant de l’information tirée de multiples sources, afin d’améliorer les estimations de moyennes de population finie pour de petits domaines dans le cadre d’enquêtes traditionnelles. Contrairement aux autres approches bayésiennes relatives à l’échantillonnage d’une population finie, on ne suppose pas de modèle pour toutes les unités de la population finie et l’on n’a pas besoin de procéder au couplage d’unités échantillonnées à la base de population finie. On suppose un modèle uniquement pour les unités d’une population finie pour lesquelles on observe la variable dépendante, car, dans le cas de ces unités, le modèle supposé peut être vérifié à l’aide des outils statistiques existants. On ne suggère pas de modèle élaboré selon les moyennes réelles des unités non observées. On suppose plutôt que les moyennes de population des cellules ayant la même combinaison de niveaux de facteur sont identiques pour tous les petits domaines et que la moyenne de population d’une cellule est identique à la moyenne des unités observées dans cette cellule. On met en application la méthodologie que l’on propose pour une enquête réelle couplant des renseignements tirés de multiples sources de données disparates. On fournit également des moyens pratiques de sélectionner un modèle pouvant s’appliquer à un ensemble élargi de modèles dans le même contexte, mais pour un éventail diversifié de problèmes scientifiques.Date de diffusion : 2025-12-23
- Articles et rapports : 12-001-X202500100005Description : Dans la présente étude, nous calculons un estimateur d’erreur quadratique moyenne de prédiction (EQMP) sans biais (ou quasiment sans biais) de deuxième ordre du meilleur prédicteur linéaire sans biais empirique d’une moyenne de petits domaines pour une extension semi-paramétrique du modèle bien connu de Fay-Herriot. En particulier, nous calculons notre estimateur d’EQMP essentiellement en supposant certaines conditions sur les moments pour les erreurs d’échantillonnage et les distributions d’effets aléatoires. L’estimateur d’EQMP de Prasad-Rao fondé sur l’hypothèse de normalité présente une propriété surprenante de robustesse en ce qu’il demeure sans biais au deuxième ordre sous l’hypothèse de non-normalité d’effets aléatoires lorsqu’un estimateur de méthode des moments simple de Prasad-Rao est utilisé pour la composante de variance et que la distribution de l’erreur d’échantillonnage est normale. Nous montrons que l’estimateur d’EQMP fondé sur l’hypothèse de normalité n’est plus sans biais de deuxième ordre lorsque la distribution de l’erreur d’échantillonnage présente un aplatissement non nul ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance, même lorsque la distribution de l’erreur d’échantillonnage est normale. Il est intéressant de souligner que lors de l’utilisation de l’estimateur de méthode des moments simple pour la composante de variance, l’estimateur d’EQMP que nous proposons ne nécessite pas d’estimation de l’aplatissement des effets aléatoires. Nous présentons également les résultats d’une étude par simulation sur l’exactitude de l’estimateur d’EQMP proposé, en cas de non-normalité des distributions d’échantillonnage et des effets aléatoires.Date de diffusion : 2025-06-30
- Articles et rapports : 12-001-X202400100014Description : Cet article est une introduction au numéro spécial sur l’utilisation d’échantillons non probabilistes comprenant trois articles présentés lors de la 29e conférence Morris Hansen par Courtney Kennedy, Yan Li et Jean-François Beaumont.Date de diffusion : 2024-06-25
- Articles et rapports : 12-001-X201400114030Description :
L’article décrit les résultats d’une étude par simulation Monte Carlo réalisée en vue de comparer l’efficacité de quatre modèles hiérarchiques bayésiens d’estimation sur petits domaines pour estimer des proportions au niveau de l’État au moyen de données provenant d’échantillons aléatoires simples stratifiés tirés d’une population finie fixe. Deux des modèles reposent sur les hypothèses fréquentes selon lesquelles, pour chaque petit domaine échantillonné, la proportion pondérée par les poids de sondage estimée suit une loi normale et sa variance d’échantillonnage est connue. L’un de ces modèles comprend un modèle de lien linéaire et l’autre, un modèle de lien logistique. Les deux autres modèles utilisent tous deux un modèle de lien logistique et reposent sur l’hypothèse que la variance d’échantillonnage est inconnue. L’un de ces deux modèles suppose que le modèle d’échantillonnage obéit à une loi normale et l’autre, qu’il obéit à une loi bêta. L’étude montre que, pour chacun des quatre modèles, la couverture sous le plan de sondage de l’intervalle de crédibilité des proportions au niveau de l’État en population finie s’écarte considérablement du niveau nominal de 95 % utilisé pour construire les intervalles.
Date de diffusion : 2014-06-27 - Articles et rapports : 12-001-X200900110886Description :
La variabilité d'intervieweur est une composante importante de la variabilité des statistiques produites par sondage. Diverses stratégies liées au format et à la formulation des questions, ainsi qu'à la formation, à la charge de travail, à l'expérience et à l'affectation des intervieweurs sont employées pour essayer de réduire la variabilité d'intervieweur. La formule classique de mesure de la variabilité d'intervieweur, souvent appelée effet d'intervieweur, est donnée par ieff := deff_int = 1 + (n bar sub int - 1) rho sub int, où rho sub int et n bar sub int sont, respectivement, la corrélation intra intervieweur et la moyenne simple des charges de travail d'intervieweur. Dans le présent article, nous donnons une justification assistée par modèle de cette formule bien connue pour les méthodes d'échantillonnage avec probabilités égales (EPE) quand il n'existe pas de grappes spatiales dans l'échantillon et que les charges de travail des intervieweurs sont égales. Toutefois, les grappes spatiales ainsi que la pondération inégale sont très fréquentes dans les enquêtes à grande échelle. Dans le contexte d'un plan d'échantillonnage complexe, nous obtenons une formule appropriée de la variabilité d'intervieweur qui tient compte des probabilités inégales de sélection et des grappes spatiales. Notre formule fournit une évaluation plus exacte des effets d'intervieweur et permet donc d'affecter un budget plus raisonnable au contrôle de la variabilité d'intervieweur. Nous proposons aussi une décomposition de l'effet global en effets dus à la pondération, aux grappes spatiales et aux intervieweurs. Cette décomposition aide à comprendre différents moyens de réduire la variance totale.
Date de diffusion : 2009-06-22 - Articles et rapports : 11-522-X200600110393Description :
Dans le présent article, nous calculons un estimateur de deuxième ordre sans biais (ou presque sans biais) de l'erreur quadratique moyenne de prédiction (EQMP) du meilleur prédicteur linéaire sans biais empirique (MPLSBE) d'un total de petit domaine pour une extension, selon l'hypothèse de non-normalité, du modèle bien connu de Fay-Herriot. Plus précisément, nous calculons notre estimateur de l'EQMP en posant essentiellement certaines conditions de moment pour les distributions de l'erreur d'échantillonnage et des effets aléatoires. L'estimateur de l'EQMP de Prasad-Rao fondé sur l'hypothèse de normalité se révèle étonnamment robuste en ce sens qu'il reste un estimateur de deuxième ordre sans biais dans des conditions de non-normalité des effets aléatoires lorsqu'un estimateur simple de la méthode des moments est employé pour la composante de variance et lorsque l'erreur d'échantillonnage suit une distribution normale. Nous montrons que l'estimateur de l'EQMP fondé sur l'hypothèse de normalité n'est plus un estimateur de deuxième ordre sans biais lorsque l'erreur d'échantillonnage suit une distribution non normale ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance même si l'erreur d'échantillonnage suit une distribution normale. Il est intéressant de noter que lorsque l'estimateur simple de la méthode des moments est utilisé pour la composante de variance, l'estimateur de l'EQMP que nous proposons n'exige pas une estimation du kurtosis des effets aléatoires. Les résultats d'une étude de simulation sur l'exactitude de l'estimateur de l'EQMP proposé, dans des conditions de non-normalité de la distribution tant de l'erreur d'échantillonnage que des effets aléatoires, sont également présentés.
Date de diffusion : 2008-03-17 - Articles et rapports : 12-001-X20050018094Description :
Les modèles de régression à erreur emboîtée sont utilisés fréquemment pour l'estimation par petits domaines et les problèmes connexes. Cependant, l'application des critères standard de sélection du modèle de régression aux modèles à erreur emboîtée donne parfois lieu à des méthodes de sélection du modèle inefficaces. Nous illustrons ce point en examinant les propriétés de la statistique C_P au moyen d'une étude par simulation de Monte Carlo. L'inefficacité de la statistique C_P peut, cependant, être corrigée grâce à une transformation appropriée des données.
Date de diffusion : 2005-07-21 - Articles et rapports : 12-001-X19990014715Description :
The Gallup Organization a mené des enquêtes-ménages pour étudier la prévalence à l'échelle des États de la consommation d'alcool et de drogues (par exemple, cocaïne, marijuana, etc.). Les estimations traditionnelles dans le cadre d'enquêtes fondées sur le plan d'échantillonnage relativement à l'utilisation et à la dépendance pour des comptés et des groupes démographiques choisis ont des erreurs-types inacceptables parce que la taille des échantillons dans des groupes infra-états est trop petite. L'estimation synthétique incorpore des renseignements démographiques et des indicateurs sociaux dans les estimations de la prévalence grâce à un modèle de régression implicite. Les estimations synthétiques ont tendance à produire des variances plus petites que les estimations fondées sur le plan d'échantillonnage, mais elles peuvent être très homogènes d'un comté à l'autre lorsque les variables auxiliaires sont homogènes. Les estimations composites pour les données régionales sont des mouvements ponérées des estimations synthétiques et des estimations d'enquêtes fondées sur le plan d'échantillonnage. Un deuxième problème que l'on ne rencontre pas généralement au niveau de l'État, mais qui est présent pour des zones infra-états et des groupes concerne l'estimation des erreurs-types des prévalences estimées qui sont près de zéro. Cette difficulté touche non seulement les estimations des enquêtes-ménages téléphoniques, mais aussi les estimations composites. Un modèle hiérarchique est proposé pour régler ce problème. Des estimateurs composites empririques de Bayes, qui incorporent des facteurs de pondération des enquêtes, des prévalences et des estimateurs selon la technique du jackknife de leurs erreurs quadratiques moyennes sont présentés et illustrés.
Date de diffusion : 1999-10-08 - Articles et rapports : 12-001-X19990014718Description :
Les auteurs de la présente note montrent que la formule bien connue de l'effet de plan de sondage, proposée intuitivement par Kish, comporte une justification à base de modèle. La formule peut-être interprétée comme une valeur prudente de l'effet réel de plan de sondage.
Date de diffusion : 1999-10-08
Articles et rapports (11)
Articles et rapports (11) (0 to 10 of 11 results)
- Articles et rapports : 12-001-X202500200001Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).Date de diffusion : 2025-12-23
- Articles et rapports : 12-001-X202500200011Description : On propose une approche hiérarchique bayésienne approximative pour laquelle on utilise la famille exponentielle naturelle avec fonction de variance quadratique en combinant de l’information tirée de multiples sources, afin d’améliorer les estimations de moyennes de population finie pour de petits domaines dans le cadre d’enquêtes traditionnelles. Contrairement aux autres approches bayésiennes relatives à l’échantillonnage d’une population finie, on ne suppose pas de modèle pour toutes les unités de la population finie et l’on n’a pas besoin de procéder au couplage d’unités échantillonnées à la base de population finie. On suppose un modèle uniquement pour les unités d’une population finie pour lesquelles on observe la variable dépendante, car, dans le cas de ces unités, le modèle supposé peut être vérifié à l’aide des outils statistiques existants. On ne suggère pas de modèle élaboré selon les moyennes réelles des unités non observées. On suppose plutôt que les moyennes de population des cellules ayant la même combinaison de niveaux de facteur sont identiques pour tous les petits domaines et que la moyenne de population d’une cellule est identique à la moyenne des unités observées dans cette cellule. On met en application la méthodologie que l’on propose pour une enquête réelle couplant des renseignements tirés de multiples sources de données disparates. On fournit également des moyens pratiques de sélectionner un modèle pouvant s’appliquer à un ensemble élargi de modèles dans le même contexte, mais pour un éventail diversifié de problèmes scientifiques.Date de diffusion : 2025-12-23
- Articles et rapports : 12-001-X202500100005Description : Dans la présente étude, nous calculons un estimateur d’erreur quadratique moyenne de prédiction (EQMP) sans biais (ou quasiment sans biais) de deuxième ordre du meilleur prédicteur linéaire sans biais empirique d’une moyenne de petits domaines pour une extension semi-paramétrique du modèle bien connu de Fay-Herriot. En particulier, nous calculons notre estimateur d’EQMP essentiellement en supposant certaines conditions sur les moments pour les erreurs d’échantillonnage et les distributions d’effets aléatoires. L’estimateur d’EQMP de Prasad-Rao fondé sur l’hypothèse de normalité présente une propriété surprenante de robustesse en ce qu’il demeure sans biais au deuxième ordre sous l’hypothèse de non-normalité d’effets aléatoires lorsqu’un estimateur de méthode des moments simple de Prasad-Rao est utilisé pour la composante de variance et que la distribution de l’erreur d’échantillonnage est normale. Nous montrons que l’estimateur d’EQMP fondé sur l’hypothèse de normalité n’est plus sans biais de deuxième ordre lorsque la distribution de l’erreur d’échantillonnage présente un aplatissement non nul ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance, même lorsque la distribution de l’erreur d’échantillonnage est normale. Il est intéressant de souligner que lors de l’utilisation de l’estimateur de méthode des moments simple pour la composante de variance, l’estimateur d’EQMP que nous proposons ne nécessite pas d’estimation de l’aplatissement des effets aléatoires. Nous présentons également les résultats d’une étude par simulation sur l’exactitude de l’estimateur d’EQMP proposé, en cas de non-normalité des distributions d’échantillonnage et des effets aléatoires.Date de diffusion : 2025-06-30
- Articles et rapports : 12-001-X202400100014Description : Cet article est une introduction au numéro spécial sur l’utilisation d’échantillons non probabilistes comprenant trois articles présentés lors de la 29e conférence Morris Hansen par Courtney Kennedy, Yan Li et Jean-François Beaumont.Date de diffusion : 2024-06-25
- Articles et rapports : 12-001-X201400114030Description :
L’article décrit les résultats d’une étude par simulation Monte Carlo réalisée en vue de comparer l’efficacité de quatre modèles hiérarchiques bayésiens d’estimation sur petits domaines pour estimer des proportions au niveau de l’État au moyen de données provenant d’échantillons aléatoires simples stratifiés tirés d’une population finie fixe. Deux des modèles reposent sur les hypothèses fréquentes selon lesquelles, pour chaque petit domaine échantillonné, la proportion pondérée par les poids de sondage estimée suit une loi normale et sa variance d’échantillonnage est connue. L’un de ces modèles comprend un modèle de lien linéaire et l’autre, un modèle de lien logistique. Les deux autres modèles utilisent tous deux un modèle de lien logistique et reposent sur l’hypothèse que la variance d’échantillonnage est inconnue. L’un de ces deux modèles suppose que le modèle d’échantillonnage obéit à une loi normale et l’autre, qu’il obéit à une loi bêta. L’étude montre que, pour chacun des quatre modèles, la couverture sous le plan de sondage de l’intervalle de crédibilité des proportions au niveau de l’État en population finie s’écarte considérablement du niveau nominal de 95 % utilisé pour construire les intervalles.
Date de diffusion : 2014-06-27 - Articles et rapports : 12-001-X200900110886Description :
La variabilité d'intervieweur est une composante importante de la variabilité des statistiques produites par sondage. Diverses stratégies liées au format et à la formulation des questions, ainsi qu'à la formation, à la charge de travail, à l'expérience et à l'affectation des intervieweurs sont employées pour essayer de réduire la variabilité d'intervieweur. La formule classique de mesure de la variabilité d'intervieweur, souvent appelée effet d'intervieweur, est donnée par ieff := deff_int = 1 + (n bar sub int - 1) rho sub int, où rho sub int et n bar sub int sont, respectivement, la corrélation intra intervieweur et la moyenne simple des charges de travail d'intervieweur. Dans le présent article, nous donnons une justification assistée par modèle de cette formule bien connue pour les méthodes d'échantillonnage avec probabilités égales (EPE) quand il n'existe pas de grappes spatiales dans l'échantillon et que les charges de travail des intervieweurs sont égales. Toutefois, les grappes spatiales ainsi que la pondération inégale sont très fréquentes dans les enquêtes à grande échelle. Dans le contexte d'un plan d'échantillonnage complexe, nous obtenons une formule appropriée de la variabilité d'intervieweur qui tient compte des probabilités inégales de sélection et des grappes spatiales. Notre formule fournit une évaluation plus exacte des effets d'intervieweur et permet donc d'affecter un budget plus raisonnable au contrôle de la variabilité d'intervieweur. Nous proposons aussi une décomposition de l'effet global en effets dus à la pondération, aux grappes spatiales et aux intervieweurs. Cette décomposition aide à comprendre différents moyens de réduire la variance totale.
Date de diffusion : 2009-06-22 - Articles et rapports : 11-522-X200600110393Description :
Dans le présent article, nous calculons un estimateur de deuxième ordre sans biais (ou presque sans biais) de l'erreur quadratique moyenne de prédiction (EQMP) du meilleur prédicteur linéaire sans biais empirique (MPLSBE) d'un total de petit domaine pour une extension, selon l'hypothèse de non-normalité, du modèle bien connu de Fay-Herriot. Plus précisément, nous calculons notre estimateur de l'EQMP en posant essentiellement certaines conditions de moment pour les distributions de l'erreur d'échantillonnage et des effets aléatoires. L'estimateur de l'EQMP de Prasad-Rao fondé sur l'hypothèse de normalité se révèle étonnamment robuste en ce sens qu'il reste un estimateur de deuxième ordre sans biais dans des conditions de non-normalité des effets aléatoires lorsqu'un estimateur simple de la méthode des moments est employé pour la composante de variance et lorsque l'erreur d'échantillonnage suit une distribution normale. Nous montrons que l'estimateur de l'EQMP fondé sur l'hypothèse de normalité n'est plus un estimateur de deuxième ordre sans biais lorsque l'erreur d'échantillonnage suit une distribution non normale ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance même si l'erreur d'échantillonnage suit une distribution normale. Il est intéressant de noter que lorsque l'estimateur simple de la méthode des moments est utilisé pour la composante de variance, l'estimateur de l'EQMP que nous proposons n'exige pas une estimation du kurtosis des effets aléatoires. Les résultats d'une étude de simulation sur l'exactitude de l'estimateur de l'EQMP proposé, dans des conditions de non-normalité de la distribution tant de l'erreur d'échantillonnage que des effets aléatoires, sont également présentés.
Date de diffusion : 2008-03-17 - Articles et rapports : 12-001-X20050018094Description :
Les modèles de régression à erreur emboîtée sont utilisés fréquemment pour l'estimation par petits domaines et les problèmes connexes. Cependant, l'application des critères standard de sélection du modèle de régression aux modèles à erreur emboîtée donne parfois lieu à des méthodes de sélection du modèle inefficaces. Nous illustrons ce point en examinant les propriétés de la statistique C_P au moyen d'une étude par simulation de Monte Carlo. L'inefficacité de la statistique C_P peut, cependant, être corrigée grâce à une transformation appropriée des données.
Date de diffusion : 2005-07-21 - Articles et rapports : 12-001-X19990014715Description :
The Gallup Organization a mené des enquêtes-ménages pour étudier la prévalence à l'échelle des États de la consommation d'alcool et de drogues (par exemple, cocaïne, marijuana, etc.). Les estimations traditionnelles dans le cadre d'enquêtes fondées sur le plan d'échantillonnage relativement à l'utilisation et à la dépendance pour des comptés et des groupes démographiques choisis ont des erreurs-types inacceptables parce que la taille des échantillons dans des groupes infra-états est trop petite. L'estimation synthétique incorpore des renseignements démographiques et des indicateurs sociaux dans les estimations de la prévalence grâce à un modèle de régression implicite. Les estimations synthétiques ont tendance à produire des variances plus petites que les estimations fondées sur le plan d'échantillonnage, mais elles peuvent être très homogènes d'un comté à l'autre lorsque les variables auxiliaires sont homogènes. Les estimations composites pour les données régionales sont des mouvements ponérées des estimations synthétiques et des estimations d'enquêtes fondées sur le plan d'échantillonnage. Un deuxième problème que l'on ne rencontre pas généralement au niveau de l'État, mais qui est présent pour des zones infra-états et des groupes concerne l'estimation des erreurs-types des prévalences estimées qui sont près de zéro. Cette difficulté touche non seulement les estimations des enquêtes-ménages téléphoniques, mais aussi les estimations composites. Un modèle hiérarchique est proposé pour régler ce problème. Des estimateurs composites empririques de Bayes, qui incorporent des facteurs de pondération des enquêtes, des prévalences et des estimateurs selon la technique du jackknife de leurs erreurs quadratiques moyennes sont présentés et illustrés.
Date de diffusion : 1999-10-08 - Articles et rapports : 12-001-X19990014718Description :
Les auteurs de la présente note montrent que la formule bien connue de l'effet de plan de sondage, proposée intuitivement par Kish, comporte une justification à base de modèle. La formule peut-être interprétée comme une valeur prudente de l'effet réel de plan de sondage.
Date de diffusion : 1999-10-08