7. Discussion
Cyril Favre Martinoz, David Haziza et Jean-François Beaumont
Précédent
Dans cet article, nous avons proposé une méthode de détermination du seuil
pour des estimateurs winsorisés. Cette méthode a l’avantage d’être simple à
mettre en oeuvre en pratique et peut être utilisée pour des plans de sondage à
probabilités inégales. Nous avons également proposé une méthode de calage
permettant de satisfaire une relation de cohérence entre les estimations
winsorisées obtenues au niveau des domaines et une estimation winsorisée au
niveau de la population. Bien que nous n'ayons appliqué cette méthode que dans le
cas d’estimateurs winsorisés, cette dernière peut être utilisée pour n’importe
quel type d’estimateur robuste.
Remerciements
Les auteurs remercient un éditeur associé ainsi que deux arbitres pour
leurs commentaires et suggestions qui ont grandement contribué à améliorer la
qualité de l’article. Les travaux de recherche de David Haziza ont été financés
par une bourse du Conseil de recherches en sciences naturelles et en génie du
Canada.
Annexe
On veut montrer qu’il existe une solution à l’équation
sous les
conditions
et
Ordonnons tout d’abord les unités de la plus petite à la plus grande selon
la valeur de
de telle sorte que
l’unité 1 devient celle qui a la plus petite valeur de
et l’unité
devient celle qui a
la plus grande valeur. Considérons en premier le cas :
Il faut résoudre l’équation
et on peut
facilement observer que cette équation est satisfaite pour tout
Considérons maintenant le cas :
Notons d’abord que
la fonction
est continue et
linéaire par morceaux pour
Les morceaux sont
définis par les intervalles
où
Notons aussi que
où
est le plus petit
indice tel que
Par le théorème de la
valeur intermédiaire, il existe une solution à l’équation (4.7) si on peut
montrer que
La première
inégalité découle directement de la condition
Pour montrer la deuxième inégalité,
on note d’abord que
Si on utilise l’estimateur (2.2) du
biais conditionnel et la condition
alors on observe que
l’indice
étant associé à l’unité qui a le
plus grand biais conditionnel estimé. Pour l’estimateur winsorisé de
Dalén-Tambay, cette dernière inégalité peut être réécrite comme suit :
Il en résulte que
ce qui complète la preuve d’existence
d’une solution à l’équation (4.7). Pour l’estimateur winsorisé standard, on
peut aussi facilement montrer que
et donc qu’une solution existe. De
plus, si les
sont tous positifs alors la
fonction
est monotone décroissante pour
et la solution est unique.
Pour trouver la solution
on
trouve le plus grand indice
tel que
pour
La
solution peut ensuite être obtenue par interpolation linéaire entre les points
et
c’est-à-dire
où
Bibliographie
Beaumont, J.-F., Haziza, D. et Ruiz-Gazen, A. (2013). A unified approach to robust estimation in
finite population sampling. Biometrika, 100, 555-569.
Berger, Y.G.
(1998). Rate of convergence for asymptotic variance of the Horvitz-Thompson
estimator. Journal of Statistical Planning and Inference, 74, 149-168.
Clark, R.G.
(1995). Winsorization methods in sample surveys. Thèse de maîtrise, Department
of Statistics, Australian National University.
Dalén, J.
(1987). Practical estimators of a population total which reduce the impact of
large observations. R and D Report. Statistics Sweden.
Datta, G.S.,
Gosh, M., Steorts, R. et Maple, J. (2011). Bayesian benchmarking with
applications to small area estimation. Test, 20, 574-588.
Deville,
J.-C., et Särndal, C.-E. (1992). Calibration estimators in survey sampling. Journal
of the American Statistical Association, 87, 376-382.
Fattorini, L.
(2006). Applying the Horvitz-Thompson criterion in complex designs: A
computer-intensive perspective for estimating inclusion probabilities. Biometrika, 93, 269-278.
Haziza, D.,
Mecatti, F. et Rao, J.N.K. (2008). Evaluation of some approximate variance
estimators under the Rao-Sampford unequal probability sampling design. Metron, 66, 91-108.
Kokic, P.N.,
et Bell, P.A. (1994). Optimal Winsorizing cutoffs for a stratified finite
population estimator. Journal of Official Statistics, 10, 419-435.
Moreno-Rebollo,
J.L., Muñoz-Reyez, A.M., Jimenez-Gamero, M.D. et Muñoz-Pichardo, J. (2002).
Influence diagnostics in survey sampling: Estimating the conditional bias. Metrika, 55, 209-214.
Moreno-Rebollo,
J.L., Muñoz-Reyez, A.M. et Muñoz-Pichardo, J.M. (1999). Influence diagnostics
in survey sampling: Conditional bias. Biometrika, 86, 923-928.
Rivest, L.-P.
(1994). Statistical properties of Winsorized means for skewed distributions. Biometrika, 81, 373-383.
Rivest, L.-P.,
et Hidiroglou, M. (2004). Outlier treatment for disaggregated estimates. Proceedings
of the Survey Research Methods Section, American Statistical Association, Alexandria, Virginie, 4248-4256.
Rivest, L.-P., et Hurtubise, D. (1995). Moyenne winsorisée de Searls pour
populations asymétriques. Techniques
d’enquête, 21, 2, 119-129.
Tambay, J.-L.
(1988). An integrated approach for the treatment of outliers in sub-annual
surveys. Proceedings of the Survey Research Methods Section, American Statistical Association,
Alexandria, Virginie, 229-234.
Thompson, M.E., et Wu, C. (2008). Échantillonnage PPT systématique
randomisé basé sur la simulation en cas de substitution d’unités. Techniques
d’enquête, 34, 1, 3-11.
You, Y., Rao, J.N.K. et Dick, P. (2004). Benchmarking hierarchical Bayes small area estimators
in the Canadian census undercoverage estimation. Statistics in Transition, 6, 631-640.
Précédent