Recherche par

7. Discussion

Cyril Favre Martinoz, David Haziza et Jean-François Beaumont

Dans cet article, nous avons proposé une méthode de détermination du seuil pour des estimateurs winsorisés. Cette méthode a l’avantage d’être simple à mettre en oeuvre en pratique et peut être utilisée pour des plans de sondage à probabilités inégales. Nous avons également proposé une méthode de calage permettant de satisfaire une relation de cohérence entre les estimations winsorisées obtenues au niveau des domaines et une estimation winsorisée au niveau de la population. Bien que nous n'ayons appliqué cette méthode que dans le cas d’estimateurs winsorisés, cette dernière peut être utilisée pour n’importe quel type d’estimateur robuste.

Remerciements

Les auteurs remercient un éditeur associé ainsi que deux arbitres pour leurs commentaires et suggestions qui ont grandement contribué à améliorer la qualité de l’article. Les travaux de recherche de David Haziza ont été financés par une bourse du Conseil de recherches en sciences naturelles et en génie du Canada.

Annexe

On veut montrer qu’il existe une solution à l’équation

$- Δ (K) = \sum_{j \in S} a_{j} \max (0, d_{j} y_{j} - K) = \frac{{\hat{B}}_{min} + {\hat{B}}_{max}}{2} = \hat{t} - {\hat{t}}_{R}$

sous les conditions $π_{i j} - π_{i} π_{j} \leq 0$ et $\frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) \geq 0.$

Ordonnons tout d’abord les unités de la plus petite à la plus grande selon la valeur de $b_{i} = d_{i} y_{i}, i \in S,$ de telle sorte que l’unité 1 devient celle qui a la plus petite valeur de $b_{i}$ et l’unité $n$ devient celle qui a la plus grande valeur. Considérons en premier le cas : $\frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) = 0.$ Il faut résoudre l’équation $- Δ (K) = 0$ et on peut facilement observer que cette équation est satisfaite pour tout $K \geq b_{n} .$

Considérons maintenant le cas : $\frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) > 0.$ Notons d’abord que la fonction $- Δ (K)$ est continue et linéaire par morceaux pour $0 \leq K \leq b_{n} .$ Les morceaux sont définis par les intervalles $[b_{j - 1}, b_{j} [, j = 1, ..., n,$ où $b_{0} = 0.$ Notons aussi que $- Δ (0) = \sum_{j = m}^{n} a_{j} b_{j} > 0,$ où $m$ est le plus petit indice tel que $b_{m} \geq 0.$ Par le théorème de la valeur intermédiaire, il existe une solution à l’équation (4.7) si on peut montrer que

$- Δ (b_{n}) = 0 < \frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) \leq - Δ (0) = \sum_{j = m}^{n} a_{j} b_{j} . (A .1)$

La première inégalité découle directement de la condition $\frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) > 0.$ Pour montrer la deuxième inégalité, on note d’abord que $\frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) \leq {\hat{B}}_{max} .$ Si on utilise l’estimateur (2.2) du biais conditionnel et la condition $π_{i j} - π_{i} π_{j} \leq 0$ alors on observe que ${\hat{B}}_{max} \leq (d_{k} - 1) y_{k},$ l’indice $k$ étant associé à l’unité qui a le plus grand biais conditionnel estimé. Pour l’estimateur winsorisé de Dalén-Tambay, cette dernière inégalité peut être réécrite comme suit : ${\hat{B}}_{max} \leq a_{k} b_{k} .$ Il en résulte que $a_{k} b_{k} \leq - Δ (0) = \sum_{j = m}^{n} a_{j} b_{j},$ ce qui complète la preuve d’existence d’une solution à l’équation (4.7). Pour l’estimateur winsorisé standard, on peut aussi facilement montrer que ${\hat{B}}_{max} \leq a_{k} b_{k}$ et donc qu’une solution existe. De plus, si les $y_{i}, i \in S,$ sont tous positifs alors la fonction $- Δ (K)$ est monotone décroissante pour $0 \leq K \leq b_{n}$ et la solution est unique.

Pour trouver la solution $K_{opt},$ on trouve le plus grand indice $l$ tel que $- Δ (b_{l}) \geq \frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}),$ pour $l \leq n .$ La solution peut ensuite être obtenue par interpolation linéaire entre les points $b_{l}$ et $b_{l + 1};$ c’est-à-dire

$K_{opt} = b_{l} \frac{Δ (b_{l + 1}) - Δ (K_{opt})}{Δ (b_{l + 1}) - Δ (b_{l})} + b_{l + 1} \frac{Δ (K_{opt}) - Δ (b_{l})}{Δ (b_{l + 1}) - Δ (b_{l})},$

où $Δ (K_{opt}) = - \frac{1}{2} ({\hat{B}}_{min} + {\hat{B}}_{max}) .$

Bibliographie

Beaumont, J.-F., Haziza, D. et Ruiz-Gazen, A. (2013). A unified approach to robust estimation in finite population sampling. Biometrika, 100, 555-569.

Berger, Y.G. (1998). Rate of convergence for asymptotic variance of the Horvitz-Thompson estimator. Journal of Statistical Planning and Inference, 74, 149-168.

Clark, R.G. (1995). Winsorization methods in sample surveys. Thèse de maîtrise, Department of Statistics, Australian National University.

Dalén, J. (1987). Practical estimators of a population total which reduce the impact of large observations. R and D Report. Statistics Sweden.

Datta, G.S., Gosh, M., Steorts, R. et Maple, J. (2011). Bayesian benchmarking with applications to small area estimation. Test, 20, 574-588.

Deville, J.-C., et Särndal, C.-E. (1992). Calibration estimators in survey sampling. Journal of the American Statistical Association, 87, 376-382.

Fattorini, L. (2006). Applying the Horvitz-Thompson criterion in complex designs: A computer-intensive perspective for estimating inclusion probabilities. Biometrika, 93, 269-278.

Haziza, D., Mecatti, F. et Rao, J.N.K. (2008). Evaluation of some approximate variance estimators under the Rao-Sampford unequal probability sampling design. Metron, 66, 91-108.

Kokic, P.N., et Bell, P.A. (1994). Optimal Winsorizing cutoffs for a stratified finite population estimator. Journal of Official Statistics, 10, 419-435.

Moreno-Rebollo, J.L., Muñoz-Reyez, A.M., Jimenez-Gamero, M.D. et Muñoz-Pichardo, J. (2002). Influence diagnostics in survey sampling: Estimating the conditional bias. Metrika, 55, 209-214.

Moreno-Rebollo, J.L., Muñoz-Reyez, A.M. et Muñoz-Pichardo, J.M. (1999). Influence diagnostics in survey sampling: Conditional bias. Biometrika, 86, 923-928.

Rivest, L.-P. (1994). Statistical properties of Winsorized means for skewed distributions. Biometrika, 81, 373-383.

Rivest, L.-P., et Hidiroglou, M. (2004). Outlier treatment for disaggregated estimates. Proceedings of the Survey Research Methods Section, American Statistical Association, Alexandria, Virginie, 4248-4256.

Rivest, L.-P., et Hurtubise, D. (1995). Moyenne winsorisée de Searls pour populations asymétriques. Techniques d’enquête, 21, 2, 119-129.

Tambay, J.-L. (1988). An integrated approach for the treatment of outliers in sub-annual surveys. Proceedings of the Survey Research Methods Section, American Statistical Association, Alexandria, Virginie, 229-234.

Thompson, M.E., et Wu, C. (2008). Échantillonnage PPT systématique randomisé basé sur la simulation en cas de substitution d’unités. Techniques d’enquête, 34, 1, 3-11.

You, Y., Rao, J.N.K. et Dick, P. (2004). Benchmarking hierarchical Bayes small area estimators in the Canadian census undercoverage estimation. Statistics in Transition, 6, 631-640.

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

7. Discussion

Remerciements

Annexe

Bibliographie