Recherche par

7. Conclusion

Piero Demetrio Falorsi et Paolo Righi

L’article décrit une nouvelle approche en vue de déterminer les probabilités d’inclusion optimales dans divers contextes d’enquête caractérisés par la nécessité de diffuser des estimations d’enquête d’une précision préétablie, pour de multiples variables et domaines d’intérêt.

La principale contribution de l’article a trait au calcul pratique de ces probabilités au moyen d’un nouvel algorithme, qui convient pour un plan d’échantillonnage multidimensionnel général dans lequel l’échantillonnage stratifié classique représente un cas particulier. L’approche proposée, l’algorithme et le calcul final sont orientés domaine et variable.

Dans notre cadre, les variables indicatrices d’appartenance à un domaine sont supposées connues, tandis que les variables d’intérêt sont inconnues. La procédure est alors appliquée aux valeurs prédites des caractéristiques d’intérêt au moyen d’un modèle de superpopulation, et l’algorithme permet de tenir compte de l’incertitude du modèle; cela reflète le fait que les valeurs des variables d’intérêt sont inconnues. En utilisant la variance anticipée comme mesure de la précision de l’estimateur, cette approche permet de contourner les limites des algorithmes standard utilisés pour la répartition des échantillons, dans lesquels les variables d’intérêt dictant la solution sont supposées connues.

L’algorithme proposé exploite une procédure standard, mais présente certaines innovations en matière de calcul qui pourraient être utiles pour faire face à la complexité qui découle du fait que les variances anticipées sont des fonctions implicites des probabilités d’inclusion. L’algorithme a été testé sur des données simulées et des données d’enquête réelles afin d’évaluer sa performance et ses propriétés. Les résultats d’un petit ensemble d’expériences sont présentés ici. Ils confirment une amélioration, en ce qui concerne l’efficacité, de la stratégie d’échantillonnage. Une généralisation naturelle du cas examiné ici peut être élaborée en considérant que les indicateurs de domaine et d’autres variables indépendantes quantitatives sont connus à l’étape de l’élaboration du plan d’échantillonnage. Nous notons que la variance anticipée en ne tenant compte que des indicateurs de domaine est plus grande que la variance anticipée de ce cas plus général. Donc, notre solution représente une borne supérieure (et d’une certaine robustesse) de la solution à la phase de l’élaboration du plan. En outre, la solution algorithmique peut être adaptée facilement à cette situation plus générale.

Remerciements

La présente étude a été financée par le partenariat de la Stratégie mondiale pour l’amélioration des statistiques agricoles et rurales : http://www.fao.org/economic/ess/ess-capacity/strategie-mondiale/fr/.

Annexe

Annexe A1

VA de l’estimateur HT

Considérons le résidu $η_{(d r) k}$ tel qu’il est exprimé par l’équation (3.5), et remplaçons le terme $y_{r k}$ par ${\tilde{y}}_{r k} + u_{r k},$ ce qui nous donne

$η_{(d r) k} = ({\tilde{y}}_{r k} + u_{r k}) γ_{d k} - π_{k} {δ^{'}}_{k} {[A (π)]}^{- 1} \sum_{j \in U} π_{j} δ_{j} ({\tilde{y}}_{r j} + u_{r j}) γ_{d j} (1 / π_{j} - 1) . (A 1.1)$

Les moindres prédictions pondérées de ${\tilde{y}}_{r k} γ_{d k}$ et $u_{r k} γ_{d k},$ avec les prédicteurs $π_{k} δ_{k}$ et les pondérations $1 / π_{k} - 1,$ sont

${\hat{\tilde{y}}}_{(d r) k} = π_{k} a_{(d r) k} (A 1.2)$

${\hat{u}}_{(d r) k} = π_{k} {δ^{'}}_{k} {[A (π)]}^{- 1} \sum_{j \in U} π_{j} δ_{j} u_{r j} γ_{d j} (1 / π_{j} - 1), (A 1.3)$

avec

$a_{(d r) k} (π) = {δ^{'}}_{k} {[A (π)]}^{- 1} \sum_{j \in U} π_{j} δ_{j} {\tilde{y}}_{r j} γ_{d k} (1 / π_{j} - 1) . (A 1.4)$

En utilisant les formules (A1.2) et (A1.3), l’expression (A1.1) peut être reformulée sous la forme $η_{(d r) k} = ({\tilde{y}}_{r k} + u_{r k}) γ_{d k} - [{\hat{\tilde{y}}}_{(d r) k} + {\hat{u}}_{(d r) k}] .$ Par conséquent, l’espérance sous le modèle de $η_{(d r) k}^{2}$ est

$E_{M} (η_{(d r) k}^{2}) = {({\tilde{y}}_{r k} γ_{d k} - {\hat{\tilde{y}}}_{(d r) k})}^{2} + E_{M} [{(u_{r k} γ_{d k} - {\hat{u}}_{(d r) k})}^{2}] + termes de moyenne nulle, (A 1.5)$

car $E_{M} (u_{r k}) = 0.$ En outre,

$E_{M} [{(u_{r k} γ_{d k} - {\hat{u}}_{(d r) k})}^{2}] = σ_{r k}^{2} γ_{d k} + E_{M} {({\hat{u}}_{(d r) k})}^{2} - 2 E_{M} (u_{r k} γ_{d k}, {\hat{u}}_{(d r) k}), (A 1.6)$

où $E_{M} (u_{r k} γ_{d k} {\hat{u}}_{(d r) k}) = π_{k} b_{(d r) k} (π)$ et $E_{M} {({\hat{u}}_{(d r) k})}^{2} = π_{k}^{2} c_{(d r) k} (π),$ avec

$b_{(d r) k} (π) = {δ^{'}}_{k} {[A (π)]}^{- 1} δ_{k} σ_{r k}^{2} γ_{d k} (1 - π_{k}) (A 1.7)$

$c_{(d r) k} (π) = {δ^{'}}_{k} {[A (π)]}^{- 1} [\sum_{j \in U} δ_{j} {δ^{'}}_{j} σ_{r j}^{2} γ_{d j} {(1 - π_{j})}^{2}] {[A (π)]}^{- 1} δ_{k} . (A 1.8)$

L’expression (4.5) est obtenue facilement en insérant les expressions provenant de (A1.2) à (A1.8) dans l’équation (4.3).

Annexe A2

Convergence de l’algorithme

Le problème d’optimisation (5.1) est résolu par deux itérations du point fixe emboîtées. Étant donné un vecteur $x$ de dimension $q$ inconnu, l’itération du point fixe choisit une valeur supposée initiale ${}^{(0)}x .$ Puis, l’algorithme calcule des itérés subséquents selon ${}^{(τ + 1)}x = g ({}^{(τ)}x),$ avec $τ = 1, 2, \dots,$ où $g (\cdot)$ est un système de $q$ équations de mise à jour. La fonction multivariée $g$ possède un point fixe dans un domaine $Q \subseteq ℜ^{q}$ si $g$ applique $Q$ dans $Q .$ Soit $J_{g} (x)$ la matrice jacobéenne de la dérivée partielle première de $g$ évaluée à $x .$ S’il existe une constante $ρ < 1$ telle que, dans une norme matricielle naturelle, $‖ J_{g} (x) ‖ \leq ρ, x \in Q,$ $g$ possède un point fixe unique $x^{*} \in Q,$ et l’itération du point fixe est garantie de converger vers $x^{*}$ pour toute valeur supposée initiale choisie dans $Q .$ En ce qui concerne l’algorithme proposé, la convergence de la boucle interne (BI) et de la boucle externe (BE) est obtenue quand les termes ${}^{(α τ)}V {AA}_{3 (d r)}$ convergent vers le point fixe. Cela signifie que les vecteurs ${}^{(α)}π$ et ${}^{(α τ)}π$ ne changent pas dans les itérations de la BE et de la BI. Dans la démonstration qui suit, nous considérons la méthode proposée par Chromy (1987) pour résoudre le PLCS du système (5.7), et nous formulons certaines hypothèses raisonnables, à savoir : 1) ${\hat{u}}_{(d r) k} ≅ 0;$ 2) $[N / (N - H)] ≅ 1;$ 3) ${\hat{\tilde{y}}}_{r k} ≅ {\tilde{y}}_{r k};$ 4) ${}^{(α)}π_{k} ≅ {}^{(α τ)}Δ {}^{(α τ)}π_{k}$ avec $0 < {}^{(α τ)}Δ \leq 1;$ 5) $c_{k} ≅ \bar{c} .$ L’hypothèse (1) correspond à l’approximation à la hausse de la variance anticipée, donnée à la remarque 4.1, et implique que $b_{(d r) k} ({}^{(α)}π) = c_{(d r) k} ({}^{(α)}π) = 0.$ L’hypothèse (3) implique que $a_{(d r) k} ({}^{(α)}π) {\tilde{y}}_{r k} γ_{d k} ≅ {\tilde{y}}_{r k}^{2} γ_{d k} / {}^{(α)}π_{k} .$ L’hypothèse (4) énonce que la structure des probabilités d’inclusion demeure à peu près constante dans les différentes itérations de la BI. L’hypothèse devient raisonnable compte tenu du fait que l’équation de mise à jour A2.2 qui suit (d’une probabilité d’inclusion donnée) est essentiellement déterminée par le seuil de variance qui requiert la taille d’échantillon la plus grande. Il est plausible d’émettre l’hypothèse que ce seuil demeure plus ou moins le même dans les itérations de la BI subséquentes d’une BE donnée.

Preuve de la convergence de la boucle interne. En reformulant l’expression (4.6) conformément aux hypothèses (1) à (4),

${}^{(α τ + 1)}V {AA}_{3 (d r)} = \sum_{k \in U} [(\frac{1}{{}^{(α τ + 1)}π_{k}} - 1) (2 \frac{{\tilde{y}}_{r k}^{2} γ_{d k}}{{}^{(α τ + 1)}Δ} - \frac{{\tilde{y}}_{r k}^{2} γ_{d k}}{{}^{(α τ + 1)}Δ^{2}})] . (A 2.1)$

En considérant que, dans le problème (5.7), les valeurs de ${}^{(a τ)}V {AA}_{3 (d r)}$ sont fixes, chaque valeur du vecteur ${}^{(α τ + 1)}π$ s’obtient comme une solution du PLCS avec l’algorithme de Chromy. Désignons par $α τ v *$ l’itération de l’algorithme de Chromy durant laquelle il converge, où ${}^{(α τ v * + 1)}π ≅ {}^{(α τ v *)}π .$ Alors, la BI met à jour la probabilité générique conformément à l’expression

${}^{(α τ + 1)}π_{k} = {[\sum_{(d r)} {}^{(α τ v * + 1)}ϕ_{(d r)} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{\bar{c}}]}^{1 / 2}, (A 2.2)$

où le deuxième terme du membre de droite représente la formule de mise à jour de l’algorithme de Chromy, et $\sum_{(d r)}$ représente $\sum_{d = 1}^{D} \sum_{r = 1}^{R},$ et ${}^{(α τ v * + 1)}ϕ_{(d r)}$ est le multiplicateur de Lagrange généralisé, où

$\begin{array}{l} {}^{(α τ v * + 1)}ϕ_{(d r)} & = & {}^{(α τ v *)}ϕ_{(d r)} {[\frac{{}^{(α τ v *)}V_{(d r)}}{{\overset{⃛}{V}}_{(d r)} + {}^{(α τ)}V {AA}_{3 (d r)}}]}^{2}, \\ {}^{(α τ v *)}V_{(d r)} & = & \sum_{k \in U} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{{}^{(α τ v *)}π_{k}} \end{array} (A 2.3)$

${\overset{⃛}{V}}_{(d r)} = {\bar{V}}_{(d r)} + \sum_{k \in U} ({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k} .$

La théorie de Kuhn-Tucker énonce que ${}^{(α τ v *)}ϕ_{(d r)} [{}^{(α τ v *)}V_{(d r)} - ({\overset{⃛}{V}}_{(d r)} + {}^{(α τ)}A V_{3 (d r)})] = 0;$ par conséquent, ${}^{(α τ v * + 1)}ϕ_{(d r)} = {}^{(α τ v *)}ϕ_{(d r)}$ et ${}^{(α τ v * + 1)}ϕ_{(d r)} > 0$ si et seulement si ${}^{(α τ v *)}V_{(d r)} / ({\overset{⃛}{V}}_{(d r)} + {}^{(α τ)}A V_{3 (d r)}) = 1.$ Chromy affirme que peu de ${}^{(α τ v *)}ϕ_{(d r)}$ $(pour r = 1, \dots, R; d = 1, \dots, D)$ sont plus grands que zéro, et que dans la plupart des cas, une seule valeur est strictement positive. En notant ${}^{(α τ)}V A A_{3} = {({}^{(α τ)}V {AA}_{3 (11)}, \dots, {}^{(α τ)}V {AA}_{3 (1 R)}, \dots, {}^{(α τ)}V {AA}_{3 (D R)})}^{'},$ nous définissons ${}^{(α τ + 1)}V A A_{3} = g ({}^{(α τ)}V A A_{3})$ comme étant le système de $D \times R$ équations de mise à jour, où l’équation $(\bar{d r})$ générique du système

$\begin{array}{l} g_{(\bar{d r})} ({}^{(α τ)}V A A_{3}) & ≅ & \sum_{k \in U} (2 \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ} - \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ^{2}}) \\ \times & {{[\sum_{(d r)} {}^{(α τ v *)}ϕ_{(d r)} {[\frac{{}^{(α τ v *)}V_{(d r)}}{{\overset{⃛}{V}}_{(d r)} + {}^{(α τ)}V {AA}_{3 (d r)}}]}^{2} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{\bar{c}}]}^{- 1 / 2} - 1}, (A 2.4) \end{array}$

s’obtient en insérant l’expression (A2.2) dans (A2.1). Si l’on obtient la convergence, alors dans la dernière itération, ${}^{(α τ + 1)}V A A_{3} ≅ {}^{(α τ)}V A A_{3} .$ La fonction de l’équation (A2.4) est continue et dérivable. En outre, elle s’applique sur l’intervalle des valeurs possibles de ${VAA}_{3 (d r)} .$ Alors, la BI converge si la condition qui suit est satisfaite :

$‖ J_{g} (V A A_{3}) ‖ \leq 1. (A 2.5)$

La matrice jacobienne est semi-définie positive, et un résultat bien connu énonce que $trace (J_{g} {J^{'}}_{g}) \leq trace {(J_{g})}^{2} .$ En considérant la norme de Frobenius ${‖ J_{g} ‖}_{F} = \sqrt{trace (J_{g} {J^{'}}_{g})},$ elle devient ${‖ J_{g} ‖}_{F} \leq trace (J_{g}) .$ Donc, nous pouvons tenir compte de la trace de la matrice jacobienne pour vérifier la condition (A2.5). Soit ${g^{'}}_{(\bar{d r})} = \partial g_{(\bar{d r})} ({}^{(α τ - 1)}V A A_{3 (d r)} / \partial {}^{(α τ - 1)}V {AA}_{3 (\bar{d r})})$ l’élément $(\bar{d r})$ de la diagonale de $J_{g} (V A A_{3}) .$ En utilisant la condition de Kuhn-Tucker ${}^{(α τ v *)}V_{(d r)} / ({\overset{⃛}{V}}_{(d r)} + {}^{(α τ)}A V_{3 (d r)}) = 1,$

$\begin{array}{l} {g^{'}}_{(\bar{d r})} & = & \sum_{k \in U} (2 \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ} - \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ^{2}}) {[\sum_{(d r)} {}^{(α τ v *)}ϕ_{(d r)} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{\bar{c}}]}^{- 3 / 2} \\ \times & {}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{1}{{}^{(α τ v *)}V_{(\bar{d r})}} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}} . \end{array}$

Puisque dans de nombreux cas, ${}^{(α τ v *)}ϕ_{(\bar{d r})} = 0$ (Chromy 1987), l’élément ${g^{'}}_{(\bar{d r})}$ respectif est nul. Quand ${}^{(α τ v *)}ϕ_{(\bar{d r})} > 0,$ alors

$\begin{array}{l} {g^{'}}_{(\bar{d r})} & \leq & \sum_{k \in U} (2 \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ} - \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ^{2}}) {[{}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}}]}^{- 3 / 2} \times {}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{1}{{}^{(α τ v *)}V_{(\bar{d r})}} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}} \\ = & \sum_{k \in U} (2 \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ} - \frac{{\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ^{2}}) \frac{1}{\sqrt{{}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}}} {}^{(α τ v *)}V_{(\bar{d r})}} \\ \leq & \sum_{k \in U} \frac{\frac{{\tilde{y}}_{\bar{r} k} γ_{\bar{d} k}}{{}^{(α τ + 1)}Δ} (2 - \frac{1}{{}^{(α τ + 1)}Δ})}{\sqrt{\bar{c} {}^{(α τ v *)}ϕ_{(\bar{d r})} γ_{\bar{d} k}} {}^{(α τ v *)}V_{(\bar{d r})}} < < 1. \end{array}$

Par conséquent, la $trace (J_{g})$ doit être inférieure à 1.

Preuve de la convergence de la boucle externe. Soit ${}^{(α τ + 1)}π$ la solution du problème de point fixe de la BI; alors, la BE met à jour le vecteur ${}^{(α)}π$ avec ${}^{(α + 1)}π = {}^{(α τ + 1)}π .$ Sous les conditions (1), (2) et (3),

${}^{(α + 1)}V {AA}_{3 (d r)} = \sum_{k \in U} (\frac{1}{{}^{(α τ + 1)}π_{k}} - 1) {\tilde{y}}_{r k}^{2} γ_{d k} . (A 2.6)$

En insérant l’expression (A2.2) dans la formule (A2.6) quand la BI converge, le système de $D \times R$ équations de mise à jour de ${}^{(α + 1)}V A A_{3}$ est donné par ${}^{(α + 1)}V A A_{3} = j ({}^{(α τ)}V A A_{3}),$ où l’équation générique de $j$ est

$\begin{array}{l} {}^{(α + 1)}V {AA}_{3 (d r)} & = & j_{(\bar{d r})} ({}^{(α τ)}V A A_{3}) \\ = & \sum_{k \in U} {\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k} ({[\sum_{(d r)} {}^{(α τ v *)}ϕ_{(d r)} {[\frac{{}^{(α τ v *)}V_{(d r)}}{{\overset{⃛}{V}}_{(\bar{d} r)} + {}^{(α τ)}V {AA}_{3 (\bar{d} r)}}]}^{2} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{\bar{c}}]}^{- 1 / 2} - 1) . (A 2.7) \end{array}$

En notant que ${}^{(α)}V A A_{3} = {}^{(α τ = 0)}V A A_{3},$ le système j peut être exprimé sous une forme récursive

${}^{(α + 1)}V A A_{3} ≅ j (g ({}^{(α τ - 1)}V A A_{3})) = j (g (g (..... g ({}^{(α τ = 0)}V A A_{3})))) = f ({}^{(α)}V A A_{3}),$

avec $f (\cdot) = j (g (g (..... g (\cdot))))$ en tant que système de $D \times R$ équations de mise à jour de ${}^{(α + 1)}V {AA}_{3},$ par rapport aux valeurs antérieures de la BE, ${}^{(α)}V A A_{3} .$ Pour démontrer la convergence de la BE, il est nécessaire de démontrer que la norme jacobienne $‖ J_{f} (V A A_{3}) ‖$ est inférieure à 1. En utilisant les résultats classiques de l’algèbre matricielle,

$‖ J_{f} (V A A_{3}) ‖ \leq ‖ J_{j} ({}^{(α τ)}V A A_{3}) ‖ \times ‖ J_{g} ({}^{(α τ - 1)}V A A_{3}) ‖ \times \dots \times ‖ J_{g} ({}^{(α τ = 0)}V A A_{3}) ‖,$

où la norme générique $‖ J_{g} (\cdot) ‖$ est inférieure à 1 (voir la preuve de convergence de la BI). Soit ${j^{'}}_{(\bar{d r})}$ l’élément $(\bar{d r})$ de la diagonale de $J_{j} ({}^{(α τ)}V A A_{3}) .$ Il est donné par

$\begin{array}{l} {j^{'}}_{(\bar{d r})} & = & \sum_{k \in U} {\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k} {[\sum_{(d r)} {}^{(α τ v *)}ϕ_{(d r)} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{\bar{c}}]}^{- 3 / 2} \\ \times & {}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{1}{{}^{(α τ v *)}V_{(\bar{d r})}} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}} . (A 2.8) \end{array}$

Par conséquent, nous avons

$\begin{array}{l} {j^{'}}_{(\bar{d r})} & \leq & \sum_{k \in U} {\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k} {[{}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}}]}^{- 3 / 2} {}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{1}{{}^{(α τ v *)}V_{(\bar{d r})}} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}} \\ = & \frac{1}{{}^{(α τ v *)}V_{(\bar{d r})}} \sum_{k \in U} {\tilde{y}}_{\bar{r} k}^{2} γ_{\bar{d} k} {[{}^{(α τ v *)}ϕ_{(\bar{d r})} \frac{({\tilde{y}}_{\bar{r} k}^{2} + σ_{\bar{r} k}^{2}) γ_{\bar{d} k}}{\bar{c}}]}^{- 1 / 2} . \end{array}$

L’inégalité qui suit est vérifiée

${j^{'}}_{(\bar{d r})} < \frac{\sum_{k \in U} {\tilde{y}}_{\bar{r} k} γ_{\bar{d} k}}{\sqrt{\bar{c} {}^{(α τ v *)}ϕ_{(\bar{d r})}} {}^{(α τ v *)}V_{(\bar{d r})}} < < 1.$

Donc, la norme $‖ J_{j} ({}^{(α τ)}V A A_{3}) ‖ < 1,$ et par conséquent la BE converge.

Annexe A3

Preuve que l’approximation de la remarque 4.1 est à la hausse

Puisque ${\hat{u}}_{(d r) k}$ est la prédiction par les moindres carrés pondérés de $u_{r k} γ_{d k},$ en utilisant une valeur différente de ${\hat{u}}_{(d r) k},$ telle que ${\hat{u}}_{(d r) k} = 0,$ nous obtenons

$\sum_{k \in U} (1 / π_{k} - 1) E_{M} [{(u_{r k} γ_{d k} - {\hat{u}}_{(d r) k})}^{2}] \leq \sum_{k \in U} (1 / π_{k} - 1) E_{M} [{(u_{r k} γ_{d k} - 0)}^{2}],$

où $E_{M} [{(u_{r k} γ_{d k} - 0)}^{2}] = σ_{r k}^{2} γ_{d k} .$ En remplaçant les termes $E_{M} [{(u_{r k} γ_{d k} - {\hat{u}}_{(d r) k})}^{2}]$ par $σ_{r k}^{2} γ_{d k}$ dans l’expression (A1.5), la VAA (4.3) est surestimée. L’approximation ${\hat{u}}_{(d r) k} = 0$ implique que $b_{(d r) k} (π) = c_{(d r) k} (π) = 0.$ Enfin, nous soulignons que, dans la plupart des cas, la hausse est légère, puisque les ${\hat{u}}_{(d r) k}$ sont obtenus au moyen des variables $z_{k}$ qui ont généralement un pouvoir prédictif très faible pour les valeurs de $u_{r k} γ_{d k}$ (voir la section 4). Dans ces situations, ${\hat{u}}_{(d r) k} ≅ (1 / N) \sum_{k \in U} u_{r k} γ_{d k} ≅ 0 .$ Donc $E_{M} (u_{r k} γ_{d k} {\hat{u}}_{(d r) k}) ≅ 0$ et $E_{M} {({\hat{u}}_{(d r) k})}^{2} ≅ 0.$

Annexe A4

Preuve de l’expression (4.7)

Dans ce cas, chaque vecteur $δ_{k}$ contient $H - 1$ éléments nuls et 1 élément égal à 1 (correspondant à la population planifiée à laquelle l’unité $k$ appartient). Étant donné les valeurs d’entrée, la procédure d’optimisation $π_{k} = π_{h}$ pour $k \in U_{h} .$ Sous l’hypothèse susmentionnée, ${[A (π)]}^{- 1}$ est une matrice diagonale dont le $h h^{e}$ élément est donné par ${[A_{h h} (π)]}^{- 1} = {[N_{h} π_{h}^{2} (1 / π_{h} - 1)]}^{- 1} .$ En considérant que ${\tilde{y}}_{r k} = {\bar{Y}}_{r h},$ les expressions (A1.2) et (A1.3) peuvent être reformulées, respectivement, sous la forme

${\hat{\tilde{y}}}_{(d r) k} = π_{h} {δ^{'}}_{k} {[A (π)]}^{- 1} N_{h} π_{h} (1 / π_{h} - 1) {\bar{Y}}_{r h} = {\bar{Y}}_{r h} . (A 4.1)$

${\hat{u}}_{(d r) k} = π_{h} {δ^{'}}_{k} {[A (π)]}^{- 1} π_{h} (1 / π_{h} - 1) \sum_{j \in U} u_{r j} = {(π_{h} N_{h})}^{- 1} \sum_{j \in U_{h}} u_{r j}, (A 4.2)$

mais $\sum_{j \in U_{h}} u_{r j} = 0$ en tant que somme des résidus d’un modèle de régression.

En utilisant les formules (A4.1) et (A4.2), l’expression (4.5) est donnée par

$\begin{array}{l} VAA ({\hat{t}}_{(d r)}) & = & [N / (N - H)] \sum_{h} (\frac{1}{π_{h}} - 1) \sum_{k \in U_{h}} E_{M} {(u_{r k} γ_{d k})}^{2} \\ = & [N / (N - H)] \sum_{d = 1}^{D} \sum_{h \in H_{d}} σ_{r h}^{2} N_{h} (N_{h} / n_{h} - 1), \end{array}$

puisque que $π_{h} = n_{h} / N_{h},$ et l’expression (4.7) peut être obtenue.

Bibliographie

Bethel, J. (1989). Répartition de l’échantillon dans les enquêtes à plusieurs variables. Techniques d’enquête, 15, 1, 49-60.

Boyd, S., et Vanderberg, L. (2004). Convex Optimization. Cambridge University Press.

Breidt, F.J., et Chauvet, G. (2011). Improved variance estimation for balanced samples drawn via the cube method. Journal of Statistical Planning and Inference, 141, 479-487.

Chauvet, G., Bonnéry, D. et Deville, J.-C. (2011). Optimal inclusion probabilities for balanced sampling. Journal of Statistical Planning and Inference, 141, 984-994.

Choudhry, G.H., Rao, J.N.K. et Hidiroglou, M.A. (2012). À propos de la répartition de l’échantillon pour une estimation sur domaine efficace. Techniques d’enquête, 18, 1, 25-32.

Chromy, J. (1987). Design optimization with multiple objectives. Proceedings of the Survey Research Methods Section, American Statistical Association, 194-199.

Cochran, W.G. (1977). Sampling Techniques. New York : John Wiley & Sons, Inc.

Deville, J.-C., et Tillé, Y. (2004). Efficient balanced sampling: The cube method. Biometrika, 91, 893-912.

Deville, J.-C., et Tillé, Y. (2005). Variance approximation under balanced sampling, Journal of Statistical Planning and Inference, 128, 569-591.

Dykstra R. et Wollan P. (1987). Finding I-projections subject to a finite set of linear inequality constraints, Applied Statistics, 36, 377-383.

Ernst, L.R. (1989). Further applications of linear programming to sampling problems. Proceedings of the Survey Research Methods Section, American Statistical Association, 625-631.

Falorsi, P.D., et Righi, P. (2008). Une approche d’échantillonnage équilibré pour des plans de sondage à stratification multidimensionnelle pour l’estimation pour petits domaines. Techniques d’enquête, 34, 2, 247-259.

Falorsi, P.D., Orsini, D. et Righi, P. (2006). Balanced and coordinated sampling designs for small domain estimation. Statistics in Transition, 7, 1173-1198.

Gonzalez, J.M., et Eltinge, J.L. (2010). Optimal survey design: A review. Section on Survey Research Methods – JSM 2010, Octobre.

Isaki, C.T., et Fuller, W.A. (1982). Survey design under a regression superpopulation model. Journal of the American Statistical Association, 77, 89-96.

Khan, M.G.M., Mati, T. et Ahsan, M.J. (2010). An optimal multivariate stratified sampling design using auxiliary information: An integer solution using goal programming approach. Journal of Official Statistics, 26, 695-708.

Kokan, A., et Khan, S. (1967). Optimum allocation in multivariate surveys: An analytical solution. Journal of the Royal Statistical Society, Series B, 29, 115-125.

Lu, W., et Sitter, R.R. (2002). Méthode pratique de stratification multiple par programmation linéaire. Techniques d’enquête, 28, 2, 215-224.

Nedyalkova, D., et Tillé, Y. (2008). Optimal sampling and estimation strategies under the linear model. Biometrika, 95, 521-537.

Tillé, Y. (2006). Sampling Algorithms. Springer-Verlag, New York.

Tillé, Y., et Favre, A.-C. (2005). Optimal allocation in balanced sampling. Statistics and Probability Letters, 74, 31-37.

Winkler, W.E. (2001). Multi-way survey stratification and sampling. Research Report Series, Statistics #2001-01. Statistical Research Division U.S. Bureau of the Census Washington D.C. 20233.

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête