Recherche par

5. Détermination des probabilités d’inclusion optimales

Piero Demetrio Falorsi et Paolo Righi

Le vecteur des valeurs de $π$ est déterminé en résolvant le problème d’optimisation suivant :

${\begin{array}{l} Min (\sum_{k \in U} π_{k} c_{k}) \\ VAA ({\hat{t}}_{(d r)}) \leq {\bar{V}}_{(d r)} & (d = 1, \dots, D; r = 1, \dots, R) \\ 0 < π_{k} \leq 1 & (k = 1, \dots, N) \end{array}, (5.1)$

où $c_{k}$ est le coût de la collecte de l’information auprès de l’unité $k$ et ${\bar{V}}_{(d r)}$ est un seuil de variance fixe correspondant à ${\hat{t}}_{(d r)} .$ Le système (5.1) minimise le coût prévu en s’assurant que les variances anticipées soient bornées et que les probabilités d’inclusion soient comprises entre 0 et 1. Si toutes les valeurs de $c_{k}$ sont des constantes égales à 1, le problème (5.1) minimise la taille d’échantillon. Nous notons que, dans le problème (5.1), les variances $σ_{r k}^{2}$ figurant dans $VAA ({\hat{t}}_{(d r)})$ sont traitées comme étant connues; en pratique, elles doivent être estimées. À la section 6, nous procédons à une évaluation empirique afin d’étudier la sensibilité de la taille d’échantillon globale en utilisant différentes valeurs estimées de $σ_{r k}^{2} .$

Pour résoudre (5.1), nous réarrangeons les contraintes d’inégalité afin d’obtenir

$\sum_{k \in U} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{π_{k}} \leq \frac{N - H}{N} {\bar{V}}_{(d r)} + \sum_{k \in U} ({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k} + {VAA}_{3 (d r)} . (5.2)$

En fixant de manière appropriée les valeurs de ${VAA}_{3 (d r)},$ le problème d’optimisation devient un problème linéaire convexe séparé (PLCS) classique (Boyd et Vandenberghe 2004). La figure 5.1 illustre le diagramme de cheminement de l’algorithme (un logiciel prototype dans lequel est mis en œuvre l’algorithme est disponible à l’adresse http://www.istat.it/it/strumenti/metodi-e-software/software), qui est structuré en deux boucles emboîtées : la boucle externe (BE) et la boucle interne (BI). Les deux boucles sont mises à jour en suivant un schéma d’algorithme du point fixe. La convergence sous certaines approximations est démontrée à l’annexe A2.

Figure 5.1 Diagramme de cheminement de l’algorithme

Figure 5.1 Diagramme de cheminement de l’algorithme

Description de la figure 5.1

Initialisation. À l’itération $α = 0$ de la BE, fixer ${}^{(α = 0)}π = {{}^{(α = 0)}π_{k} = \bar{π}; k = 1, \dots, N}$ avec $0 < \bar{π} \leq 1.$ Un choix raisonnable est $\bar{π} = 0, 5.$ À l’itération $τ = 0$ de la boucle interne, fixer ${}^{(α τ = 0)}π = {}^{(α)}π .$ Fixer le vecteur de dimension $N, ε,$ de faibles valeurs positives.

Boucle externe

Fixation des valeurs pour la boucle interne. Conformément aux expressions (A1.4), (A1.7) et (A1.8) données à l’annexe A1, les valeurs scalaires réelles suivantes sont calculées
$a_{(d r) k} ({}^{(α)}π) = {δ^{'}}_{k} {[A ({}^{(α)}π)]}^{- 1} \sum_{j \in U} δ_{j} {\tilde{y}}_{r j} γ_{d j} (1 - {}^{(α)}π_{j}), (5.3)$

$b_{(d r) k} ({}^{(α)}π) = {δ^{'}}_{k} {[A ({}^{(α)}π)]}^{- 1} δ_{k} σ_{r k}^{2} γ_{d k} (1 - {}^{(α)}π_{k}), (5.4)$

$c_{(d r) k} ({}^{(α)}π) = π_{k}^{2} {δ^{'}}_{k} {[A ({}^{(α)}π)]}^{- 1} [\sum_{j \in U} δ_{j} {δ^{'}}_{j} σ_{r j}^{2} γ_{d j} {(1 - {}^{(α)}π_{j})}^{2}] {[A ({}^{(α)}π)]}^{- 1} δ_{k} . (5.5)$
Lancement de la boucle interne. La boucle interne est exécutée jusqu’à la convergence.
Mise à jour ou sortie. Si le vecteur ${}^{(α + 1)}π$ est tel que $| {}^{(α + 1)}π - {}^{(α)}π | > ε,$ alors la boucle externe est itérée en mettant à jour le vecteur ${}^{(α)}π$ avec ${}^{(α + 1)}π .$ Si $| {}^{(α + 1)}π - {}^{(α)}π | \leq ε,$ alors la bouche externe se ferme et ${}^{(α)}π$ représente la solution donnant les valeurs optimales du problème donné par le système (5.1).

Boucle interne

Fixation des valeurs pour le PLCS. Les valeurs suivantes sont calculées :

$\begin{array}{l} {}^{(α τ)}V {AA}_{3 (d r)} & = & {\sum_{k \in U} (1 - {}^{(α τ)}π_{k}) a}_{(d r) k} ({}^{(α)}π) [2 {\tilde{y}}_{r k} γ_{d k} - {}^{(α τ)}π_{k} a_{(d r) k} ({}^{(α)}π)] \\ + & \sum_{k \in U} (1 - {}^{(α τ)}π_{k}) [2 b_{(d r) k} ({}^{(α)}π) - {}^{(α τ)}π_{k} c_{(d r) k} ({}^{(α)}π)] . \end{array} (5.6)$

conformément à l’expression (A1.7) à l’annexe A1.
Résolution du PLCS. En considérant que les valeurs de ${}^{(a τ)}V {AA}_{3 (d r)}$ sont fixes, ${}^{(α τ + 1)}π$ s’obtient en résolvant, au moyen d’un algorithme standard pour un PLCS classique, le problème d’optimisation suivant :

${\begin{array}{l} Min (\sum_{k \in U} {}^{(α τ + 1)}π_{k} c_{k}) \\ \sum_{k \in U} \frac{({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k}}{{}^{(α τ + 1)}π_{k}} \leq \frac{N - H}{N} {\bar{V}}_{(d r)} + \sum_{k \in U} ({\tilde{y}}_{r k}^{2} + σ_{r k}^{2}) γ_{d k} + {}^{(α τ)}V {AA}_{3 (d r)} \\ 0 < {}^{(α τ + 1)}π_{k} \leq 1 (k = 1, \dots, N) \end{array} . (5.7)$
Mise à jour ou sortie. Si le vecteur ${}^{(α τ + 1)}π$ est tel que $| {}^{(α τ + 1)}π - {}^{(α τ)}π | > ε,$ alors la boucle interne est itérée en mettant à jour le vecteur ${}^{(α τ)}π$ avec ${}^{(α τ + 1)}π .$ Si $| {}^{(α τ + 1)}π - {}^{(α τ)}π | \leq ε,$ alors la boucle interne se ferme et le vecteur mis à jour ${}^{(α + 1)}π$ pour la boucle externe est donnée par ${}^{(α τ + 1)}π .$

Remarque 5.1. Le problème du système (5.7) peut être résolu par l’algorithme proposé dans Falorsi et Righi (2008, section 3.1) qui représente une légère modification de l’algorithme de Chromy (1987), élaboré au départ pour la répartition optimale multivariée sous des plans EASSRS et mis en œuvre dans des outils logiciels standard (voir par exemple le logiciel Mauss-R disponible à l’adresse : http://www3.istat.it/strumenti/metodi/software/campione/mauss_r/). Ou bien, le PLCS peut être traité en se servant de la procédure NLP de SAS comme l’ont proposé Choudhry et coll. (2012).

Remarque 5.2. L’algorithme fait la distinction entre le vecteur ${}^{(α)}π_{k}$ (mis à jour dans la boucle externe) et le vecteur ${}^{(α τ)}π_{k}$ (mis à jour dans la boucle interne). L’innovation de l’algorithme proposé tient précisément à cette particularité. Si cette distinction entre les probabilités d’inclusion n’est pas faite, c’est-à-dire si ${}^{(α τ)}π = {}^{(α)}π,$ nous avons observé dans plusieurs expériences que les solutions itérées du PLCS pour chaque boucle externe ne convergent pas vers un point stationnaire.

Remarque 5.3. Après la phase d’optimisation, dans laquelle le vecteur $π$ est défini comme étant la solution du problème du système (5.1), une phase de calage est exécutée (Falorsi et Righi 2008) afin d’obtenir les probabilités d’inclusion calées, ${}_{cal}π_{k},$ qui modifient marginalement le vecteur $π$ optimal afin de satisfaire $\sum_{k \in U} {}_{cal}π_{k} δ_{k} = n,$ où $n$ est un vecteur de nombres entiers. L’utilisation de l’algorithme d’ajustement proportionnel itératif généralisé (Dykstra et Wollan 1987) permet de s’assurer que toutes les probabilités d’inclusion calées sont comprises dans l’intervalle $(0, 1] .$

Précédent | Suivant

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

5. Détermination des probabilités d’inclusion optimales

Boucle externe

Boucle interne