5. Détermination des
probabilités d’inclusion optimales
Piero Demetrio Falorsi et Paolo Righi
Précédent | Suivant
Le vecteur des valeurs de
est déterminé en résolvant le problème
d’optimisation suivant :
où
est le coût de
la collecte de l’information auprès de l’unité
et
est un seuil de
variance fixe correspondant à
Le système (5.1)
minimise le coût prévu en s’assurant que les variances anticipées soient
bornées et que les probabilités d’inclusion soient comprises entre 0 et 1. Si
toutes les valeurs de
sont des
constantes égales à 1, le problème (5.1) minimise la taille d’échantillon.
Nous notons que, dans le problème (5.1), les variances
figurant dans
sont traitées
comme étant connues; en pratique, elles doivent être estimées. À la
section 6, nous procédons à une évaluation empirique afin d’étudier la
sensibilité de la taille d’échantillon globale en utilisant différentes valeurs
estimées de
Pour résoudre (5.1), nous réarrangeons
les contraintes d’inégalité afin d’obtenir
En fixant de manière appropriée les
valeurs de
le problème d’optimisation
devient un problème linéaire convexe séparé (PLCS) classique (Boyd et Vandenberghe 2004).
La figure 5.1 illustre le diagramme de cheminement de l’algorithme (un
logiciel prototype dans lequel est mis en œuvre l’algorithme est disponible à
l’adresse http://www.istat.it/it/strumenti/metodi-e-software/software), qui est
structuré en deux boucles emboîtées : la boucle externe (BE) et
la boucle interne (BI). Les
deux boucles sont mises à jour en suivant un schéma d’algorithme du point
fixe. La convergence sous certaines approximations est démontrée à
l’annexe A2.
Figure 5.1 Diagramme de cheminement de l’algorithme
Description de la figure 5.1
Initialisation. À l’itération
de la BE, fixer
avec
Un choix
raisonnable est
À l’itération
de la
boucle interne, fixer
Fixer le vecteur
de dimension
de faibles
valeurs positives.
Boucle externe
- Fixation des valeurs pour la boucle interne. Conformément
aux expressions (A1.4), (A1.7) et (A1.8) données à l’annexe A1, les
valeurs scalaires réelles suivantes sont calculées
- Lancement de la boucle interne. La boucle interne est exécutée
jusqu’à la convergence.
- Mise à jour ou sortie. Si le vecteur
est tel que
alors la boucle
externe est itérée en mettant à jour le vecteur
avec
Si
alors la bouche
externe se ferme et
représente la
solution donnant les valeurs optimales du problème donné par le système (5.1).
Boucle interne
-
Fixation des valeurs pour le PLCS. Les valeurs suivantes sont
calculées :
conformément
à l’expression (A1.7) à l’annexe A1.
Résolution du PLCS. En considérant que les valeurs de
sont fixes,
s’obtient en
résolvant, au moyen d’un algorithme standard pour un PLCS classique, le
problème d’optimisation suivant :
- Mise à
jour ou sortie. Si le vecteur
est tel que
alors la boucle interne est itérée en mettant à jour le vecteur
avec
Si
alors la boucle interne se ferme et le vecteur mis à jour
pour la boucle externe est donnée par
Remarque 5.1. Le problème du système (5.7) peut
être résolu par l’algorithme proposé dans Falorsi et Righi (2008, section 3.1)
qui représente une légère modification de l’algorithme de Chromy (1987), élaboré
au départ pour la répartition optimale multivariée sous des plans EASSRS et mis
en œuvre dans des outils logiciels standard (voir par exemple le logiciel Mauss-R
disponible à l’adresse :
http://www3.istat.it/strumenti/metodi/software/campione/mauss_r/). Ou bien, le
PLCS peut être traité en se servant de la procédure NLP de SAS comme l’ont
proposé Choudhry et coll. (2012).
Remarque 5.2. L’algorithme fait la distinction
entre le vecteur
(mis à
jour dans la boucle externe) et le vecteur
(mis à
jour dans la boucle interne). L’innovation de l’algorithme proposé tient
précisément à cette particularité. Si cette distinction entre les probabilités
d’inclusion n’est pas faite, c’est-à-dire si
nous avons
observé dans plusieurs expériences que les solutions itérées du PLCS pour
chaque boucle externe ne convergent pas vers un point stationnaire.
Remarque 5.3. Après la phase d’optimisation, dans
laquelle le vecteur
est
défini comme étant la solution du problème du système (5.1), une phase de calage est exécutée (Falorsi et
Righi 2008) afin d’obtenir les probabilités d’inclusion calées,
qui
modifient marginalement le vecteur
optimal afin de satisfaire
où
est un
vecteur de nombres entiers. L’utilisation de l’algorithme d’ajustement
proportionnel itératif généralisé (Dykstra et Wollan 1987) permet de
s’assurer que toutes les probabilités d’inclusion calées sont comprises dans
l’intervalle
Précédent | Suivant