Plans de collecte de données adaptatifs visant à minimiser les effets du mode d’enquête – étude du cas de l’Enquête sur la population active des Pays‑Bas 3. Un algorithme pour résoudre le problème d’optimisation multimodalPlans de collecte de données adaptatifs visant à minimiser les effets du mode d’enquête – étude du cas de l’Enquête sur la population active des Pays‑Bas 3. Un algorithme pour résoudre le problème d’optimisation multimodal

Dans la section qui précède, nous avons introduit les fonctions de qualité et de coût et construit un problème d’optimisation multimodal. La contrainte de la comparabilité des sous‑populations, c’est‑à‑dire la limite supérieure de la différence absolue maximale entre les effets de méthode de groupe, rend le problème non convexe et difficile à résoudre. En conséquence, lorsqu’ils essaient de résoudre le problème d’optimisation multimodal, la plupart des solveurs de programmation non linéaire à des fins générales ne peuvent pas faire mieux qu’un optimum local. Le choix des points de départ dans les solveurs joue donc un rôle important. C’est pourquoi nous proposons une approche en deux étapes. Dans la première étape, nous résolvons un problème de programmation linéaire (PL) en agissant sur les contraintes linéaires (2.1), (2.5), (2.6) et (2.9) $-$ (2.10). Dans la deuxième étape, nous utilisons la solution optimale obtenue dans la première étape comme point de départ à un algorithme de recherche local pour résoudre le problème non linéaire non convexe.

Nous reformulons le problème d’optimisation afin d’en faciliter le calcul. Étant donné que $| f (x) | = \max {f (x), - f (x)},$ nous pouvons reformuler la fonction d’objectif au moyen d’une variable additionnelle $t$ et imposer les contraintes $f (x) \leq t$ et $- f (x) \leq t .$ De toute évidence, $t$ doit être non négatif. Les contraintes mêmes ne changent pas; elles sont simplement remplacées. Le problème d’optimisation multimodal est donné en (3.2).

Nous pouvons dériver la PL en supprimant les contraintes non linéaires de la comparabilité des effets de méthodes entre les sous‑populations et en remplaçant la fonction d’objectif non linéaire par une des contraintes linéaires. Nous choisissons la minimisation des coûts comme objectif de la PL. Le problème de PL résultant est formulé comme suit :

$\begin{array}{l} \underset{p (s, g)}{minimiser} & \sum_{s, g} N_{g} p (s, g) c (s, g) \\ sous les contraintes & \sum_{s \in S^{R}} N_{g} p (s, g) ρ (s, g) \geq R_{g}, \forall g \in G \\ \sum_{s, g} N_{g} p (s, g) \leq S_{max} \\ 0 \leq p (s, g) \leq 1, \forall s \in S, g \in G \\ \sum_{s \in S} p (s, g) = 1, \forall g \in G \\ \sum_{s \in S^{R}} p (s, g) > 0, \forall g \in G . \end{array} (3.1)$

$\begin{array}{l} Minimiser & t \\ sous les contraintes & \sum_{s, g} \frac{w_{g} p (s, g) ρ (s, g) D (s, g)}{\sum_{s^{'} \in S^{R}} p (s^{'}, g) ρ (s^{'}, g)} \leq t \\ - \sum_{s, g} \frac{w_{g} p (s, g) ρ (s, g) D (s, g)}{\sum_{s^{'} \in S^{R}} p (s^{'}, g) ρ (s^{'}, g)} \leq t \\ \sum_{s, g} N_{g} p (s, g) c (s, g) \leq B \\ \sum_{s \in S^{R}} N_{g} p (s, g) ρ (s, g) \geq R_{g}, \forall g \in G \\ \frac{\sum_{s \in S^{R}} p (s, g) ρ (s, g) D (s, g)}{\sum_{s \in S^{R}} p (s, g) ρ (s, g)} - \frac{\sum_{s \in S^{R}} p (s, h) ρ (s, h) D (s, h)}{\sum_{s \in S^{R}} p (s, h) ρ (s, h)} \leq M \\ \sum_{s, g} N_{g} p (s, g) \leq S_{max} \\ 0 \leq p (s, g) \leq 1, \forall s \in S, g \in G \\ \sum_{s \in S} p (s, g) = 1, \forall g \in G \\ \sum_{s \in S^{R}} p (s, g) > 0, \forall g \in G \\ 0 \leq t . \end{array} (3.2)$

Pour résoudre le problème linéaire, nous utilisons la méthode du simplexe disponible en R dans le module $b o o t .$ Notre algorithme proposé en deux étapes traite donc (3.1) dans la première étape. $x_{LP}^{*}$ dénote la solution optimale obtenue dans la PL. Dans la deuxième étape, la solution $x_{LP}^{*}$ est soumise à un algorithme d’optimisation non linéaire comme point de départ afin de résoudre (3.2). À cette étape, nous utilisons les algorithmes non linéaires disponibles dans NLOPT (voir Johnson 2013 ), une bibliothèque de source ouverte pour l’optimisation non linéaire qui peut être appelée à partir de R dans le module $n l o p t r .$ La deuxième étape du problème non linéaire non convexe de l’algorithme est exécutée seulement si le budget minimal requis trouvé à la première étape de la PL est plus petit ou égal au budget $B$ disponible. Si le budget minimal est plus grand, il n’y a pas de solution possible au problème d’optimisation.

Étant donné que la performance de ces algorithmes dépend du problème, nous avons choisi de combiner deux algorithmes locaux de recherche afin d’accroître la vitesse de convergence. Des algorithmes d’optimisation globale sont disponibles dans la bibliothèque NLOPT, mais leur performance dans la résolution de notre problème était considérablement inférieure à celle des algorithmes d’optimisation locale sélectionnés. Les deux algorithmes de recherche locale sélectionnés sont COBYLA (Constrained Optimization by Linear Approximations), proposé par Powell (1998) (voir Roy 2007 pour une mise en œuvre en $C)$ et l’algorithme lagrangien augmenté AUGLAG, décrit dans Conn, Gould et Toint (1991) et Birgin et Martinez (2008) . La méthode COBYLA construit des approximations linéaires successives de la fonction d’objectif et des contraintes au moyen d’un simplexe de $n + 1$ points (en $n$ dimensions), et optimise ces approximations dans une région de confiance à chaque étape. La méthode AUGLAG combine la fonction d’objectif et les contraintes non linéaires en une seule fonction, c’est‑à‑dire l’objectif en plus d’une pénalité pour toute contrainte non respectée. La fonction résultante est ensuite transférée à un autre algorithme d’optimisation en tant que problème sans contrainte. Si la solution de ce sous‑problème enfreint les contraintes, les pénalités sont accrues et le processus est répété. Le processus finit par converger vers la solution souhaitée, si elle existe.

Nous avons choisi d’utiliser la méthode MMA (Method of Moving Asymptotes, introduite dans Svanberg 2002), comme optimiseur local pour la méthode AUGLAG, en raison de sa performance dans nos expériences numériques. La stratégie sous‑tendant la méthode MMA est expliquée ci‑après. À chaque point $x_{k},$ MMA forme une approximation locale à la fois convexe et séparable en utilisant le gradient de $f (x_{k})$ et les fonctions de contrainte, ainsi qu’un terme de pénalité quadratique pour rendre les approximations prudentes, par exemple des limites supérieures pour les fonctions exactes. L’optimisation de l’approximation mène à un nouveau point candidat $x_{k + 1} .$ Si les contraintes sont respectées, le processus continue à partir du nouveau point $x_{k + 1} .$ Sinon, le terme de pénalité est accru et le processus est répété.

Nous utilisons deux algorithmes de recherche locaux, parce que la méthode AUGLAG est plus efficace pour trouver le voisinage de l’optimum global, tandis que la méthode COBYLA offre une plus grande exactitude dans la recherche de l’optimum. En conséquence, la solution optimale de la PL est d’abord soumise à AUGLAG, puis, après un certain nombre d’itérations, lorsque l’amélioration de la valeur objective est inférieure à un seuil spécifié, la solution de la méthode AUGLAG est traitée par la méthode COBYLA pour une plus grande exactitude. Pour notre étude de cas, étant donné les exigences en matière de précision des statistiques obtenues dans le cadre de l’enquête (0,5 %), les résultats sont considérés comme suffisamment exacts si la valeur objective obtenue se situe à moins de $10^{- 4}$ de l’optimum global. Tout autre gain d’exactitude est complètement éliminé par la variation d’échantillonnage et l’exactitude des paramètres d’entrée mêmes. Les calculs peuvent prendre jusqu’à quelques heures. Comme il n’est pas nécessaire de résoudre le problème d’optimisation durant la collecte des données, cela ne posera pas de problèmes dans la pratique.

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N^o 12-001-X au catalogue

Périodicité : Semi-annuel

Ottawa

Date de modification :: 2017-09-20

Sélection de la langue

Recherche et menus

Recherche