Estimation de la variance par le bootstrap avec remise pour les enquêtes auprès des ménages Principes, exemples et mise en œuvre
Section 3. Estimation de la variance bootstrap

Table des matières

Nous commençons à la section 3.1 par la description de l’étape élémentaire de la méthode bootstrap quand on sélectionne seulement un échantillon de ménages. Nous l’illustrons dans la section 3.2 sur l’exemple présenté à la section 2.1.4. La méthode bootstrap en cas d’échantillonnage de personnes à l’intérieur des ménages est décrite à la section 3.3, et elle est illustrée à la section 3.4. Dans la section 3.5, nous expliquons comment l’étape élémentaire de la méthode bootstrap proposée sert à effectuer l’estimation de la variance et produire des intervalles de confiance.

3.1 Étape élémentaire du bootstrap pour les ménages

Au moyen du bootstrap avec remise, nous tirons d’abord à l’intérieur de l’échantillon initial $S_{h h}^{h}$ sélectionné dans la strate $U_{h h}^{h}$ un rééchantillon avec remise $S_{h h *}^{h}$ de $n_{h} - 1$ ménages, avec probabilités égales. Notons que le rééchantillonnage est effectué sur l’unité d’échantillonnage (un ménage) plutôt que sur l’unité finale d’observation (une personne), ce qui est essentiel pour saisir correctement la variance due à l’échantillonnage. En particulier, cette méthode bootstrap permet de saisir la variance due à l’échantillonnage du second degré (sélection des personnes) sans rééchantillonner les unités finales dans le processus de bootstrap. Pour tout $k \in S_{h h}^{h},$ nous définissons le facteur d’ajustement de repondération

$G_{k} = \frac{n_{h}}{n_{h} - 1} \times m_{k}, (3.1)$

avec $m_{k}$ le nombre de fois que le ménage $k$ est sélectionné dans le rééchantillon $S_{h h *}^{h},$ également appelé la multiplicité. Il faut noter qu’une unité $k \in S_{h h}^{h}$ peut ne pas apparaître dans le rééchantillon, auquel cas cette unité a une multiplicité nulle; un exemple est donné à la section 3.2. Les facteurs d’ajustement de la repondération $G_{k}$ sont utilisés pour obtenir les poids bootstrap qui tiennent compte du plan d’échantillonnage, de la non-réponse totale et du calage, comme le décrit l’algorithme 1. Les étapes font référence à la figure 2.1. Le rééchantillonnage présenté dans l’algorithme 1 est ensuite répété $B$ fois indépendamment pour l’estimation de la variance ou pour produire un intervalle de confiance, voir l’algorithme 3 à la section 3.5.

Algorithme 1. Calcul des poids bootstrap des ménages tenant compte de la non-réponse et du calage

Étape 1 : nous tenons compte de l’échantillonnage des ménages en calculant, pour tout $k \in S_{h h},$ le poids d’échantillonnage bootstrap
$d_{k *} = G_{k} d_{k} . (3.2)$
La version bootstrap de l’estimateur en présence de réponse complète donnée dans (2.3) est
${\hat{Y}}_{h h *} = \sum_{k \in S_{h h}} d_{k *} y_{k} . (3.3)$
Étape 2 : nous tenons compte de la non-réponse totale des ménages en calculant les probabilités estimées bootstrap à l’intérieur des GRH.
${\hat{p}}_{c *} = \frac{\sum_{k \in S_{c, h h}} G_{k} θ_{k} r_{k}}{\sum_{k \in S_{c, h h}} G_{k} θ_{k}}, (3.4)$
et nous calculons les poids bootstrap corrigés pour tenir compte de la non-réponse
$d_{r k *} = \frac{d_{k *}}{{\hat{p}}_{c (k) *}}, (3.5)$
avec $c (k)$ le GRH contenant le ménage $k .$ La version bootstrap de l’estimateur corrigé pour tenir compte de la non-réponse totale donnée dans (2.7) est
${\hat{Y}}_{r, h h *} = \sum_{k \in S_{r, h h}} d_{r k *} y_{k} . (3.6)$
Étape 3 : nous tenons compte du calage en calant les poids $d_{r k *}$ sur les totaux $X_{h h} .$ Cela donne les poids bootstrap calés
$w_{k *} = d_{r k *} (1 + x_{k}^{Τ} λ_{h h *}), (3.7)$
avec
$λ_{h h *} = {(\sum_{k \in S_{r, h h}} d_{r k *} x_{k} x_{k}^{Τ})}^{- 1} (X_{h h} - {\hat{X}}_{r, h h *})$
et
${\hat{X}}_{r, h h *} = \sum_{k \in S_{r, h h}} d_{r k *} x_{k} .$
La version bootstrap de l’estimateur calé donnée dans (2.10) est
${\hat{Y}}_{cal, h h *} = \sum_{k \in S_{r, h h}} w_{k *} y_{k} . (3.8)$

Le traitement de la non-réponse totale dans le processus bootstrap mérite quelques explications. Premièrement, notre approche est conditionnelle aux indicateurs de réponse $r_{k} .$ Contrairement aux indicateurs d’appartenance de l’échantillon qui sont traités par bootstrap à l’étape 1 de l’algorithme 1, les indicateurs de réponse demeurent fixes dans le processus bootstrap. Cela est dû au fait que nous cherchons à reproduire un estimateur de la variance qui considère l’échantillon $S_{h h}$ comme étant sélectionné avec remise, et que dans ce cas, il n’est pas nécessaire d’appliquer la technique bootstrap aux $r_{k} .$ Deuxièmement, la prise en compte de la non-réponse à l’étape 2 de l’algorithme 1 est réalisée conditionnellement sur les GRH : nous n’appliquons pas de bootstrap au processus menant à la construction des GRH (sur le sujet, voir par exemple Girard, 2009; Haziza et Beaumont, 2017). Enfin, le bootstrap des probabilités de réponse tel qu’il est décrit dans l’équation (3.4) tient compte de l’estimation des probabilités de réponse $p_{c} .$ En d’autres termes, nous utilisons dans chaque rééchantillonnage les mêmes GRH que ceux déterminés à partir de l’échantillon, mais les ajustements pour tenir compte de la non-réponse dans les GRH sont basés sur le contenu du rééchantillonnage. Cela est illustré dans l’exemple présenté à la section 3.2. Si nous n’appliquons pas de bootstrap aux probabilités de réponse et que nous insérons directement dans l’équation (3.5) les probabilités estimées à l’origine ${\hat{p}}_{c},$ alors les probabilités de réponse sont traitées comme si elles étaient connues, ce qui entraîne habituellement une surestimation de la variance (Beaumont, 2005; Kim et Kim, 2007).

Discutons maintenant de l’estimation de la variance bootstrap pour les estimateurs calés, comme cela est fait à l’étape 3 de l’algorithme 1 où l’étape de calage est réalisée sur le total réel de la population $X_{h h} .$ Si l’on suit le principe bootstrap selon lequel l’échantillon $S_{h h}$ est à l’échantillon bootstrap $S_{h h *}$ ce que la population $U_{h h}$ est à l’échantillon $S_{h h},$ il pourrait sembler plus intuitif de caler plutôt les totaux estimés ${\hat{X}}_{h h}$ obtenus en insérant $x_{k}$ dans l’équation (2.3). Les deux démarches semblent valides pour ce qui est de l’estimation de la variance bootstrap pour l’estimateur calé ${\hat{Y}}_{cal, h h},$ mais les variables de calage $x_{k}$ peuvent être sujettes à la non-réponse sur l’échantillon $S_{h h},$ ce qui rend l’estimateur ${\hat{X}}_{h h}$ impossible à calculer, alors que le total $X_{h h}$ est connu à partir d’une source extérieure.

3.2 Exemple de calcul des poids bootstrap des ménages

Nous poursuivons avec l’exemple présenté à la section 2.1.4. On réalise le bootstrap en sélectionnant d’abord un rééchantillon de $n_{h h} - 1 = 9$ ménages, avec remise et probabilités égales, parmi les ménages initialement échantillonnés. Dans cet exemple, nous supposons que le ménage $A$ est sélectionné trois fois, que le ménage $G$ est sélectionné deux fois et que les ménages $D,$ $E,$ $H$ et $I$ sont sélectionnés une fois. Au moyen de l’équation (3.2), on obtient les poids d’échantillonnage bootstrap

$d_{A *} = \frac{40}{3} d_{D *} = \frac{40}{9} d_{E *} = d_{H *} = d_{I *} = \frac{160}{9} d_{G *} = \frac{320}{9} . (3.9)$

Les poids d’échantillonnage bootstrap sont corrigés pour tenir compte de la non-réponse de la même façon que dans la correction initiale de la non-réponse, au moyen des mêmes GRH et des probabilités estimées pondérées. Dans ce cas, le premier GRH contient uniquement l’unité $A$ qui est un répondant, de sorte que ${\hat{p}}_{1 *} = 1.$ Le second GRH contient $D,$ $E,$ $G$ (non-répondant), $H$ et $I .$ Cela donne

${\hat{p}}_{2 *} = \frac{d_{D *} + d_{E *} + d_{H *} + d_{I *}}{d_{D *} + d_{E *} + d_{G *} + d_{H *} + d_{I *}} = \frac{13}{21}, (3.10)$

et les poids bootstrap corrigés pour tenir compte de la non-réponse

$d_{r A *} = \frac{40}{3} d_{r D *} = \frac{280}{39} d_{r E *} = d_{r H *} = d_{r I *} = \frac{1 120}{39} . (3.11)$

Enfin, les poids sont calés pour qu’ils soient appariés à la taille de la population $N_{h h} = 100$ et au total auxiliaire $X_{1, h h} = 60.$ Cela donne les poids bootstrap calés

$w_{A *} = 11, 30 w_{D *} = 8, 00 w_{E *} = w_{H *} = 24, 35 w_{I *} = 32, 00. (3.12)$

Le calcul des poids bootstrap est résumé à la figure 3.1.

Figure 3.1 Calcul des poids bootstrap des ménages.

Description de la figure 3.1

Figure résumant la section 3.2, soit calcul des poids bootstrap des ménages avec un exemple. La figure illustre à l’aide d’un exemple les étapes expliquées à la section 3.1. Dans cet exemple, nous poursuivons avec l’exemple présenté à la section 2.1.4. On réalise le bootstrap en sélectionnant d’abord un rééchantillon de 9 ménages, avec remise et probabilités égales, parmi les ménages initialement échantillonnés. Dans cet exemple, nous supposons que le ménage A est sélectionné trois fois, que le ménage G (non-répondant) est sélectionné deux fois et que les ménages D, E, H et I sont sélectionnés une fois.

3.3 Calcul des poids bootstrap pour les personnes

Le calcul des poids bootstrap tenant compte du plan d’échantillonnage, de la non-réponse des ménages et des personnes et du calage est décrit dans l’algorithme 2. Les étapes font référence à la figure 2.3. En plus des étapes de bootstrap de l’algorithme 1, notons que l’algorithme 2 implique le calcul bootstrap des probabilités de réponse individuelles uniquement. Ajoutons que le sous-échantillonnage des personnes à l’intérieur des ménages n’a pas besoin d’être traité par bootstrap, comme nous l’indiquons à la section 3.1.

Algorithme 2. Calcul des poids individuels bootstrap tenant compte de la non-réponse des ménages, de la non-réponse des personnes et du calage

Exécuter les étapes 1 et 2 de l’algorithme 1. Les poids bootstrap des ménages corrigés pour tenir compte de la non-réponse sont $d_{r k}^{*},$ selon l’équation (3.5).
Étape 3b : nous tenons d’abord compte de l’échantillonnage des personnes en calculant les poids bootstrap individuels corrigés pour tenir compte de la non-réponse totale du ménage.

$d_{r l *} = d_{r k (l) *} d_{l | k (l)}$ avec $k (l)$ le ménage contenant $l . (3.13)$

Nous tenons ensuite compte de la non-réponse totale des personnes. Nous calculons les probabilités estimées bootstrap à l’intérieur des GRH.
${\hat{p}}_{d *} = \frac{\sum_{l \in S_{r d, ind}} G_{k (l)} θ_{l} r_{l}}{\sum_{l \in S_{r d, ind}} G_{k (l)} θ_{l}} . (3.14)$
Nous calculons les poids bootstrap des personnes avec correction pour tenir compte de la non-réponse du ménage ou d’une personne, à savoir :
$d_{r r l *} = \frac{d_{r l *}}{{\hat{p}}_{d (l) *}}, (3.15)$
avec $d (l)$ le GRH contenant la personne $l .$ La version bootstrap de l’estimateur corrigé pour tenir compte de la non-réponse totale donnée dans (2.27) est
${\hat{Y}}_{r r, ind *} = \sum_{l \in S_{r r, ind}} d_{r r l *} y_{l} . (3.16)$
Étape 4b : nous tenons compte du calage en calant les poids $d_{r r l *}$ sur les totaux $Z_{ind} .$ Cela donne les poids bootstrap calés
$w_{l *} = d_{r r l *} (1 + z_{l}^{Τ} λ_{ind *}), (3.17)$
avec
$λ_{ind*} = {(\sum_{k \in S_{r r, ind}} d_{r r l *} z_{l} z_{l}^{Τ})}^{- 1} (Z_{ind} - {\hat{Z}}_{r r, ind *})$
et
${\hat{Z}}_{r r, ind*} = \sum_{l \in S_{r r, ind}} d_{r r l *} z_{l} .$
La version bootstrap de l’estimateur calé donnée dans (2.29) est
${\hat{Y}}_{cal, ind *} = \sum_{l \in S_{r r, ind}} w_{l *} y_{l} . (3.18)$

3.4 Exemple de calcul des poids bootstrap des personnes

Nous poursuivons avec l’exemple présenté à la section 3.2. L’échantillon bootstrap de ménages est constitué de $A$ (trois fois), $G$ (deux fois), et $D,$ $E,$ $H$ et $I$ (une fois). En raison de la non-réponse des ménages, nous observons $A,$ $D,$ $E,$ $H$ et $I$ seulement. À partir de (2.30), on obtient l’échantillon bootstrap de personnes

$S_{r, ind *} = {i_{1}, i_{4}, i_{6}, i_{11}, i_{12}} . (3.19)$

Les poids bootstrap des ménages corrigés pour tenir compte de la non-réponse totale sont donnés dans l’équation (3.11). À partir de l’équation (3.13), les poids bootstrap des personnes ajustés pour tenir compte de la non-réponse des ménages sont

$d_{r 1 *} = 40 d_{r 4 *} = \frac{280}{39} d_{r 6 *} = \frac{2 240}{39} d_{r 11 *} = \frac{2 240}{39} d_{r 12 *} = \frac{1 120}{39} . (3.20)$

Ces poids bootstrap sont corrigés pour tenir compte de la non-réponse des personnes de la même façon que dans la correction initiale de la non-réponse individuelle, au moyen des mêmes GRH et des probabilités estimées non pondérées. Cependant, nous devons tenir compte dans ces probabilités de la multiplicité $m_{k}$ et du facteur d’ajustement de la repondération $G_{k},$ voir l’équation (3.1). Dans notre cas, le premier GRH contient les personnes $i_{1},$ $i_{6}$ et $i_{11},$ et $i_{11}$ est un non-répondant. La personne $i_{1}$ appartient au ménage $A,$ qui a été sélectionné trois fois $(m_{A} = 3)$ dans l’échantillon bootstrap. La personne $i_{6}$ appartient au ménage $E,$ et la personne $i_{11}$ appartient au ménage $H,$ qui ont tous deux été sélectionnés une fois dans l’échantillon bootstrap $(m_{E} = m_{H} = 1) .$ Le calcul est semblable pour le second GRH et donne

$\begin{array}{l} {\hat{p}}_{1 *} & = \frac{G_{A} + G_{E}}{G_{A} + G_{E} + G_{H}} = \frac{4}{5}, \\ {\hat{p}}_{2 *} & = \frac{G_{I}}{G_{D} + G_{I}} = \frac{1}{2}, (3.21) \end{array}$

et les poids bootstrap des personnes corrigés pour tenir compte de la non-réponse du ménage ou de la personne sont donnés par

$d_{r r 1 *} = 50 d_{r 6 *} = \frac{5 600}{39} d_{r 12 *} = \frac{2 240}{39} . (3.22)$

Enfin, les poids sont calés pour qu’ils permettent de reproduire exactement la taille de la population $N_{ind} = 200$ et le total auxiliaire $Z_{1, ind} = 450.$ Cela donne les poids bootstrap calés

$w_{1 *} = 66,69 w_{6 *} = 116,62 w_{12 *} = 16,69 . (3.23)$

Le calcul des poids bootstrap des personnes est résumé à la figure 3.2.

graphique 1

Description de la figure 3.2

Figure résumant la section 3.4, soit calcul des poids bootstrap des personnes dans un exemple. La figure illustre à l’aide d’un exemple les étapes expliquées à la section 3.3. Dans cet exemple, nous poursuivons avec l’exemple présenté à la section 3.2. L’échantillon bootstrap de ménages est constitué de A (trois fois), G (deux fois), et D, E, H et I (une fois). En raison de la non-réponse des ménages, nous observons A, D, E, H et I seulement. Les personnes sélectionnées sont $i_{1}, i_{4}, i_{6}, i_{11}$ et $i_{12},$ mais $i_{4}$ et $i_{11}$ sont non-répondants.

3.5 Estimation de la variance bootstrap et intervalles de confiance

Dans la présente section, nous nous intéressons aux paramètres qui peuvent être écrits comme des fonctions lisses de totaux. Nous expliquons comment l’étape élémentaire de la méthode bootstrap proposée sert à effectuer l’estimation de la variance et produire des intervalles de confiance. Par souci de concision, nous nous concentrons sur les paramètres définis sur la population de ménages $U_{h h} .$ Le traitement des paramètres d’intérêt dans la population de personnes $U_{ind}$ est semblable.

Supposons que $y_{k}$ est un vecteur de taille $q$ de variables d’intérêt, et que nous nous intéressons à un paramètre $β_{h h} = f (Y_{h h})$ utilisant une fonction connue et lisse $f : R^{q} \to R .$ En cas de réponse complète, l’estimateur par substitution de $β_{h h}$ est

${\hat{β}}_{h h} = f ({\hat{Y}}_{h h}), (3.24)$

voir, par exemple, Deville (1999). En cas de non-réponse totale au niveau du ménage, l’estimateur de $β_{h h}$ corrigé pour tenir compte de la non-réponse totale est

${\hat{β}}_{r, h h} = f ({\hat{Y}}_{r, h h}), (3.25)$

et l’estimateur calé de $β_{h h}$ est

${\hat{β}}_{cal, h h} = f ({\hat{Y}}_{cal, h h}). (3.26)$

Dans chaque cas, on obtient un estimateur de la variance bootstrap en appliquant un grand nombre de fois (disons $B)$ l’étape de base de la méthode bootstrap dans l’algorithme 1, puis en calculant la dispersion des estimateurs bootstrap. Cela est résumé dans l’algorithme 3.

Algorithme 3. Estimation de la variance bootstrap pour l’estimation de la population des ménages

Répéter $B$ fois la procédure bootstrap décrite dans l’algorithme 1. Soit ${\hat{Y}}_{h h *}^{b},$ ${\hat{Y}}_{r, h h *}^{b}$ et ${\hat{Y}}_{cal, h h *}^{b}$ les estimateurs bootstrap des totaux calculés sur le $b$ -ème échantillon. De plus, désignons par ${\hat{β}}_{h h *}^{b},$ ${\hat{β}}_{r, h h *}^{b}$ et ${\hat{β}}_{cal, h h *}^{b}$ les estimateurs bootstrap associés à $β_{h h} .$
L’estimateur de la variance bootstrap pour ${\hat{β}}_{h h}$ est
${\hat{V}}_{boot} ({\hat{β}}_{h h}) = \frac{1}{B - 1} \sum_{b =1}^{B} {{\hat{β}}_{h h *}^{b} - \frac{1}{B} \sum_{b^{'} =1}^{B} {\hat{β}}_{h h *}^{b^{'}}}^{2}, (3.27)$
et de même pour ${\hat{β}}_{r, h h}$ et ${\hat{β}}_{cal, h h} .$

L’estimateur de la variance bootstrap peut servir à calculer un intervalle de confiance reposant sur la normalité avec un niveau ciblé $1 - 2 α .$ Par exemple, l’intervalle de confiance quand on utilise l’estimateur en présence de réponse complète ${\hat{β}}_{h h}$ est

${IC}_{nor} (β_{h h}) = [{\hat{β}}_{h h} \pm u_{1 - α} {{\hat{V}}_{boot} ({\hat{β}}_{h h})}^{0,5}], (3.28)$

avec $u_{1 - α}$ le quantile d’ordre $1 - α$ de la distribution normale standard. On s’attend à ce que cet intervalle de confiance soit conservatif, puisque la méthode bootstrap proposée l’est.

Nous examinons aussi les intervalles de confiance bootstrap (aussi dits élémentaires) dites du percentile et du percentile inverse. Ils peuvent être calculés directement à partir des poids bootstrap et sont par conséquent intéressants du point de vue des utilisateurs des données, contrairement aux méthodes nécessitant une grande puissance de calcul comme le bootstrap $t$ (par exemple Davison et Hinkley, 1997; Shao et Tu, 1995). Pour ${\hat{β}}_{h h},$ l’intervalle de confiance percentile est obtenu au moyen de la distribution de ${\hat{β}}_{h h *}$ comme approximation de la distribution de ${\hat{β}}_{h h} .$ Cette méthode utilise les estimations bootstrap ordonnées ${\hat{β}}_{h h *}^{(1)}, \dots, {\hat{β}}_{h h *}^{(B)}$ pour former l’intervalle de confiance

${IC}_{per} (β_{h h}) = [{\hat{β}}_{h h *}^{(L)}, {\hat{β}}_{h h *}^{(U)}], (3.29)$

avec le niveau ciblé $1 - 2 α,$ où $L = α B$ et $U = (1 - α) B .$ On obtient l’intervalle de confiance percentile inverse en considérant la distribution de $({\hat{β}}_{h h *} - {\hat{β}}_{h h})$ comme une approximation de la distribution de $({\hat{β}}_{h h} - β_{h h}).$ Cela donne l’intervalle de confiance

${IC}_{rev} (β_{h h}) = [2 {\hat{β}}_{h h} - {\hat{β}}_{h h *}^{(U)}, 2 {\hat{β}}_{h h} - {\hat{β}}_{h h *}^{(L)}] . (3.30)$

Les propriétés de l’estimateur de la variance bootstrap et des trois intervalles de confiance sont évaluées dans l’étude par simulations effectuée à la section 4 pour l’estimation d’un total.

Le choix du nombre $B$ de rééchantillonnages constitue un problème pratique important. Girard (2009) propose d’envisager plusieurs tailles de rééchantillonnage possibles (par exemple en augmentant $B$ par un incrément de 100) et de représenter graphiquement les estimateurs de la variance bootstrap en fonction de $B .$ La valeur pour laquelle cet estimateur de la variance commence à se stabiliser est alors retenue. Il s’agit d’une méthode simple, mais qui peut nécessiter une solution de compromis si différentes variables d’intérêt donnent différentes valeurs de stabilisation. Beaumont et Patak (2012) proposent de choisir $B$ de telle sorte qu’avec une forte probabilité, la longueur de l’intervalle de confiance bootstrap donnée dans (3.28) soit proche de la longueur de l’intervalle de confiance obtenu au moyen d’un estimateur de la variance analytique. En supposant que, conditionnellement à l’échantillon initial, l’estimateur bootstrap normalisé du total est normalement distribué, ils établissent que la valeur $B$ peut être déterminée à partir de la distribution d’une variable du chi deux (Beaumont et Patak, 2012, équation 10). Il est intéressant d’observer que la valeur obtenue ne dépend pas de la variable d’intérêt. À partir de ces résultats, ils proposent d’utiliser une valeur $B$ qui ne soit pas inférieure à 750 et une valeur plus grande si l’hypothèse de normalité de l’estimateur bootstrap peut ne pas se vérifier. Nous avons utilisé $B =$ 1 000 dans l’étude par simulations présentée dans la section suivante. Pour les enquêtes devant répondre à plusieurs besoins analytiques $-$ allant de paramètres de population simples à complexes et à diverses tailles de domaine $-$ la sélection d’au moins 1 000 répliques est la norme compte tenu des ressources informatiques disponibles à l’heure actuelle.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : semi-annuel

Ottawa

Date de modification :: 2022-01-06

Sélection de la langue

Recherche et menus

Recherche

Estimation de la variance par le bootstrap avec remise pour les enquêtes auprès des ménages Principes, exemples et mise en œuvre
Section 3. Estimation de la variance bootstrap

3.1 Étape élémentaire du bootstrap pour les ménages

3.2 Exemple de calcul des poids bootstrap des ménages

3.3 Calcul des poids bootstrap pour les personnes

3.4 Exemple de calcul des poids bootstrap des personnes

3.5 Estimation de la variance bootstrap et intervalles de confiance

Estimation de la variance par le bootstrap avec remise pour les enquêtes auprès des ménages Principes, exemples et mise en œuvre Section 3. Estimation de la variance bootstrap

3.1 Étape élémentaire du bootstrap pour les ménages

3.2 Exemple de calcul des poids bootstrap des ménages

3.3 Calcul des poids bootstrap pour les personnes

3.4 Exemple de calcul des poids bootstrap des personnes

3.5 Estimation de la variance bootstrap et intervalles de confiance

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Estimation de la variance par le bootstrap avec remise pour les enquêtes auprès des ménages Principes, exemples et mise en œuvre
Section 3. Estimation de la variance bootstrap