Recherche par

8. Conclusions

Andrés Gutiérrez, Leonardo Trujillo et Pedro Luis do Nascimento Silva

Cet article a examiné un problème fréquent d’applications de l’échantillonnage. Au moyen des modèles en chaîne de superpopulation de Markov, une nouvelle méthodologie a été proposée, entraînant des estimateurs à peu près sans biais des flux bruts à différents moments pour le cas particulier des données provenant d’enquêtes complexes avec des poids d’échantillonnage inégaux. Les applications possibles de la méthodologie dans le présent article sont larges, notamment dans le cas des bureaux de statistique nationaux envisageant des enquêtes complexes. Les enquêtes sur la qualité de vie ou sur la population active s’intéressent habituellement à l’estimation des flux bruts. Toutefois, les extensions possibles de cette méthodologie pourraient être appliquées au secteur de la politique publique pour les évaluations d’impacts ayant une classification des répondants avant et après une intervention.

De plus, nous présentons une solution à un problème général, comme la non-réponse non ignorable. Des modèles où la non-réponse n’est pas différenciée pendant différentes périodes ou selon l’état de classification ont été envisagés. Cependant, dans certaines applications pratiques, il est possible que ce ne soit pas le cas.

L’approche de cet article considère que les poids déterminés par le plan d’échantillonnage pour les unités entre les deux périodes sont les mêmes. Dans le cadre de travaux plus poussés, on s’efforcera de considérer différents poids entre les vagues en envisageant une classification d’échantillonnage à deux phases ou une approche de calage sur marges à deux degrés. En effet, il serait intéressant de comparer le rendement de la méthodologie donné dans cet article à la méthode du calage sur marges. On pourrait considérer l’approche d’Ash (2005) et de Sikkel, Hox et de Leeuw (2008) pour calibrer en deux périodes, ainsi que l’approche de Särndal et Lundström (2005) pour traiter la non-réponse.

Des travaux plus poussés chercheront à élargir cette méthodologie pour des modèles en chaîne de Markov plus complexes afin de considérer différents poids d’échantillonnage. Une nouvelle définition des paramètres du modèle sera nécessaire. De plus, cette méthodologie pourrait être appliquée au cas des flux bruts dans plus de deux périodes lorsque les erreurs de classification sont prises en compte.

Remerciements

Les auteurs souhaitent remercier deux réviseurs anonymes de leurs commentaires constructifs au sujet d’une version précédente de l’article, qui ont donné lieu à la présente version améliorée. De plus, le premier auteur tient à remercier l’Universidad Santo Tomas de son soutien financier pendant ses études doctorales. Cet article est le fruit de la thèse de doctorat d’Andrés Gutiérrez de l’Universidad Nacional de Colombia, sous la supervision des deux autres auteurs.

Annexe

A.1 Preuves mathématiques des résultats de l’article

Dans cette section, les preuves mathématiques de certains des résultats les plus importants de l’article sont incluses.

Preuve du résultat 4.1

Preuve. En prenant le logarithme de la fonction de vraisemblance, et en le définissant comme $l$ , il s’ensuit que

$\begin{array}{l} l_{U} & = \ln (L_{U}) \\ = \sum_{i} \sum_{j} N_{i j} \ln (ψ ρ_{R R} η_{i} p_{i j}) + \sum_{i} R_{i} \ln (\sum_{j} ψ (1 - ρ_{R R}) η_{i} p_{i j}) \\ + \sum_{j} C_{j} \ln (\sum_{i} (1 - ψ) (1 - ρ_{M M}) η_{i} p_{i j}) + M \ln (\sum_{i} \sum_{j} (1 - ψ) ρ_{M M} η_{i} p_{i j}) . \end{array}$

Notons que $N_{i j} = \sum_{k \in U} y_{1 i k} y_{2 j k}$ , $R_{i} = \sum_{k \in U} y_{1 i k} (1 - z_{2 k})$ , $C_{j} = \sum_{k \in U} y_{2 j k} (1 - z_{1 k})$ et $M = \sum_{k \in U} (1 - z_{1 k}) (1 - z_{2 k}) .$ Après avoir pris en compte la somme de la population totale, le résultat est finalement obtenu.

Preuve du résultat 4.2

Preuve. En commençant par la définition de la pseudo-vraisemblance et en tenant compte des hypothèses du modèle, il s’ensuit que

$\begin{array}{l} l_{U} = \sum_{k \in U} [\sum_{i} \sum_{j} y_{1 i k} y_{2 j k} [\ln (ψ) + \ln (ρ_{R R}) + \ln (η_{i}) + \ln (p_{i j})] \\ + \sum_{i} y_{1 i k} (1 - z_{2 k}) [\ln (ψ) + \ln (1 - ρ_{R R}) + \ln (η_{i}) + \ln (\sum_{j} p_{i j})] \\ + \sum_{j} y_{2 j k} (1 - z_{1 k}) [\ln (1 - ρ_{M M}) + \ln (1 - ψ) + \ln (\sum_{i} η_{i} p_{i j})] \\ + (1 - z_{1 k}) (1 - z_{2 k}) [\ln (1 - ψ) + \ln (ρ_{M M}) + \ln (\sum_{i} \sum_{j} η_{i} p_{i j})]] \\ = \sum_{k \in U} f_{k} (ψ, ρ_{R R}, ρ_{M M}, η, p, y_{1}, y_{2}, z_{1}, z_{2}) . \end{array}$

Le score pour $ψ$ peut être défini comme suit :

$\begin{array}{l} u_{k} (ψ) & = \frac{\partial f_{k} (ψ, ρ_{R R}, ρ_{M M}, η, p, y_{1}, y_{2}, z_{1}, z_{2})}{\partial ψ} \\ = \frac{(1 - ψ) (\sum_{i} \sum_{j} y_{1 i k} y_{2 j k} + \sum_{i} y_{1 i k} (1 - z_{2 k})) - ψ (\sum_{j} y_{2 j k} (1 - z_{1 k}) + (1 - z_{1 k}) (1 - z_{2 k}))}{ψ (1 - ψ)} . \end{array}$

Alors, pour ce paramètre, les équations de pseudo-vraisemblance sont données par

$\sum_{k \in S} w_{k} u_{k} (ψ) = 0.$

Pour la solution de $ψ$ , on constate que

${\hat{ψ}}_{m p v} = \frac{\sum_{i} \sum_{j} {\hat{N}}_{i j} + \sum_{i} {\hat{R}}_{i}}{\sum_{i} \sum_{j} {\hat{N}}_{i j} + {\sum_{i} {\hat{R}}_{i}}_{i} + \sum_{j} {\hat{C}}_{j} + \hat{M}} .$

Au moyen d’un processus analogue pour les paramètres restants, le résultat est obtenu.

Preuve du résultat 4.3

Preuve. D’abord, il faut savoir que l’estimation pour ces paramètres est assujettie aux restrictions $\sum_{i} η_{i} = 1$ et $\sum_{j} p_{i j} = 1$ . Alors, le processus doit tenir compte de l’utilisation des multiplicateurs de Lagrange. La fonction à maximiser, y compris ces restrictions, peut être exprimée comme suit :

$l_{U} + λ_{1} (\sum_{i} η_{i} - 1) + λ_{2} (\sum_{j} p_{i j} - 1) .$

Alors, le score correspondant pour $η_{i}$ est défini par

$\begin{array}{l} u_{k} (η_{i}) & = \frac{\partial f_{k} (ψ, ρ_{R R}, ρ_{M M}, η, p, y_{1}, y_{2}, z_{1}, z_{2})}{\partial η_{i}} + \frac{\partial λ_{1} (\sum_{i} η_{i} - 1)}{\partial η_{i}} \\ = \frac{\sum_{j} y_{1 i k} y_{2 j k} + y_{1 i k} (1 - z_{2 k})}{η_{i}} + \sum_{j} y_{2 j k} (1 - z_{1 k}) \frac{p_{i j}}{\sum_{i} η_{i} p_{i j}} + (1 - z_{1 k}) (1 - z_{2 k}) + λ_{1} . \end{array}$

La dernière étape tient compte des restrictions, puisque $\sum_{i} \sum_{j} η_{i} p_{i j} = \sum_{i} η_{i} \sum_{j} p_{i j} = \sum_{i} η_{i} = 1$ . Alors, pour ce paramètre, les équations de pseudo-vraisemblance sont données par

$\sum_{k \in S} w_{k} u_{k} (η_{i}) = 0.$

Alors, après un peu d’algèbre, il s’ensuit que

$η_{i} = \frac{\sum_{j} \sum_{s} w_{k} y_{1 i k} y_{2 j k} + \sum_{s} w_{k} y_{1 i k} (1 - z_{2 k}) + \sum_{j} \sum_{s} w_{k} y_{2 j k} (1 - z_{1 k}) (η_{i} p_{i j} / \sum_{i} η_{i} p_{i j})}{- \sum_{s} w_{k} (1 - z_{1 k}) (1 - z_{2 k}) - λ_{1} \sum_{s} w_{k}} .$

Par ailleurs, en utilisant la restriction $\sum_{i} η_{i} = 1$ et en faisant la somme par rapport à $i$ , il s’ensuit que

$\sum_{i} \sum_{j} {\hat{N}}_{i j} + \sum_{i} {\hat{R}}_{i} + \sum_{j} {\hat{C}}_{j} = (- \sum_{s} w_{k} (1 - z_{1 k}) (1 - z_{2 k}) - λ_{1} \sum_{s} w_{k}) .$

Alors, nous obtenons enfin que

$η_{i} = \frac{\sum_{j} {\hat{N}}_{i j} + {\hat{R}}_{i} + \sum_{j} ({\hat{C}}_{j} η_{i} p_{i j} / \sum_{i} η_{i} p_{i j})}{\sum_{i} \sum_{j} {\hat{N}}_{i j} + \sum_{i} {\hat{R}}_{i} + \sum_{j} {\hat{C}}_{j}} .$

Par ailleurs, afin de trouver l’estimateur du maximum de pseudo-vraisemblance de ${p_{i j}}$ , le score pour $p_{i j}$ est défini comme suit :

$\begin{array}{l} u_{k} (p_{i j}) & = \frac{\partial f_{k} (ψ, ρ_{R R}, ρ_{M M}, η, p, y_{1}, y_{2}, z_{1}, z_{2})}{\partial p_{i j}} + \frac{\partial λ_{2} (\sum_{i} p_{i j} - 1)}{\partial p_{i j}} \\ = \frac{y_{1 i k} y_{2 j k}}{p_{i j}} + y_{1 i k} (1 - z_{2 k}) + y_{2 j k} (1 - z_{1 k}) \frac{η_{i}}{\sum_{i} η_{i} p_{i j}} + (1 - z_{1 k}) (1 - z_{2 k}) η_{i} + λ_{2} . \end{array}$

Par conséquent,

$p_{i j} = \frac{\sum_{s} w_{k} y_{1 i k} y_{2 j k} + \sum_{s} w_{k} y_{2 j k} (1 - z_{1 k}) p_{i j} η_{i} / \sum_{i} η_{i} p_{i j}}{- \sum_{s} w_{k} y_{1 i k} (1 - z_{2 k}) - \sum_{s} w_{k} (1 - z_{1 k}) (1 - z_{2 k}) η_{i} - \sum_{s} w_{k} λ_{2}} .$

En utilisant la restriction $\sum_{j} p_{i j} = 1$ et en faisant la somme par rapport à $j$ des deux côtés, il s’ensuit que

$\begin{array}{l} \sum_{j} {\hat{N}}_{i j} + \sum_{j} {\hat{C}}_{j} \frac{p_{i j} η_{i}}{\sum_{i} η_{i} p_{i j}} \\ = (- \sum_{s} w_{k} y_{1 i k} (1 - z_{2 k}) - \sum_{s} w_{k} (1 - z_{1 k}) (1 - z_{2 k}) η_{i} - \sum_{s} w_{k} λ_{2}) . \end{array}$

Alors, il s’ensuit que

$p_{i j} = \frac{{\hat{N}}_{i j} + ({\hat{C}}_{j} η_{i} p_{i j} / \sum_{i} η_{i} p_{i j})}{\sum_{j} {\hat{N}}_{i j} + \sum_{j} ({\hat{C}}_{j} η_{i} p_{i j} / \sum_{i} η_{i} p_{i j})} .$

Maintenant, soulignons qu’il est impossible de résoudre la dernière expression pour ${p_{i j}}$ de façon à ce que la solution soit une expression fermée. Il en va de même en ce qui concerne l’expression pour ${η_{i}}$ . Cependant, il est possible d’utiliser une approche itérative, qui s’est avérée avoir une convergence rapide des problèmes d’estimation du maximum de vraisemblance pour les tableaux de contingence. Cette approche présume que l’estimateur du maximum de pseudo-vraisemblance peut se trouver après une itération conjointe des expressions suivantes à l’étape $(v + 1)$ , pour $v \geq 1$ ,

$\begin{array}{l} {\hat{η}}_{i, m p v}^{(v + 1)} & = & \begin{array}{l} \frac{\sum_{j} {\hat{N}}_{i j} + {\hat{R}}_{i} + \sum_{j} ({\hat{C}}_{j} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)} / \sum_{i} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)})}{\sum_{i} \sum_{j} {\hat{N}}_{i j} + \sum_{i} {\hat{R}}_{i} + \sum_{j} {\hat{C}}_{j}} \end{array} \\ {\hat{p}}_{i j, m p v}^{(v + 1)} & = & \frac{{\hat{N}}_{i j} + ({\hat{C}}_{j} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)} / \sum_{i} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)})}{\sum_{j} {\hat{N}}_{i j} + \sum_{j} ({\hat{C}}_{j} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)} / \sum_{i} {\hat{η}}_{i}^{(v)} {\hat{p}}_{i j}^{(v)})} . \end{array}$

Cette procédure itérative particulière a été utilisée au départ pour la formulation de modèles de vraisemblance imbriqués de Hocking et Oxspring (1971). Toutefois, elle semble également avoir été mise en œuvre par Blumenthal (1968), Reinfurt (1970), Chen et Fienberg (1974), Fienberg et Stasny (1983), Stasny (1987), Stasny (1988) et d’autres.

Preuve du résultat 5.5

Preuve. L’estimateur non linéaire ${\hat{ψ}}_{m p v}$ , peut être exprimé comme une fonction des totaux estimés ${\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}$ et $\hat{M}$ (où $i, j = 1, \dots, G$ ). Alors,

${\hat{ψ}}_{m p v} = f ({\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M}) .$

Enfin, l’approximation du premier degré de Taylor au point $({\hat{N}}_{i j} = N_{i j}, {\hat{R}}_{i} = R_{i}, {\hat{C}}_{j} = C_{j}, \hat{M} = M)$ est donnée par

$\begin{array}{l} {\hat{ψ}}_{m p v} = ψ_{U} + a_{1} \sum_{i} \sum_{j} ({\hat{N}}_{i j} - N_{i j}) + a_{1} \sum_{i} ({\hat{R}}_{i} - R_{i}) \\ + a_{2} \sum_{j} ({\hat{C}}_{j} - C_{j}) + a_{2} (\hat{M} - M) \end{array}$

où

$a_{1} = {\frac{\partial f ({\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M})}{\partial {\hat{R}}_{i}} |}_{\begin{matrix} {\hat{N}}_{i j} = N_{i j} \\ {\hat{R}}_{i} = R_{i} \\ {\hat{C}}_{j} = C_{j} \\ \hat{M} = M \end{matrix}} = {\frac{\partial f ({\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M})}{\partial {\hat{N}}_{i j}} |}_{\begin{matrix} {\hat{N}}_{i j} = N_{i j} \\ {\hat{R}}_{i} = R_{i} \\ {\hat{C}}_{j} = C_{j} \\ \hat{M} = M \end{matrix}} = \frac{\sum_{j} C_{j} + M}{{(\sum_{i} \sum_{j} N_{i j} + \sum_{i} R_{i} + \sum_{j} C_{j} + M)}^{2}}$

$a_{2} = {\frac{\partial f ({\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M})}{\partial {\hat{C}}_{j}} |}_{\begin{matrix} {\hat{N}}_{i j} = N_{i j} \\ {\hat{R}}_{i} = R_{i} \\ {\hat{C}}_{j} = C_{j} \\ \hat{M} = M \end{matrix}} = {\frac{\partial f ({\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M})}{\partial \hat{M}} |}_{\begin{matrix} {\hat{N}}_{i j} = N_{i j} \\ {\hat{R}}_{i} = R_{i} \\ {\hat{C}}_{j} = C_{j} \\ \hat{M} = M \end{matrix}} = - \frac{\sum_{i} \sum_{j} N_{i j} + \sum_{i} R_{i}}{{(\sum_{i} \sum_{j} N_{i j} + \sum_{i} R_{i} + \sum_{j} C_{j} + M)}^{2}} .$

Preuve du résultat 5.8

Preuve. Pour calculer la valeur prévue conformément au plan d’échantillonnage, il s’ensuit que

$\begin{array}{l} A E_{p} ({\hat{ψ}}_{m p v}) & ≅ E_{p} ({\hat{ψ}}_{0}) \\ = ψ_{U} + a_{1} \sum_{i} \sum_{j} (E_{p} ({\hat{N}}_{i j}) - N_{i j}) + a_{1} \sum_{i} (E_{p} ({\hat{R}}_{i}) - R_{i}) \\ + a_{2} \sum_{j} (E_{p} ({\hat{C}}_{j}) - C_{j}) + a_{2} (E_{p} (\hat{M}) - M) \\ = ψ_{U} . \end{array}$

En suivant un processus semblable pour les estimateurs restants, on obtient le résultat. Cette preuve découle de l’application de la méthode de pseudo-vraisemblance qui induit les estimations sans biais pour les paramètres de population dans le modèle comme le prouve le corollaire 1 de Binder (1983, p. 291).

Preuve du résultat 5.10

Preuve. En supposant ${\hat{ψ}}_{m p v}$ , en remplaçant les expressions pour ${\hat{N}}_{i j}, {\hat{R}}_{i}, {\hat{C}}_{j}, \hat{M}$ et en faisant quelques simplifications algébriques, on peut exprimer la variance approximative comme suit :

$A V ({\hat{ψ}}_{m p v}) = V a r (a_{1} \sum_{i} \sum_{j} {\hat{N}}_{i j} + a_{1} \sum_{i} {\hat{R}}_{i} + a_{2} \sum_{j} {\hat{C}}_{j} + a_{2} \hat{M}) = V a r (\sum_{k \in S} \frac{E_{k}^{ψ}}{π_{k}}) .$

Initialement, nous avons

$E_{k}^{ψ} = a_{1} \sum_{i} \sum_{j} y_{1 i k} y_{2 j k} + a_{1} \sum_{i} y_{1 i k} (1 - z_{2 k}) + a_{2} \sum_{j} y_{2 j k} (1 - z_{1 k}) + a_{2} (1 - z_{1 k}) (1 - z_{2 k}) .$

Alors, sachant que $\sum_{i} \sum_{j} y_{1 i k} y_{2 j k} = \sum_{i} y_{1 i k} = \sum_{j} y_{2 j k} = 1$ et après un peu d’algèbre, il s’ensuit que

$E_{k}^{ψ} = a_{1} (2 - z_{2 k}) + a_{2} (1 - z_{1 k}) (2 - z_{2 k}) .$

Après un processus analogue pour ${\hat{ρ}}_{R R, m p v}$ et ${\hat{ρ}}_{M M, m p v}$ , les autres expressions de la variance dans ce résultat sont obtenues.

Preuve du résultat 5.12

Preuve. On obtient la preuve en suivant l’expression (3.3) de Binder (1983) et en tenant compte de ce qui suit

$\begin{matrix} J_{η_{i}} & = \frac{\partial \sum_{U} u_{k} (η_{i})}{\partial η_{i}} \\ J_{p_{i j}} & = \frac{\partial \sum_{U} u_{k} (p_{i j})}{\partial p_{i j}} . \end{matrix}$

De plus,

$\begin{array}{l} \frac{\partial u_{k} (η_{i})}{\partial η_{i}} = - \frac{2 y_{1 i k} - y_{1 i k} z_{2 k}}{η_{i}^{2}} - (1 - z_{1 k}) \sum_{j} \frac{y_{2 j k} p_{i j}^{2}}{{(\sum_{i} η_{i} p_{i j})}^{2}} \\ \frac{\partial u_{k} (p_{i j})}{\partial p_{i j}} = - \frac{y_{1 i k} y_{2 j k}}{p_{i j}^{2}} - \frac{η_{i}^{2}}{{(\sum_{i} η_{i} p_{i j})}^{2}} y_{2 j k} (1 - z_{1 k}) . \end{array}$

Preuve du résultat 5.16

Preuve.

$\begin{array}{l} A V_{p} ({\hat{μ}}_{i j, m p v}) & = a_{7}^{2} V a r_{p} ({\hat{N}}_{i j}) + a_{8}^{2} A V_{p} ({\hat{η}}_{i, m p v}) + a_{9}^{2} A V_{p} ({\hat{p}}_{i j}) \\ + 2 a_{7} a_{8} C o v ({\hat{N}}_{i j}, {\hat{η}}_{i, m p v}) + 2 a_{7} a_{9} C o v ({\hat{N}}_{i j}, {\hat{p}}_{i j}) 2 a_{8} a_{9} C o v ({\hat{η}}_{i, m p v}, {\hat{p}}_{i j}) \\ ≅ a_{7}^{2} V a r_{p} ({\hat{N}}_{i j}) + a_{8}^{2} A V_{p} ({\hat{η}}_{i, m p v}) + a_{9}^{2} A V_{p} ({\hat{p}}_{i j}) . \end{array}$

Parce que

$\begin{array}{l} C o v ({\hat{N}}_{i j}, {\hat{η}}_{i, m p v}) & = E_{p} ({\hat{N}}_{i j} {\hat{η}}_{i, m p v}) - E_{p} ({\hat{N}}_{i j}) E_{p} ({\hat{η}}_{i, m p v}) \\ ≅ {\hat{N}}_{i j, U} η_{i, U} - {\hat{N}}_{i j, U} η_{i, U} = 0. \end{array}$

Alors, il est possible d’obtenir ce qui suit :

$E_{p} ({\hat{N}}_{i j} {\hat{η}}_{i, m p v}) ≅ {\hat{N}}_{i j, U}, η_{i, U}$

au moyen de la linéarisation de Taylor pour $({\hat{N}}_{i j, U}, η_{i, U})$ . Les autres covariances sont obtenues de façon semblable.

Bibliographie

Ash, S. (2005). Calibration weights for estimators of longitudinal data with an application to the National Long Term Care Survey. Proceedings of the Section on Survey Research Methods of the American Statistical Association. American Statistical Association: Alexandria, VA, 2694–2699.

Binder, D. (1983). On the variances of asymptotically normal estimators from complex surveys. International Statistical Review, 51, 279-292.

Blumenthal, S. (1968). Multinomial sampling with partially categorized data. Journal of the American Statistical Association, 63, 542-551.

Cassel, C.M., Särndal, C.E. et Wretman, J.H. (1976). Foundations of Inference in Survey Sampling. New York: Wiley.

Chambers, R.L. et Skinner, C.J. (2003). Analysis of Survey Data. John Wiley and Sons, Chichester: UK.

Chen, T. et Fienberg, S.E. (1974). Two-dimensional contingency tables with both completely and partially cross-classified data. Biometrics, 30, 629-642.

Clogg, C.C. et Eliason, S.R. (1987). Some common problems in log-linear analysis. Sociological Methods and Research, 16, 8-44.

Deville, J. et Särndal, C. (1992). Calibration estimators in survey sampling. Journal of the American Statistical Association, 87, 376-382.

Fienberg, S.E. et Stasny, E.A. (1983). L’estimation des flux bruts mensuels de l’activité sur le marché du travail. Techniques d’enquête, 9(1), 85-110.

Fuller, W.A. (2009). Sampling Statistics. Wiley.

Gambino, J.G. et Silva, P.L. (2009). Sampling and estimation in household surveys. Dans D. Pfeffermann et C.R. Rao (Eds.), Handbook of Statistics. Vol. 29A. Sample Surveys: Design, Methods and Applications (pp. 407-439). Amsterdam: Elsevier.

Gutiérrez, H.A. (2009). TeachingSampling: Sampling designs and parameter estimation in finite population. R package version 2.0.1.

Hocking, R.R. et Oxspring, H.H. (1971). Maximun likelihood estimation with incomplete multinomial data. Journal of the American Statistical Association, 66, 65-70.

IBGE (2007). Pesquisa Mensal de Emprego. Vol. 23, 2^nd edition.

Kalton, G. (2009). Designs for surveys over time. Dans D. Pfeffermann and C.R. Rao (Eds.), Handbook of Statistics. Vol. 29A. Sample Surveys: Design, Methods and Applications (pp. 89-108). Amsterdam: Elsevier.

Kim, J. K. et Park, M. (2010). Calibration estimation in survey sampling. International Statistical Review, 78, 21-39.

Lohr, S.L. (1999). Sampling: Design and Analysis. Pacific Grove: Duxbury Press.

Lu, Y. et Lohr, S. (2010). L’estimation des flux bruts dans les enquêtes à base de sondage double. Techniques d’enquête, 36(1), 13-24.

Lumley, T. (2010). Complex Surveys: A Guide to Analysis using R. New York: Wiley.

Pessoa, D.G.C. et Silva, P.L. (1998). Análise de Dados Amostrais Complexos. São Paulo : Associação Brasileira de Estatística.

Pfeffermann, D. (1993). The role of sampling weights when modeling survey data. International Statistical Review, 61, 317-337.

R Development Core Team (2012). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

Rao, J.N.K. et Thomas, D.R. (1988). The analysis of cross-classified data from complex surveys. Sociological Methodology, 18, 213-269.

Reinfurt, D.W. (1970). The analyis of categorical data with supplemented margins including applications to mixed models. Thèse de doctorat non publiée. Department of Biostatistics. University of North Carolina.

Särndal, C.E. (2011). The 2010 Morris Hansen lecture: Dealing with survey nonresponse in data collection. Journal of Official Statistics, 27, 1-21.

Särndal, C.E. et Lundström, S. (2005). Estimation in Surveys with Nonresponse. John Wiley and Sons, Chichester: UK.

Särndal, C.E. et Lundström, S. (2010). Plan d’estimation : détermination de vecteurs auxiliaires en vue de réduire le biais de non-réponse. Techniques d’enquête, 36(2), 141-156.

Sikkel, D., Hox, J. et de Leeuw, E. (2008). Using auxiliary data for adjustment in longitudinal research. Dans P. Lynn (Ed), Methodology of longitudinal surveys. New York: Wiley. Une version antérieure est disponible au http://www.iser.essex.ac.uk/ulsc/mols2006/programme/data/papers/Sikkel.pdf

Skinner, C.J. et Vallet, L.A. (2010). Fitting log-linear models to contingency tables from surveys with complex sampling designs: An investigation of the Clogg-Eliason approach. Sociological Methods and Research, 39, 83-108.

Stasny, E.A. (1987). Some Markov-chain models for nonresponse in estimating gross labor force flows. Journal of Official Statistics, 3, 359-373.

Stasny, E.A. (1988). Modeling nonignorable nonresponse in categorical panel data with an example in estimating gross labor-flows. Journal of Business and Economic Statistics, 6, 207-219.

Date de modification :: 2017-09-20

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête