Analyse de données d'enquêtes complexes par échantillonnage inverse - ARCHIVÉ

Articles et rapports : 11-522-X20020016748

Description :

Les praticiens utilisent souvent des données provenant d'enquêtes complexes (comme les enquêtes sur la population active et sur la santé basées sur un plan d'échantillonnage en grappes stratifiées) pour ajuster des modèles de régression logistique ou autres. Au cours des deux dernières décennies, beaucoup d'énergie a été consacrée à la mise au point de méthodes d'analyse des données d'enquêtes qui tiennent compte des caractéristiques du plan de sondage. Dans cet article, on étudie une méthode de remplacement intitulée échantillonnage inverse.

Des programmes spécialisés, comme SUDAAN et WESVAR, sont également commercialisés pour la mise en oeuvre de certaines de ces méthodes qui sont élaborées pour tenir compte des caractéristiques du plan de sondage. Toutefois, ces méthodes nécessitent des données supplémentaires, telles que les poids d'échantillonnage, les effets de plan ou l'analyse de groupement de microdonnées.

L'échantillonnage inverse (Hinkins et coll., Technique d'enquête, 1977) offre une méthode de rechange qui consiste à défaire les structures complexes des données afin de pouvoir appliquer des méthodes types. On tire des sous échantillons répétés à structure aléatoire simple et on analyse chaque sous échantillon par des méthodes types, et on les rassemble pour augmenter l'efficacité. Cette méthode permet de préserver le caractère confidentiel des fichiers de microdonnées bien qu'elle nécessite de nombreux calculs. Un inconvénient est qu'elle peut produire des estimations biaisées des paramètres de régression si la taille des sous échantillons est faible (comme dans le cas de l'échantillonnage en grappes stratifié).

Dans cet article, on propose une méthode basée sur des équations d'estimation qui consiste à rassembler les sous échantillons avant l'estimation et qui produit donc des estimations presque non biaisées des paramètres de régression, quelle que soit la taille des sous échantillons. En outre, elle nécessite moins de calculs que la méthode originale. On applique cette méthode à des données en grappes corrélées produites au moyen d'un modèle de régression linéaire à erreurs emboîtées pour illustrer ses avantages. On analyse aussi un ensemble de données réelles provenant d'une enquête de Statistique Canada par la méthode des équations d'estimation.

Numéro d'exemplaire : 2002001
Auteur(s) : Benhin, E.; Rao, J.N.K.; Scott, A.J.
FormatDate de sortieInformations supplémentaires
CD-ROM13 septembre 2004
PDF13 septembre 2004