2 Le plan de sondage de la SDR
Iván A. Carrillo et Alan F. Karr
Précédent | Suivant
2.1 Population finie
La
population finie d'intérêt de la SDR peut être représentée comme au
tableau 2.1. À la vague 1, c'est-à-dire la première période
d'intérêt, il existe un ensemble fini, de titulaires d'un doctorat, obtenu
récemment ou non, qui satisfont aux exigences de la SDR.
Tableau 2.1
Population finie de la SDR
À la
vague 2, un sous-ensemble seulement des sujets compris dans satisfont encore aux exigences de
la SDR; nous appelons ce sous-ensemble de sujets, En outre, il existe un ensemble
de nouveaux titulaires d'un doctorat, qui ont obtenu leur diplôme depuis la
vague 1, et qui satisfont aussi aux autres exigences de l'enquête. Cet
ensemble de nouveaux diplômés dans le champ de l'enquête est appelé et est de taille Par conséquent, à la
vague 2, il y a un total de sujets dans la population
d'intérêt
À la
vague suivante, la vague 3, le même processus a lieu. Certains sujets
compris dans ont quitté la population
d'intérêt et il n'en reste que dans La même chose se produit avec
l'ensemble seulement un sous-ensemble de sujets satisfera encore aux
exigences de la SDR. En outre, diplômés récents entrent dans la
population d'intérêt; cet ensemble est appelé En tout, la population finie
d'intérêt à la vague 3 est avec sujets.
Cette
procédure de réduction des cohortes anciennes et d'ajout de nouvelles cohortes
se poursuit jusqu'à la dernière vague d'intérêt, la vague Nous constatons que la population
finie d'intérêt change à chaque vague, principalement pour deux raisons.
Premièrement, certains sujets appartenant aux anciennes cohortes ne sont plus
dans le champ de la vague courante et ne font pas partie de la population cible
courante. Deuxièmement, des diplômés récents sont ajoutés à la population cible
de la vague courante. Nous désignons par la vague d'intérêt (hors des
parenthèses) et par la cohorte à laquelle le sujet
appartient (entre parenthèses), et par conséquent
2.2 Échantillonnage
Le plan
d'échantillonnage de la SDR possède une structure similaire à celle de la
population finie et est illustré au tableau 2.2. À la vague 1, un échantillon
(complexe) de sujets est sélectionné parmi les éléments de Chaque élément dans est interviewé et les données
qu'il fournit sont recueillies; en outre, il existe un poids de sondage associé à l'élément, qui est
l'inverse de la probabilité d'inclusion de ce dernier dans l'échantillon à la
vague 1.
Tableau 2.2
Échantillon de la SDR
À la
deuxième vague, les éléments compris dans qui ne sont plus dans le champ de
l'enquête sont simplement supprimés de la base de sondage (mais les
observations les concernant faites à la vague 1 sont gardées), et un
sous-échantillon de taille des sujets encore dans le champ
de l'enquête est sélectionné. Les membres de qui sont encore dans le champ de
l'enquête à la vague 2 ne sont pas tous gardés dans l'échantillon, et ce pour
permettre d'ajouter l'échantillon de nouveaux titulaires d'un doctorat tout en
maintenant plus ou moins la même taille d'échantillon qu'à la vague 1. Un
échantillon de taille est tiré de les sujets compris dans forment la deuxième cohorte.
L'échantillon total à la vague 2 est dont la taille est qui est approximativement égale à
Tous les sujets compris dans sont interviewés à la vague 2.
Les poids de sondage à la vague 2, sont tels que l'échantillon représente la population
d'intérêt à la vague 2, à savoir
La même
procédure est répétée à chaque vague jusqu'à la dernière où un sous-échantillon des sujets
restants en provenance de chacune des cohortes antérieures est
sélectionné, et un nouvel échantillon (nouvelle cohorte) de diplômés récents est tiré de À la dernière vague, tous les
sujets compris dans sont interviewés et un poids de
sondage est créé pour chacun, de sorte
que représente la population finie
En ce
qui concerne la façon dont sont sélectionnés les sujets supprimées de
l'échantillon, selon NSF (2012), en 2008 par exemple, le sous-échantillon a été sélectionné en stratifiant « en 150 strates en fonction
de 3 variables : groupe démographique, domaine du diplôme et sexe. » Le
rapport explique aussi que :
L'ancienne
pratique consistant à sélectionner l'échantillon avec probabilité
proportionnelle à la taille s'est poursuivie, la mesure de taille étant le
poids de base associé au cycle précédent de l'enquête. Pour chaque strate,
l'algorithme d'échantillonnage a commencé par repérer et supprimer les cas
autoreprésentatifs selon une procédure itérative. Ensuite, dans chaque strate,
les cas non autoreprésentatifs ont été triés en fonction de la citoyenneté, de
l'état d'incapacité, du domaine du diplôme et de l'année d'obtention du diplôme
de doctorat. Enfin, le solde de l'échantillon (c'est-à-dire le total attribué à
la strate moins le nombre de cas autoreprésentatifs) a été sélectionné dans
chaque strate systématiquement avec probabilité proportionnelle à la taille.
Il
convient de mentionner que, jusqu'à 1989, la cohorte (ou plus précisément
l'année d'obtention du diplôme) faisait partie des variables de stratification
(et des cellules d'ajustement des poids), mais qu'à partir de 1991, elle ne l'a
plus été; elle a été remplacée par l'état d'incapacité. Pour des renseignements
plus détaillés sur la procédure de sous-échantillonnage, y compris la
description de la répartition de l'échantillon, voir NSF (2012) ou Cox,
Grigorian, Wang et Harter (2010).
La
description qui précède montre clairement que la SDR n'est pas réalisée selon
un plan à panel rotatif. Outre le fait que la composition de la population
finie d'intérêt évolue avec le temps, un plan à panel rotatif donnerait lieu à
la sélection, au temps. d'une nouvelle cohorte à partir
de et non à partir de comme cela est le cas dans la
SDR.
Une
autre particularité de la SDR est qu'à chaque vague une base de sondage de diplômés
récents existe, de laquelle peut être
tirée directement la nouvelle cohorte Cependant, dans d'autres
applications, le coût de la création d'une telle base de sondage, par exemple
une liste de nouveaux membres, peut être excessif (particulièrement lorsqu'il
est cumulé sur l'ensemble des vagues), et la nouvelle cohorte doit parfois être
sélectionnée à partir de (par opposition à ). La méthode proposée dans le
présent article peut également être appliquée à ce genre de cas, à condition
que l'on puisse créer pour l'échantillon total à la vague un poids transversal pour
représenter Nous discutons de cet aspect plus
en détail à la section 3.2.
Soulignons
que, dans la notation la quantité représente la vague à laquelle
l'échantillon se rapporte, et désigne la cohorte de
l'échantillon, c'est-à-dire la vague à laquelle l'échantillon a été sélectionné
initialement. La notation pour les pondérations est où le premier indice inférieur
désigne le sujet et le second, la vague d'intérêt, quelle que soit la période
où le sujet a été sélectionné initialement.
Précédent | Suivant