Causes des données incomplètes, ajustements et effets - ARCHIVÉ

Articles et rapports : 12-001-X198000254945

Description :

L’article donne un aperçu général des concepts de données incomplètes et de la non-réponse. Il est reconnu que la non-réponse est un indice important de la qualité des données puisqu’elle affecte les estimateurs en y introduisant un biais et une augmentation de la variance à cause d’une réduction de la taille effective de l’échantillon. La relation entre le biais et le taux de non-réponse est moins évidente puisqu’elle dépend de l’ampleur de la non-réponse et aussi de la différence des diverses caractéristiques entre les répondants et les non-répondants.

Le moyen le plus efficace de traiter les effets de la non-réponse est d’en minimiser l’ampleur. Cependant, toute tentative de contrôler l’ampleur de la non-réponse doit être fondée sur une bonne compréhension de ses origines. Les causes de la non-réponse et son ampleur sont fondamentalement liées i) au type d’enquête, ii) aux méthodes de saisie des données et iii) au plan d’échantillonnage. Toutefois, étant donné un plan d’échantillonnage, l’ampleur de la non-réponse sera influencée par des facteurs tels le type de région et le type de non-réponse.

Il y a plusieurs façons de traiter les données incomplètes. Chacune d’elles, en fin de compte, attribue une valeur aux données manquantes ou incorrectes; à moins qu’il ne soit décidé de publier des données « brutes ». La procédure d’attribution de valeurs s’appelle imputation et une telle valeur imputée décrit, présumément, la caractéristique du non-répondant.

L’article donne une brève discussion philosophique sur le sujet de la validation et de l’imputation et leurs applications à la méthodologie des diverses procédures d’imputation. Parmi celles-ci, mentionnons la pondération, réplication, « Hot Deck » substitution par des données antérieures et remplacement par la valeur zéro. L’application de l’imputation par rapport aux méthodes employées par l’enquête sur la population active au Canada y est aussi discutée. Une table de décision est fournie indiquant les diverses étapes à suivre pour un cas particulier d’un questionnaire de l’EPA partiellement complet.

Numéro d'exemplaire : 1980002
Auteur(s) : Platek, Richard

Produit principal : Techniques d'enquête

FormatDate de sortieInformations supplémentaires
PDF15 décembre 1980

Information connexe

Sujets et mots-clés

Sujets

Mots-clés

Date de modification :