Consulter la version la plus récente.
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
Les microdonnées des fichiers à grande diffusion ne sont pas pondérées. Il revient aux utilisateurs des données d’appliquer les poids appropriés compte tenu des résultats qu’ils veulent produire. Si l’on n’applique pas les poids appropriés, les estimations effectuées à partir des microdonnées ne peuvent être considérées comme représentatives de la population observée, et ne correspondront pas à celles que produirait Statistique Canada. Dans le guide de l’utilisation des microdonnées de l’enquête transversale de l’ESF, la variable de poids est WEIGHT.
Une fois qu’on a déterminé que les résultats obtenus sont fiables, le niveau d’arrondissement correspond au niveau de précision des données. Les lignes directrices qui suivent devraient être utilisées pour l’arrondissement :
Il convient de souligner que tous les calculs doivent être faits à partir d’éléments non arrondis, puis arrondis au moyen de la technique d’arrondissement classique.
Selon la méthode d’arrondissement classique, si le premier ou le seul chiffre à supprimer est compris entre 0 et 4, le dernier chiffre retenu ne change pas. Si le premier ou le seul chiffre à supprimer est compris entre 5 et 9, on augmente d’une unité (1) la valeur du dernier chiffre retenu. Par exemple, selon la technique d’arrondissement classique à la centaine près, une estimation de 49 448 serait arrondie à 49 400, et une estimation de 49 252, à 49 300. Le chiffre 1,78 % serait arrondi à 1,8 %.
Il existe différents types de valeurs manquantes dans le fichier.
Si le champ de la variable ne s’étend pas à un sous-groupe particulier de population, il n’y a pas de valeur valide pour ce sous-groupe, et les valeurs fournies prennent la forme suivante : 9, 99, 9,9 et ainsi de suite, ce qui indique que la variable ne s’applique pas. La population admissible pour chaque variable du fichier est énoncée dans le dictionnaire des données. Ce principe s'applique également aux variables dérivées dont certaines composantes ont été limitées à un seuil donné.
Des valeurs peuvent être absentes de certains enregistrements, du fait qu’aucune valeur valide n’est disponible, même si la variable s’applique. Il se peut que le répondant n’ait pas fourni les renseignements, ou encore que ceux-ci aient été rejetés en cours de traitement, et que la valeur n’ait pas été imputée. Ces valeurs manquantes apparaissent avec un code comme 7, 97, 9,7 et ainsi de suite, selon le format. Pour certaines variables, le nombre de valeurs manquantes a été réduit au moyen de l’imputation. Les valeurs manquantes relatives aux variables sur le revenu ont été entièrement imputées, mais la plupart des autres variables comportent des valeurs manquantes.
Le traitement des valeurs manquantes de cette dernière catégorie dépend du type d’analyse effectué et de la portée des données manquantes. Même si la solution finale pourrait consister à exclure de l’analyse les enregistrements auxquels il manque des valeurs, on devrait tout d’abord procéder à un examen pour évaluer les répercussions des valeurs manquantes sur la représentativité globale des données. Se peut-il qu’un biais découle des données manquantes, par exemple, les (autres) caractéristiques des personnes pour lesquelles il manque des valeurs diffèrent-elles de celles de la partie observée de l’échantillon? Il peut être nécessaire de tenir compte, d’une façon ou d’une autre, des répercussions possibles. Dans tous les cas, lorsque les analystes publient leurs résultats, ils devraient indiquer pour quelles variables les enregistrements qui ont des valeurs manquantes ont été exclus.