Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

8.0 Lignes directrices pour la diffusion

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Les utilisateurs de microdonnées devraient appliquer les règles d’évaluation de la qualité des données figurant ci-dessous à toutes les estimations qu’ils produisent et ne devraient retenir que celles qui répondent aux critères s’appliquant à la diffusion. Les estimations qui ne répondent pas à ces critères ne sont pas fiables.

8.1 Introduction

Les lignes directrices pour la diffusion et la publication s’appuient sur le concept de la « variabilité d’échantillonnage » afin de déterminer si les estimations tirées des microdonnées sont fiables. La variabilité d’échantillonnage peut être définie comme l’erreur dans les estimations qui découle du fait qu’on effectue l’enquête auprès d’un échantillon plutôt que de l’ensemble de la population. Le concept de l’« erreur type » et les mesures connexes du « coefficient de variation » et de l’« intervalle de confiance » fournissent une indication de la taille de la variabilité d’échantillonnage.

L’erreur type et le coefficient de variation ne servent pas à mesurer les biais systématiques des données d’enquêtes qui pourraient avoir des répercussions sur les estimations. Ils sont plutôt fondés sur l’hypothèse que les erreurs d’échantillonnage suivent une distribution normale de probabilités. Sous réserve de cette hypothèse, il est possible d’estimer dans quelle mesure les divers échantillons qui ont le même plan et le même nombre d’observations pourraient aboutir à des résultats différents. Cela donne une idée de la marge d’erreur susceptible d’être comprise dans les estimations dérivées de notre échantillon unique.

Pour une description détaillée des mesures de la variabilité d’échantillonnage, voir A. Satin et W. Shastry, L’échantillonnage: un guide non mathématique, Statistique Canada, no 12-602F au catalogue.

8.2 Taille minimum des estimations destinées à la diffusion

De façon générale, plus l’échantillon est petit, plus la variabilité d’échantillonnage est grande. Parallèlement, les estimations concernant de petits sous-groupes de population sont moins fiables que celles relatives à des sous-groupes importants. La taille minimum admise des estimations, aussi appelée seuil de diffusion, permet de déterminer rapidement si une estimation peut être diffusée, avant d’appliquer les tests plus rigoureux qui reposent sur le coefficient de variation. Les seuils de diffusion sont calculés spécialement pour l’Enquête sur la sécurité financière, selon la taille et le plan de l’échantillon.

On doit respecter les seuils pour le compte non pondéré :

  • Compte non pondéré: Le nombre d’observations doit être d’au moins 25. Si le compte non pondéré est inférieur à 25, l’estimation pondérée ne devrait pas être diffusée, peu importe la valeur de son coefficient de variation.

8.3 Test d’hypothèse compris dans les progiciels statistiques

Nous rappelons aux utilisateurs de microdonnées que les résultats des tests d’hypothèse (par exemple, valeurs de p du test t ou statistiques de Pearson) fournis automatiquement par les progiciels de statistiques courants sont erronés lorsque les données analysées proviennent d’enquêtes complexes comme l’ESF. Ces progiciels supposent au départ qu’on a procédé à un échantillonnage aléatoire simple; ils ne tiennent pas compte des caractéristiques spéciales du plan de sondage de l’ESF comme la stratification, la mise en grappes et les probabilités inégales de sélection. Nombre de progiciels courants tiennent compte des probabilités inégales de sélection en autorisant le recours à la pondération pour la production des estimations, mais ils ne prennent pas correctement en compte le plan de sondage lors du calcul des estimation de la variance, un élément essentiel de la plupart des tests statistiques.

Pour effectuer des tests d’hypothèses, il existe une méthode en deux étapes qui s’appuie sur les progiciels de statistiques courants pour calculer les paramètres du test. Il s’agit d’abord d’estimer les caractéristique d’intérêt en utilisant les poids fournis dans les fichiers de microdonnées, puis d’obtenir des estimations de la variance approximative de ces caractéristiques en utilisant le progiciel comme pour produire les estimations des caractéristiques, mais en appliquant cette fois un poids relatif correspondant au quotient du poids original par la moyenne des poids originaux de l’ensemble des observations utilisées pour les calculs. Les données obtenues dans ces deux étapes peuvent alors être combinées pour calculer les paramètres du test. Il convient cependant de noter que cette méthode ne donne que des estimations approximatives de l’erreur type.

Il convient de noter qu’il n’est pas facile pour les utilisateurs du FMGD de l’ESF d’obtenir de meilleures estimations de la variance fondée sur le plan de sondage en utilisant des progiciels conçus spécifiquement pour les données d’enquête. Les données sur le plan de sondage qui seraient nécessaires à cette fin ne sont en effet toujours pas disponibles dans les fichiers de données de l’ESF pour des raisons de confidentialité. Toutefois, on peut obtenir de Statistique Canada, contre recouvrement des coûts, de meilleures estimations de la variance.