Annexe A Concepts et méthodes

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Objectifs

On peut recueillir, à partir d'une vaste gamme d'enquêtes, une masse de renseignements sur la situation des travailleurs, et plus précisément sur les salaires et les disparités salariales, la stabilité d'emploi et les mises à pied, la formation, la création d'emplois et le chômage. En règle générale, les chercheurs comprennent bien la situation des employés et des employeurs. Ce qui manque, c'est le couplage de ces deux niveaux d'analyse au moyen de microdonnées. L'EMTE est la seule source de données au pays qui permet d'étudier les changements touchant les employés et de lier ces changements à ce qui se produit dans les entreprises, et vice-versa. Nous devons établir un tel lien si nous voulons comprendre la relation entre la transformation du marché du travail et les pressions qui émanent de la concurrence mondiale, des changements organisationnels, des progrès technologiques et des efforts visant à accroître le capital humain.

L'objectif premier de l'EMTE est donc de faire le lien entre ce qui se passe dans les milieux de travail et la situation des travailleurs. Le deuxième objectif de l'enquête est de nous permettre de mieux comprendre les forces qui façonnent les entreprises en cette période de profonde mutation.

Par sa conception même, l'EMTE comporte deux volets :

  • une enquête sur les milieux de travail, qui couvre diverses questions comme l'adoption de technologies, les changements organisationnels, la formation et d'autres pratiques en matière de ressources humaines, les stratégies d'entreprise et la dynamique du marché du travail, pour n'en citer que quelques-unes;
  • une enquête auprès des employés au sein de ces mêmes milieux de travail, qui couvre notamment les salaires, les heures de travail, le genre de travail, le capital humain, l'utilisation des technologies et la formation.

Le schéma qui suit illustre le lien entre les caractéristiques des emplacements et celles des employés ainsi que les résultats obtenus par les emplacements et les employés.

Figure 1 : Cadre conceptuel de l'Enquête sur le milieu de travail et les employés

Description

Figure 1 : Cadre conceptuel de l'Enquête sur le milieu de travail et les employés

Taille des échantillons et taux de réponse

La première collecte de l'EMTE s'est déroulée à l'été 1999 (pour la composante des employeurs) et à l'automne (pour la composante des employés). Globalement, 6 351 emplacements et 24  597 employés ont pris part à l'enquête, ce qui représente des taux de réponse de 94 % et de 83 % respectivement. Les emplacements échantillonnés sont suivis au fil des ans, et l'ajout périodique de nouveaux emplacements à l'échantillon permet de maintenir un profil représentatif. Les employés sont suivis pendant deux ans, et un nouvel échantillon d'employés est prélevé tous les deux cycles d'enquête (c'est-à-dire lors du premier cycle de l'enquête, du troisième, du cinquième). Cette dimension longitudinale permet aux chercheurs de cerner à la fois la situation des employeurs et celle des employés au fil du temps dans un milieu de travail en évolution. Pour 2005, le tableau A.1 fait état de la taille des échantillons et de l'effectif estimatif des populations, et le tableau A.2 présente les taux de réponse obtenus.

Population cible

La population cible de la composante des employeurs est formée de tous les emplacements exploités au Canada et ayant des employés rémunérés, à l'exception des suivants :

  • les emplacements au Yukon et dans les Territoires du Nord-Ouest;
  • les emplacements des secteurs de la culture agricole et de l'élevage; de la pêche, de la chasse et du piégeage; les organismes religieux; les ménages privés; et les administrations publiques.

La population cible de la composante des employés est constituée de tous les employés travaillant dans les emplacements visés et qui reçoivent un feuillet T-4 supplémentaire de l'Agence canadienne des douanes et du revenu.

Population observée

La population observée est le regroupement de toutes les unités pour lesquelles l'enquête peut, de façon réaliste, fournir de l'information. Des difficultés opérationnelles quant à l'identification de toutes les unités appartenant à la population cible peuvent entraîner des écarts entre la population observée et la population cible.

L'échantillon de l'EMTE est tiré du Registre des entreprises (RE), tenu par Statistique Canada, et de listes d'employés fournies par les employeurs visés par l'enquête. Le Registre des entreprises est une liste de toutes les entreprises au Canada. Il est mis à jour chaque mois, à l'aide de données provenant de diverses enquêtes, de profils d'entreprises et de sources administratives.

Période référence

La période de référence de l'EMTE correspond essentiellement à la période de 12 mois se terminant au mois de mars de l'année d'enquête. Certaines questions dans la composante des employeurs couvrent la dernière période de rémunération du mois de mars de l'année d'enquête.

Plan de sondage

L'EMTE s'appuie sur deux bases de sondage. La base de sondage, soit la liste de toutes les unités pertinentes, sert à la conception et à la sélection de l'échantillon; elle fournit également les coordonnées des unités sélectionnées.

Composante des employeurs

La base de sondage de la composante des employeurs de l'EMTE a été créée à partir des renseignements figurant dans le Registre des entreprises de Statistique Canada.

Avant la sélection de l'échantillon, les emplacements apparaissant dans la base de sondage sont stratifiés en groupes relativement homogènes. Ces groupes, appelés strates, servent à la répartition et à la sélection de l'échantillon. La base de sondage de l'EMTE a été stratifiée selon les secteurs d'activité (14), les régions (6) et la taille des emplacements (3), laquelle est déterminée en fonction du nombre estimatif d'employés. Les limites des strates varient généralement d'une combinaison « secteur d'activité-région » à l'autre. Les limites d'inclusion d'une strate d'effectif particulière ont été calculées à l'aide d'une méthode fondée sur un modèle. L'échantillon a été sélectionné au moyen d'une répartition de Neyman.

Chaque unité d'échantillonnage se voit attribuer un poids d'échantillonnage (c'est-à-dire un facteur d'extension associé à chaque unité échantillonnée et permettant d'obtenir des estimations pour la population, à partir d'un échantillon). Par exemple, si deux unités sont sélectionnées aléatoirement en fonction de probabilités égales de sélection à partir d'une population de dix unités, alors chaque unité sélectionnée représente cinq unités de la population et se voit attribuer un poids d'échantillonnage de cinq.

Au premier cycle de l'EMTE, des données ont été recueillies auprès de 6 351 des 9 144 employeurs échantillonnés. Il s'agissait dans les autres cas d'emplacements ayant cessé leurs activités, d'emplacements en situation d'inactivité saisonnière, de sociétés de portefeuille ou d'unités hors du champ d'enquête. La plupart des non-répondants étaient des propriétaires-exploitants qui n'avaient pas de personnel rémunéré et qui possédaient un compte de retenues sur la paye.

Composante des employés

La base de sondage de la composante des employés de l'EMTE est créée à partir des listes d'employés mises à la disposition des intervieweurs par les employeurs sélectionnés. Vingt-quatre employés au maximum sont échantillonnés par une méthode probabiliste. Dans les emplacements comptant trois ou quatre employés, tous les employés sont sélectionnés.

Collecte des données

Toutes les opérations de collecte des données, de saisie des données, de vérification préliminaire et de suivi des non-répondants sont effectuées dans les bureaux régionaux de Statistique Canada. Les intervieweurs recueillent les données auprès des employeurs et des employés par des interviews téléphoniques assistées par ordinateur.

Vérification statistique et imputation

On s'emploie, dans le cadre de l'EMTE, à prévenir les erreurs ou l'enregistrement incorrect de valeurs pendant le processus de collecte des données. On procède, pour ce faire, à une vérification rigoureuse des données saisies dans l'application du questionnaire informatisé. À la suite de la collecte, les données sont soumises à une analyse poussée et à une vérification des rapports qui permettent de repérer les observations aberrantes au moyen de programmes robustes de détection de telles valeurs.

Les répondants qui ont choisi de ne pas participer à l'enquête (les cas de non-réponse totale) sont retirés, et les poids des autres unités sont révisés à la hausse pour préserver la représentativité de l'échantillon. Dans le cas des répondants qui n'ont pas fourni une réponse dans tous les champs à remplir (les cas de non-réponse partielle), une technique statistique appelée « imputation » permet d'attribuer des données en remplacement des valeurs manquantes tant pour les employeurs que pour les employés. Trois méthodes d'imputation sont utilisées : la méthode « hot deck » pondérée, la méthode des tendances, la méthode des rapports et la méthode déterministique.

Estimation

Les valeurs déclarées (ou imputées) pour chaque emplacement et chaque employé retenus dans l'échantillon sont multipliées par le poids qui leur est attribué, et la somme de ces valeurs pondérées sert à produire les estimations. Un poids initial correspondant à l'inverse de la probabilité initiale de sélection est attribué à chaque unité. Ces poids initiaux sont ensuite calibrés en fonction des totaux connus de la population. Ces poids ajustés sont ensuite utilisés pour calculer les estimations de moyennes ou de totaux pour diverses variables faisant l'objet de l'enquête.

Les variables pour lesquelles les totaux de la population sont connus sont appelées « variables auxiliaires ». Elles servent à calibrer les estimations de l'enquête pour en accroître la précision. Les données de chaque emplacement sont calibrées en fonction des totaux connus au niveau du secteur d'activité et de la région. La variable auxiliaire dans le cadre de l'EMTE est le nombre total d'employés, établi à partir des données de l'Enquête sur l'emploi, la rémunération et les heures.

Qualité des données

Toutes les enquêtes sont sujettes à l'erreur. Bien que des efforts considérables soient déployés pour assurer le respect de normes élevées dans toutes les opérations de l'enquête, les estimations sont inévitablement entachées d'une certaine marge d'erreur. Les erreurs sont attribuables à diverses causes et peuvent prendre diverses formes : recours à un échantillon plutôt qu'à un recensement complet, erreurs commises par le répondant ou l'intervieweur au moment de la collecte des données, erreurs de saisie des données, imputation d'une valeur cohérente mais inexacte, et d'autres encore.

Erreurs d'échantillonnage

L'importance réelle de l'erreur d'échantillonnage est inconnue; on peut cependant l'estimer à partir de l'échantillon à l'aide d'une mesure statistique appelée « erreur-type ». Lorsque l'erreur-type est exprimée en pourcentage de l'estimation, on l'appelle « erreur-type relative » ou « coefficient de variation ».

Erreurs non dues à l'échantillonnage

Certaines erreurs non dues à l'échantillonnage s'annulent d'elles-mêmes lorsqu'elles s'appliquent à un grand nombre d'observations, mais les erreurs systématiques (c'est-à-dire celles qui ne tendent pas à s'annuler) introduisent un biais dans les estimations. Par exemple, si les répondants tendent systématiquement à sous-estimer leurs ventes, l'estimation des ventes totales sera inférieure à la valeur réelle dans la population. Un tel biais ne se reflète pas dans les estimations de l'erreur-type. Lorsque la taille de l'échantillon augmente, l'erreur due à l'échantillonnage diminue. Il n'en va pas nécessairement de même pour l'erreur non due à l'échantillonnage.

Erreurs de couverture

Les erreurs de couverture surviennent lorsque la base de sondage ne représente pas adéquatement la population cible. Cela se produit lorsque certaines unités appartenant à la population cible sont exclues (sous-dénombrement) ou sont comptées plus d'une fois (surdénombrement). Par ailleurs, des unités hors du champ d'observation peuvent se retrouver dans la base de sondage (surdénombrement).

Erreurs de réponse

Les erreurs de réponse sont commises lorsqu'un répondant fournit des renseignements erronés parce qu'il interprète mal la question d'enquête ou parce qu'il ne dispose pas de l'information correcte, lorsqu'il donne de mauvais renseignements par inadvertance ou lorsqu'il hésite à fournir l'information juste. Les erreurs flagrantes risquent fort d'être détectées lors de la vérification, mais d'autres peuvent tout simplement passer inaperçues.

Erreurs de non-réponse

Les erreurs de non-réponse peuvent survenir lorsqu'un répondant ne répond à aucune question (nonréponse totale) ou ne répond qu'à certaines questions (non-réponse partielle). Ces erreurs peuvent avoir de graves conséquences lorsque les non-répondants sont systématiquement différents des répondants quant aux caractéristiques de l'enquête, lorsque le taux de non-réponse est élevé, ou lorsque ces deux situations se combinent.

Erreurs de traitement

Les erreurs qui surviennent durant le traitement des données sont une autre composante des erreurs non dues à l'échantillonnage. Les erreurs de traitement peuvent se produire lors de la saisie des données, du codage, de la vérification, de l'imputation, du traitement des valeurs aberrantes ou lors d'autres opérations de manipulation de données. Les erreurs de codage se produisent lorsqu'on attribue un code erroné à un champ, soit en raison d'une mauvaise interprétation des procédures de codage, soit en raison d'une erreur de jugement. Les erreurs de saisie surviennent lorsque des données sont mal interprétées ou lorsqu'elles sont saisies incorrectement.

Interprétation simultanée des mesures d'erreur

L'évaluation de la qualité des estimations doit se fonder sur un examen simultané de la mesure de l'erreur due à la non-réponse et du coefficient de variation. Plus le coefficient de variation est petit et plus la fraction de réponse est grande, plus la qualité de l'estimation publiée sera élevée.

Confidentialité

Les renseignements dont fait état la présente publication sont soumis à une vérification permettant d'assurer la confidentialité des réponses fournies par les répondants. Toute estimation susceptible de révéler l'identité d'un répondant particulier est déclarée confidentielle et n'est donc pas publiée.

Réponse et non-réponse

Le taux de réponse couvre toutes les unités répondantes qui ont fournit des renseignements utilisables à l'étape de la collecte des données.

Le taux de refus couvre les unités jointes, mais qui ont refusé de prendre part à l'enquête.