Publications

Statistique Canada : Lignes directrices concernant la qualité

Collecte, saisie et codage des données

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Portée et objet
Principes
Lignes directrices
Indicateurs de qualité
Bibliographie

Portée et objet

La collecte des données réfère à tout processus dont l'objectif est d'acquérir ou de faciliter l'acquisition des données. On procède à cette collecte en demandant et en obtenant des données pertinentes auprès de personnes ou d'organismes au moyen de procédés adéquats. Ces données sont envoyées à l'organisme statistique par le répondant (autodénombrement) ou par l'intervieweur. La collecte comprend également les opérations visant à puiser des renseignements dans des sources administratives qui peuvent, dans certaines circonstances, requérir la permission du répondant afin d'accéder à ses données administratives.

La saisie des données réfère à tout processus inscrivant l'information communiquée par le répondant sur support électronique. Lorsqu'il n'est pas automatisé, ce processus nécessite l'intervention d'employés, qui saisissent les données recueillies au clavier (commis à la saisie des données). Le codage des données réfère à tout processus qui attribue une valeur numérique à une réponse. Bien que fréquemment automatisée, cette étape requiert parfois l'intervention humaine (commis au codage des données), car elle peut demander de prendre des décisions complexes.

Grâce à son degré d'automatisation élevé, les opérations de collecte permettent d'accéder à des paradonnées, c'est-à-dire des informations liées au processus d'enquête. Il peut s'agir d'indicateurs attestant de la présence ou l'absence d'une unité dans un échantillon, de l'historique des appels et des visites, de l'historique des frappes (piste de vérification), du mode de collecte, d'informations administratives (p. ex. profil de l'intervieweur) et d'informations relatives au coût des opérations de collecte.

La collecte des données est plus qu'une source d'information; c'est aussi le principal lien entre l'organisme responsable de l'enquête et le grand public, qu'il faut convaincre d'y participer. La saisie et le codage des données permettent de produire des données formatées qui seront utilisées par tous les processus subséquents de l'enquête. Les opérations de collecte, de saisie et de codage des données accaparent une part importante du budget de l'enquête, car en plus de prendre du temps, elles requièrent des ressources humaines et matérielles considérables.

Principes

Les répondants représentent la ressource la plus précieuse d'un organisme de réalisation d'enquêtes. Chaque variable qui ne peut être obtenue d'autres sources existantes devient un fardeau pour le répondant. Il importe de réduire au minimum le temps et l'énergie qu'un répondant doit consacrer à fournir des données. De même, il est impératif de satisfaire les exigences relatives à la protection des renseignements personnels et à la sécurité à toutes les étapes de la collecte et du traitement des données. Compte tenu de leur forte incidence sur l'exactitude des données, les opérations collecte, de saisie et de codage devraient se faire à l'aide d'outils qui permettent de mesurer la qualité et le rendement.

Lignes directrices

Collecte des données

Pour bien planifier le processus de collecte, il faut déterminer les rôles et les responsabilités vis-à-vis tous les aspects de la collecte, incluant la stratégie de communication, la mise en œuvre, l'évaluation, la surveillance, la planification de mesures d'urgence et la sécurité.

Concevoir le processus de collecte de façon à alléger le fardeau du répondant, à réduire les coûts et à accélérer l'obtention des données les plus exactes possible. La collecte peut se faire au moyen d'autodénombrements, d'interviews téléphoniques ou d'interviews sur place, basées sur un questionnaire papier ou effectuées par voie électronique (c.-à-d. déclaration électronique des données (DED), Internet et interviews assistées par ordinateur). Pour réaliser plus facilement les objectifs établis en matière de conception, le recours à plus d'une méthode pendant le cycle de collecte peut s'avérer utile. Par exemple, la collecte peut débuter avec un autodénombrement basé sur un questionnaire papier ou accessible sur Internet, et se terminer avec une interview sur place. Dans le cas d'enquêtes à autodénombrement, il est possible de mettre en œuvre plusieurs stratégies au cours de la période de collecte afin d'encourager le retour des questionnaires (p. ex. envoi d'une fiche publicitaire avant la collecte de données, d'une lettre de présentation accompagnant le questionnaire ou d'une carte de rappel, rappel téléphonique ou visite sur place). Vérifier si certaines informations peuvent être acquises en consultant des dossiers administratifs plutôt qu'en recourant aux méthodes de collecte traditionnelles, plus coûteuses et parfois moins exactes. Envisager de recueillir des données dans le contexte d'une enquête supplémentaire à une enquête d'envergure. Cette approche permettrait non seulement de réduire les coûts d'enquête et le fardeau du répondant, mais aussi d'avoir accès à une mine de renseignements utiles à l'ajustement pour la nonréponse. Si possible, réaliser des études pilotes ou procéder à des essais pour évaluer et améliorer les opérations de collecte.

Établir des procédures et des mesures de contrôle des échantillons pour chaque étape de la collecte de données (p. ex. livraison et renvoi des questionnaires papier, suivi des lacunes ou incohérences et suivi des cas de nonréponse). Grâce à ces procédés, les gestionnaires de la collecte et les intervieweurs seront en mesure d'évaluer l'état d'avancement des opérations, et ce, à tout moment, car ils seront renseignés sur le statut des unités échantillonnées, du début à la fin de la collecte. Ces mesures de contrôle sont particulièrement importantes dans le cadre des enquêtes dont les modes de collecte sont multiples et qui passent d'un mode à l'autre (ou d'un centre de collecte à un autre). Des procédures de contrôle de l'échantillon sont aussi utilisées pour s'assurer que chaque unité échantillonnée franchit toutes les étapes de traitement requises (c.-à-d. la saisie et le codage) et que son statut final est répertorié. Il est possible d'évaluer l'efficacité de ces procédures grâce à des mesures de contrôle des échantillons.

Établir et entretenir de bonnes relations avec les répondants, afin d'obtenir des taux de réponse satisfaisants. Les mesures utiles à cet égard incluent, notamment, la promotion de l'enquête, l'envoi de lettres informant les répondants qu'ils ont été sélectionnés pour prendre part à l'enquête, la publication de statistiques clés pouvant inciter la participation de répondants (surtout pour les enquêtes longitudinales), l'adoption de stratégies facilitant la communication des informations destinées au public – sites Web, guide d'utilisation du questionnaire ou ligne d'information (surtout pour les enquêtes à autodénombrement) ou l'envoi d'une lettre remerciant les répondants de leur participation. Il s'agit là de mesures qui peuvent contribuer à sensibiliser les unités (individus ou organisations) sélectionnées dans l'échantillon à participer à l'enquête.

Lors de la collecte des données, veiller à choisir un moment opportun pour communiquer avec le répondant ou la personne désignée du ménage ou de l'organisme répondant. Laisser le répondant communiquer les données selon la méthode et dans le format qui lui conviennent ou qui conviennent à son organisme. Ce faisant, on contribue à l'augmentation des taux de réponse et de la qualité des renseignements obtenus auprès des répondants. Il faut parfois assouplir les modalités de déclaration pour alléger le fardeau du répondant et faciliter la collecte de données. Par exemple, on pourrait suggérer des modalités particulières aux entreprises qui participent à plusieurs enquêtes à la fois. Pour les ménages, lorsque ceci peut être considéré comme une option, il serait utile d'établir des règles permettant de choisir un répondant substitut lorsque le répondant ciblé n'est pas disponible.

Pour les interviews, choisir le moment opportun, pour appeler ou visiter les unités d'enquête, en se référant aux paradonnées produites lors des cycles précédents de l'enquête ou à celles d'une enquête similaire. Communiquer avec les répondants au moment qui leur convient le mieux et veiller à ce que le nombre d'appels ou de visites n'excède pas les limites acceptables. Établir un ordre de priorité des unités sélectionnées pour établir le contact et faire les entrevues. Ces priorités devraient permettre d'atteindre les tailles d'échantillon visées afin d'obtenir des estimations fiables pour chaque domaine d'intérêt. Ce procédé permettra de formuler des estimations suffisamment exactes (ayant un biais et une variance faibles) pour être diffusées. Concrètement, dans le cas des enquêtes-entreprises, cela signifie que la priorité serait accordée aux unités les plus importantes ou les plus influentes – au risque de négliger les petites. Pour les enquêtes-ménages, une priorité plus élevée devrait être assignée aux unités les moins susceptibles de répondre à un questionnaire. Il est possible, également, de recourir à la fonction de pointage pour établir des priorités. En ce qui concerne les interviews téléphoniques, se servir d'un système automatisé pour gérer l'ordonnanceur d'appels. Ces systèmes devraient aussi établir les priorités.

Les intervieweurs sont essentiels au succès de la collecte de données. Il faut donc développer avec soin les manuels et les activités de formation qui leur sont destinés. Cette pratique s'avère la meilleure approche pour obtenir des données de qualité (c.-à-d. un taux de réponse élevé et des réponses exactes), car on s'assure que les concepts et les sujets de l'enquête sont bien compris de tous et que les réponses aux questions sont, par conséquent, appropriées. Plusieurs approches sont possibles en matière de formation, de l'étude à domicile à l'apprentissage en classe, en passant par les interviews fictives ou sur place. Pendant la formation, il est important d'évaluer les compétences des intervieweurs afin de s'assurer qu'ils respectent une liste de critères préétablis (p. ex. la capacité de lire les questions de la façon dont elles sont écrites dans le questionnaire). Ce procédé permettra, en plus, de cerner les forces et les faiblesses de l'intervieweur, du point de vue de ses compétences, de lui faire part de commentaires et d'axer sa formation sur ses points faibles. La surveillance peut se faire sur place ou au moyen d'enregistrements, selon les ressources et le mode d'interview retenu. Consulter les intervieweurs et le personnel directement responsable des opérations de collecte afin de développer de meilleurs outils de formation. Il pourrait aussi s'avérer utile de faire un suivi auprès des répondants pour connaître leur point de vue sur le déroulement de l'interview.

Mener des recherches pour dépister les répondants et communiquer avec eux lorsque les coordonnées associées à leur nom, dans les unités d'enquête, ne semblent pas à jour. Le dépistage permet d'accroître les taux de réponse et de déterminer si l'unité échantillonnée est toujours admissible à l'enquête. Avant et pendant la collecte, procéder à la mise à jour des coordonnées en se servant des informations figurant dans les sources administratives (c.-à-d. fichiers téléphoniques, autres bases de sondage). Afin d'effectuer un dépistage de qualité, recueillir des renseignements supplémentaires au sujet de l'unité d'échantillonnage (p. ex. les noms d'autres membres de la famille, la relation, l'âge, etc.) pendant la collecte. Des informations supplémentaires provenant de connaissances locales peuvent également s'avérer utiles. Il est recommandé de former une équipe d'experts en dépistage lorsqu'il s'agit d'une enquête répétée ou d'une enquête dont la période de collecte s'étend sur plusieurs mois. Établir des mécanismes permettant aux répondants de faire la mise à jour de leurs coordonnées entre les cycles de l'enquête. Il peut s'agir, par exemple, de leur envoyer une carte d'« avis de changement d'adresse » en les priant de la faire parvenir au Bureau en cas de déménagement. Il est important, par ailleurs, de recueillir l'information obtenue lors du dépistage (p. ex. adresse électronique et numéro de cellulaire) car elle peut servir dans des cycles d'enquête subséquents.

Pour les enquêtes à autodénombrement, dès la réception des données, vérifier s'il y a des lacunes ou des incohérences en ce qui a trait à l'exactitude de l'information de couverture et à la qualité des données fournies. Dans certains cas, il peut être nécessaire d'effectuer des interviews de suivi (p. ex. lorsque beaucoup d'éléments sont manquants). Fixer l'ordre de telles interviews en fonction de l'importance statistique des unités touchées et des éléments manquants.

Compte tenu du fait que les enquêtes par autodénombrement tendent à engendrer des taux de réponse inférieurs, envisager de faire un suivi téléphonique auprès des non-répondants – ou de leur rendre visite – pour les convaincre d'y participer, ou en procéder à un interview. S'assurer d'informer rapidement le personnel de collecte de l'enregistrement des questionnaires retournés, afin d'éviter les suivis inutiles. Les suivis sont essentiels dans le cadre des enquêtes longitudinales, qui visent davantage le long terme, car leur échantillon risque une attrition cumulative (et éventuellement des biais) à chacun des cycles d'enquête, en cas de nonréponse. Le suivi appliqué aux unités non répondantes devrait respecter la démarche décrite au point précédent (enquêtes par interviews) pour la gestion des priorités. Il peut s'avérer utile de consulter des paradonnées (p. ex. nombre d'appels ou de visites) pour établir cet ordre de priorité.

À la fin de la collecte, communiquer avec un sous-échantillon ou l'ensemble des unités non répondantes (y compris les cas non résolus) afin de vérifier qu'elles sont bien admissibles à l'enquête (entreprise active ou non, logement occupé ou non, etc.). Si tel est le cas, il est recommandé d'obtenir une donnée essentielle – comme la taille de l'unité (revenu total de l'entreprise, taille du ménage, etc.) – pour l'ajustement de la nonréponse. Dans certains cas, il est possible de consulter des données administratives courantes sur l'ensemble des unités non répondantes pour obtenir cette information ou pour l'estimer.

Fournir des plans et des outils permettant de gérer activement la collecte de données en même temps qu'elle progresse. Il peut s'agir de comparer les efforts encourus pour la collecte aux résultats obtenus en utilisant des mesures de productivité (p. ex. nombre d'unités résolues, quotidiennement et au total) et des indicateurs des coûts (p. ex. heures de travail et dépenses liées aux déplacements de l'intervieweur, quotidiennement et au total). Lorsque comparés aux valeurs prévues, ces indicateurs aident également les gestionnaires à prendre de meilleures décisions pendant la période de collecte. Les indicateurs de productivité et de coût (par unité sélectionnée ou questionnaire complété) permettent aussi d'évaluer les coûts et l'effort additionnels à l'accroissement des taux de réponse plus particulièrement vers la fin de la collecte.

Il faut tout mettre en oeuvre pour garantir la confidentialité des données. Les employés étant en contact avec des données confidentielles doivent connaître les pratiques exemplaires liées à l'impression, à la manipulation et au classement des documents papier, ainsi qu'au traitement des fichiers électroniques. De même, ils doivent respecter les règles relatives à la diffusion de l'information.

Considérer la possibilité de lancer un programme visant la répétition des interviews afin d'évaluer l'exactitude des opérations de manière globale.
Étudier les paradonnées pour déterminer comment accroître l'efficacité et la rentabilité des opérations (p. ex. ordre des appels, moment idéal pour les rappels, nombre optimal d'appels ou de visites, etc.), afin d'améliorer les processus et pratiques de collecte actuels et futurs. Par exemple, on peut planifier le prochain cycle d'enquête en se fondant sur la répartition et la durée moyenne des interviews. La durée de l'interview permet d'évaluer, en partie, le fardeau du répondant, ainsi que la nécessité d'offrir de la formation additionnelle à un intervieweur (lorsque la durée de ses interviews s'éloigne considérablement de la moyenne).

Saisie de données

Concevoir le processus de collecte de façon à réduire les coûts, à accélérer l'obtention des données et à en garantir l'exactitude. Des données sont parfois saisies directement par le répondant (par exemple lors de l'utilisation d'Internet ou de la DED), ou par l'interviewer (au moyen d'ITAO ou d'IPAO). En procédant ainsi, on diminue considérablement les coûts liés à la saisie en même temps qu'on augmente sa rapidité, sans compter que l'exactitude des données peut s'accroître par l'intégration de règles de contrôle à l'application sur ordinateur. S'il est impossible de jumeler saisie et collecte, on peut confier la saisie à des préposés (entrée manuelle des données) ou l'automatiser (numérisation suivie d'une reconnaissance intelligente de caractères). Cette dernière option est préférable, car elle réduit les coûts et permet souvent d'améliorer l'exactitude des données.

Ceux qui mènent des ITAO ou IPAO, et qui saisissent et codent fréquemment des données pendant la collecte, devraient employer des outils et des méthodes de collecte normalisés (p. ex. écrans standard et questions normalisées), afin de faciliter leur travail et de limiter les risques d'erreurs de saisie. Il est possible de valider les entrées de données élémentaires et de corriger des erreurs potentielles, lors de la collecte, en intégrant des règles de contrôle au système de collecte (p. ex. erreurs de frappe, erreurs de réponse et éléments manquants).

Les préposés à la saisie des données sont essentiels au succès des opérations de saisie. Il faut s'assurer qu'ils possèdent la formation et les outils adéquats, d'où l'importance de préparer des documents et des activités de formation à leur intention, et de leur offrir des séances de formation. En plus d'améliorer les compétences des employés, ces mesures garantissent une saisie exacte des données. L'utilisation de méthodes de contrôle de la qualité est recommandée pour vérifier si le niveau d'exactitude des données saisies par les préposés correspond aux critères préétablis, et pour faire part de commentaires aux préposés à la saisie afin qu'ils améliorent leur rendement.

Que ce soit à partir de questionnaires papier ou d'images numérisées, la saisie manuelle des données entraîne parfois des erreurs de frappe. Procéder à des vérifications en ligne pour repérer les erreurs que l'opérateur de saisie des données peut corriger (c.-à-d. vérifications qui pointeront les erreurs de frappe). Enregistrer ces cas pour analyse et examen ultérieurs. Lorsque les circonstances le permettent, tester la saisie manuelle avant la réalisation de l'enquête.

Dans le cas d'une saisie de données automatisée, s'assurer que le questionnaire est conçu de façon à faciliter la numérisation et la reconnaissance intelligente de caractères.

Lorsqu'on recourt à la saisie automatisée, il se peut que des questionnaires ne puissent pas être numérisés, ou qu'ils le soient sans qu'on puisse en reconnaître les caractères. Lorsque des questionnaires sont endommagés ou mal numérisés, il est suggéré de recourir aux services d'une équipe de préposés à la saisie des données.

Il faut mettre à l'essai les systèmes automatisés de saisie des données qui sont basés sur la reconnaissance intelligente des caractères à partir d'images numérisées avant de les utiliser. Ces systèmes peuvent être à l'origine d'erreurs systématiques très élevées pour certaines données élémentaires. Envisager d'améliorer les algorithmes et leurs paramètres afin de réduire les taux d'erreur. Dans le cas des données élémentaires pour lesquelles les risques d'erreurs systématiques sont élevés, le recours aux services de préposés à la saisie des données est à considérer.

Il est également souhaitable de réquisitionner des préposés à la saisie des données afin qu'ils vérifient l'exactitude de la saisie automatique à partir d'un échantillon de l'enquête. Les résultats de cette évaluation permettront d'améliorer le processus.

Il est recommandé d'adopter des mesures de contrôle efficaces des systèmes pour garantir la sécurité des données saisies, leur transmission et leur manipulation, surtout lorsqu'on recourt aux nouvelles technologies (par ex., collecte des données par cellulaire ou Internet). Prévenir les pertes de données attribuables aux erreurs humaines ou aux défaillances de système, ainsi que la diminution de qualité, voire de crédibilité. Développer des procédures encadrant le processus de destruction des données qui ne sont plus nécessaires.

Codage des données

Concevoir le processus de codage de façon à réduire les coûts, à accélérer l'obtention des données et à en garantir l'exactitude. Des données élémentaires sont souvent précodées lors des collectes incluant des questions fermées. De toute évidence, cette approche diminue les coûts associés au codage et peut aussi augmenter l'exactitude. S'il est impossible d'y recourir, parce que la collecte inclut des questions ouvertes, il faut coder les données après la collecte, manuellement (préposés) ou automatiquement (en utilisant un système de codage automatisé par reconnaissance de textes). Cette dernière option est préférable, car elle permet souvent de réduire les coûts et d'améliorer l'exactitude des résultats.

Lors des opérations de codage manuelles, s'assurer de suivre les procédures de manière constante pour toutes les unités d'enquête, afin d'éviter, le plus possible, de commettre des erreurs. Il est souhaitable que ces opérations soient assistées par ordinateur. Autoriser le personnel ou les systèmes à soumettre les cas difficiles à un petit groupe d'experts en la matière. Centraliser le traitement, afin de réduire les coûts et de pouvoir bénéficier plus facilement des connaissances des experts. Étant donné que la collecte implique son lot d'imprévus, privilégier des processus flexibles pour pouvoir faire des changements, si les normes en matière d'efficacité le requièrent. Si possible, mettre le codage manuel à l'essai avant la réalisation de l'enquête.

Les préposés au codage des données sont essentiels au succès des opérations de codage. Il faut s'assurer qu'ils possèdent la formation et les outils adéquats, d'où l'importance de préparer des documents et des activités de formation à leur intention, et de leur offrir des séances de formation. En plus d'améliorer les compétences des employés, ces mesures garantissent un codage exact des données. L'utilisation de méthodes de contrôle de la qualité est recommandée pour vérifier si le niveau d'exactitude des données codées par les préposés correspond aux critères préétablis, et pour faire part de commentaires aux préposés au codage afin qu'ils améliorent leur rendement.

Lors du codage automatisé, créer des fichiers de référence et en faire la mise à jour, afin de maximiser le nombre de phrases reconnues par le système et de limiter les erreurs. Lorsqu'on opte pour le codage automatisé, il arrive souvent que des cas échappent au codage. Il est donc recommandé de recourir aux services d'une équipe de préposés au codage des données pour traiter ces cas.

Lors d'une enquête, les experts du codage des données devraient aussi procéder à l'évaluation d'un échantillon et vérifier l'exactitude des données codées automatiquement. Les résultats de cette évaluation peuvent servir à augmenter et améliorer le contenu des fichiers de référence utilisés pour le codage des données.

Contrôle de la qualité

Employer des méthodes de contrôle de la qualité statistique pour évaluer et améliorer la qualité des opérations de collecte, de saisie et de codage. Analyser ces méthodes, ainsi que leurs résultats, afin d'identifier les principales causes d'erreurs. Transmettre des rapports de rétroaction à ce sujet aux gestionnaires, au personnel, aux sujets matières spécialisés et aux méthodologistes. Utiliser les mesures de la qualité et de la productivité pour orienter la rétroaction destinée aux intervieweurs ou aux opérateurs, de même que pour repérer les éléments engendrant des erreurs lors de la conception des opérations de la collecte ou dans ses procédures de traitement. Les rapports doivent contenir des informations sur la fréquence et sur les sources des erreurs (voir Mudryk et coll., 1994, 1996 et 2002; Mudryk et Xiao, 1996). Il existe divers logiciels facilitant ce genre d'opérations, comme le Système d'analyse des données de contrôle de la qualité (SADCQ) et NWA Quality Analyst (voir Mudryk, Bougie et Xie, 2002).

Analyse rétrospective

Procéder à l'évaluation rétrospective des opérations de collecte, de saisie et de codage des données, puis consigner les résultats en vue d'usages futurs. Évaluer les méthodes employées et tirer des leçons afin d'améliorer chacune des composantes. Les études réalisées après l'enquête s'avèrent souvent utiles à cet égard.

Lors des processus d'enquête suivant la collecte, veiller à recueillir des informations indiquant si les outils et les procédures de collecte, de saisie et de codage nécessitent des améliorations, sur le plan de la qualité, en prévision des cycles d'enquête futurs. Par exemple, il se peut qu'on observe des indices suggérant l'existence d'un biais dans la réponse ou tout autre problème lié à la collecte, lors de la vérification ou de l'analyse des données.

Indicateurs de qualité

Principaux élément de la qualité : exactitude

L'incidence des opérations de collecte et de saisie des données (y compris le codage) sur la qualité et les coûts est directe et cruciale, car ces données sont les principaux intrants de l'organisme responsable de la réalisation de l'enquête, et sont souvent à l'origine des dépenses les plus importantes dans le cadre de l'enquête. Par conséquent, la qualité de ces opérations influe grandement sur celle du produit final, plus particulièrement sur le plan de l'exactitude

Les mesures de la qualité mises en place pendant la collecte des données permettent au gestionnaire de l'enquête de prendre des décisions concernant d'éventuelles modifications ou la restructuration du processus. Les mesures de la qualité les plus importantes sont les taux de réponse, les taux d'erreur de traitement, les taux de suivi et les taux de la nonréponse répartis selon la cause. Lorsqu'elles sont disponibles à tous les niveaux pour lesquels des estimations sont produites et à toutes les étapes du processus, ces mesures permettent d'évaluer le rendement et la qualité des données.

Taux de déclaration par personne interposée

Signaler les taux de déclaration par personne interposée (c.-à-d. le pourcentage de réponses fournies par un répondant autre que l'unité d'enquête sélectionnée) car ce sont des indicateurs d'erreurs de réponse potentielles.

Taux de nonréponse

Signaler les taux de nonréponse, car ce sont des indicateurs de biais de nonréponse. Les cas de nonréponse se divisent en plusieurs catégories, par exemple, l'impossibilité d'établir le contact avec le répondant, de son refus de répondre, de son absence temporaire, de problèmes techniques, d'obstacles linguistiques ou de l'état mental ou physique du répondant. Pour refléter l'incertitude liée à la couverture, la nonréponse d'une unité peut aussi se répartir entre les cas résolus (l'unité étant admissible à l'enquête) et les cas non résolus (l'admissibilité n'étant pas déterminée). Il faut indiquer les cas de nonréponse à certains éléments (p. ex. refus et « ne sait pas ») figurant dans les questions principales. Les taux de nonréponse relatifs à des éléments peuvent varier si l'information est recueillie au début ou vers la fin de la période de collecte (certains répondants exigeant davantage d'appels ou de visites). Qu'ils concernent une unité ou certains éléments, les taux de nonréponse peuvent être transmis en fonction du domaine d'intérêt à publier (ce qui en fait potentiellement aussi des critères de publication) et de la sous-population (c.-à-d. grandes et petites entreprises, adultes jeunes ou plus âgés, etc.) pour indiquer dans quelle mesure l'échantillon réel est représentatif de la population. Il est également possible de combiner le taux de nonréponse des unités avec celui enregistré pour des éléments particuliers afin de fournir le taux de nonréponse global par élément. Le taux de conversion des refus et le taux de conversion des cas dépistés (liés à des coordonnées erronées ou devenues désuètes) sont également des indicateurs utiles. Enfin, le taux de refus au premier contact peut être indiqué pour les enquêtes de nature plus délicate.

Erreurs imputables à l'admissibilité ou à l'inadmissibilité à l'enquête

Lorsqu'on mène une analyse approfondie afin d'évaluer l'exactitude du classement des unités non répondantes, durant la collecte, selon les critères d'admissibilité ou d'inadmissibilité (entreprises : actives ou inactives; logements : occupés ou non occupés), indiquer le taux d'unités classées comme étant admissibles alors qu'elles ne l'étaient pas, ainsi que le taux d'unités classées comme étant inadmissibles alors qu'elles étaient admissibles. Il peut être utile de produire ces taux en fonction des domaines d'intérêt mentionnés plus tôt.

Répartition des interviews selon leur durée moyennesuggestion distribution de la durée moyenne des interviews

Il faut répertorier la durée moyenne des interviews et leur répartition en fonction de la durée. Plus précisément, il importe de révéler le pourcentage d'interviews particulièrement brèves, car elles peuvent indiquer des problèmes afférents aux données déclarées. L'analyse de la durée d'une interview permet également d'évaluer, en partie, le fardeau du répondant.

Incidence du mode de collecte suggestion : effet de mode

L'« effet de mode » est un biais de mesure attribuable à la méthode de collecte des données. En principe, on peut le mesurer grâce à des modèles expérimentaux qui répartissent les unités d'échantillonnage de façon aléatoire entre deux groupes ou plus. Chaque groupe est enquêté en utilisant un mode de collecte différent. Tous les autres aspects touchant la conception de l'enquête sont contrôlés. Les différences obtenues dans la répartition des réponses entre les différents groupes peuvent alors être comparées et évaluées. D'autres méthodes, comme celles basées sur des scores de propension ou sur une analyse de régression, peuvent être utilisées pour évaluer l'incidence du mode de collecte lorsqu'il est impossible de recourir à des modèles expérimentaux.

Taux de rejet à la vérification

Indiquer le taux de rejet après vérification, ainsi que le nombre et le type de corrections apportées en fonction du domaine, du mode de collecte, du type de traitement, de la présence de données élémentaires et de la langue utilisée lors de la collecte. Ces informations permettent de mieux évaluer la qualité des données ainsi que l'efficacité de la fonction de vérification utilisée lors des opérations de collecte et de saisie. Les taux de rejet après vérification peuvent être répartis en fonction du motif du rejet : élément manquant, incohérence de l'élément déclaré par rapport aux valeurs normales de cet élément ou par rapport à d'autres éléments déclarés). Cette dernière composante est un indicateur d'erreur de mesure (c.-à-d. erreur de réponse + erreur de saisie).

Taux d'erreurs imputables à la saisie ou au codage

Faire état des taux d'erreurs de saisie ou de codage associés aux opérations manuelles ou automatisées. Lorsque l'enquête conjugue des opérations automatisées et manuelles, indiquer un taux composite. Il est possible de calculer les taux globaux ainsi que les taux obtenus en fonction du domaine, du mode de collecte, du type de traitement, de la présence de données élémentaires et de la langue utilisée lors de la collecte.

Bibliographie

Bethlehem, J., F. COBBEN et B. Schouten. 2008, « Indicateurs de la représentativité des réponses aux enquêtes », Recueil du Symposium international sur les questions de méthodologie 2008, Ottawa, Statistique Canada.

Couper, M.P., R.P. Baker, J. Bethlehem, C.Z.F. Clark, J. Martin, W.L. Nicholls II et J. O'Reilly. 1998. Computer Assisted Survey Information Collection, New York, Wiley-Interscience, 653 p.

Dielman, L. et M.P Couper. 1995. « Data Quality in a CAPI Survey : Keying Errors », Journal of Official Statistics, vol. 11, no2, p. 141 à 146.

DiLlman, D. A. 2007. Mail and Internet Surveys. The Tailored Design Method, New York, Wiley, 554 p.

Groves, R.M. 1989. Survey Errors and Survey Costs, New York, John Wiley and Sons, 620 p.

Groves, R.M., P. Biemer, L. Lyberg, J. Massey, W.L. Nicholls et J. Waksberg. 1988. Telephone Survey Methodology, New York, Wiley-Interscience, 608 p.

Groves, R.M. et S.G. HeeringA. 2006. « Responsive Design for Household Surveys : Tools for Actively Controlling Survey Errors and Costs », Journal of the Royal Statistical Society, série A, vol. 169, no3, p. 439 à 357.

Hunter, L. et J.-F. Carbonneau. 2005. « An Active Management Approach to Survey Collection », Recueil du Symposium international sur les questions de méthodologie 2005, Ottawa, Statistique Canada.

Laflamme, F., M. Maydan et A. Miller. 2008. « Using Paradata to Actively Manage Data Collection », Proceedings of the Section on Survey Research Methods, American Statistical Association.

Laflamme, F. et C. Mohl. 2007. « Research and Responsive Design Options for Survey Data Collection at Statistics Canada », Proceedings of the Section on Survey Research Methods, American Statistical Association.

Laflamme, F. 2008, « Recherche sur la collecte des données à l'aide de paradonnées à Statistique Canada », Recueil du Symposium international sur les questions de méthodologie 2008, Ottawa, Statistique Canada.

Laflamme, F. 2008. « Understanding Survey Data Collection Through the Analysis of Paradata at Statistics Canada », American Association for Public Opinion Research 63rd Annual Conference 2008. Proceedings of the Section on Survey Research Methods, American Statistical Association.

Lepkowski J.M. et coll. 2007. « Advances in Telephone Survey Methodology », Second International Conference on Telephone Survey Methodology 2006, Miami, Wiley Series in Survey Methodology Section, p. 363 à 367.

Lyberg, L., P. Biemer, M. Collins, E. de Leeuw, C. Dippo, N. Schwarz et D. Trewin. 1997. Survey Measurement and Process Quality, New York, Wiley-Interscience, 808 p.

Mudryk, W., M.J. Burgess, P. Xiao, 1996. « Quality control of CATI Operations in Statistics Canada », Proceedings of the Section on Survey Research Methods, American Statistical Association, p. 150 à 159.

Mudryk, W., B. Joyce, H. Xie, H. 2004. « Generalized Quality Control Approach For ICR Data Capture in Statistics Canada's Centralized Operations », European Conference on Quality and Methodology in Official Statistics, Federal Statistical Office Germany.

Rosenbraum P.R. et D.B. Rubin. 1983. « The Central Role of the Propensity Score in Observational Studies for Causal Effects », Biometrika, vol. 70, no1, p. 41 à 45.

StatistiQUE Canada. 1998a. « Politique d'information des répondants aux enquêtes », Manuel des politiques de Statistique Canada.

Statistique Canada. 2001d. Normes et lignes directrices pour la déclaration des taux de nonréponse. Rapport technique de Statistique Canada.

Statistique Canada. 2003. Méthodes et pratiques d'enquête, produit no 12-587-XIF au catalogue de Statistique Canada, Ottawa, 396 p.

Williams, K., C. Denyes, M. March et W. Mudryk. 1996. « Quality Measurement in Survey Processing », Recueil du Symposium international sur les questions de méthodologie 1996, Ottawa, Statistique Canada.

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche