3 Collecte et traitement des données
3.1 Planification

Début du texte

A priori, le déroulement d’une enquête pourrait simplement consister à poser des questions et à compiler les réponses pour obtenir des statistiques. Il faut cependant suivre des étapes précises afin que les résultats de l’enquête fournissent de l’information fiable et utile.

Au départ, les questions suivantes doivent être discutées :

  • Pourquoi mène-t-on cette enquête?
  • Qui fait l’objet de l’information à recueillir?
  • Qu’ai-je besoin de savoir?
  • Comment l’information sera-t-elle utilisée?
  • Quel degré d’exactitude et de fiabilité de l’information doit-on viser?

Pour réaliser un plan d’enquête, il faut prendre une foule de décisions sur les sujets ci-dessous, qui seront expliqués de façon plus détaillée dans la présente section.

  • Objectifs de l’enquête
  • Population cible
  • Besoins en données
  • Choix du type de collecte
  • Minimiser l’erreur
  • Taille de l’échantillon
  • Plan d’analyse
  • Conception du questionnaire
  • Méthodes de collecte de données
  • Plan de traitement de données
  • Contrôle de la qualité
  • Analyse et diffusion des résultats

Objectifs de l'enquête

Le plan d’enquête commence par des objectifs qui décrivent pourquoi et auprès de quelle population l’enquête doit être réalisée. Ces objectifs en disent long sur les données qui devront être recueillies. Ils aident aussi à cibler la population cible.

Exemple

Imaginons que le conseil étudiant de l’École secondaire Saint-Sauveur décide d’enquêter auprès des élèves afin d’obtenir de l’information pour les aider à planifier le bal des finissants. À partir de ce but général, on peut raffiner les objectifs. Disons que les objectifs sont les suivants :

  • Recueillir de l’information auprès des élèves afin de déterminer les facteurs qui feront du bal des finissants un succès. (On définit un succès d’après les critères suivants : le plus grand nombre d’élèves possibles viendront au bal et celui-ci comblera leurs attentes.)
  • Obtenir des données utiles qui serviront au comité organisateur du bal des finissants.

Le plan d’enquête démontre comment les objectifs de l’enquête seront atteints en décrivant clairement la population cible, les besoins en données et les variables qui seront mesurées, tout en prévoyant les questions et réponses possibles, ainsi que la manière dont les données seront traitées et analysées.

Population cible

Si l’objectif d’une enquête est d’obtenir de l’information auprès des élèves, par exemple, il faudra se demander « de quels élèves s’agit-il? » afin de définir la population cible.

Dans l’exemple décrit plus haut, le comité organisateur du bal voudra probablement consulter seulement les élèves qui prévoient être diplômés cette année, donc ceux qui fréquentent la dernière année du secondaire (secondaire 5 ou 12e année). Si certains d’entre eux étudient à temps partiel et ne prévoient pas terminer cette année, ils n’auront pas besoin d’être consultés. La population cible serait donc définie comme « les élèves de l’École secondaire Saint-Sauveur qui fréquentent le secondaire 5 à temps plein ».

Il arrive parfois que la population cible, c’est-à-dire la population au sujet de laquelle on souhaite recueillir de l’information, et la population observée, c’est-à-dire la population réellement couverte par l’enquête, soient différentes pour des raisons pratiques. Idéalement, les deux populations devraient être très similaires. Il est important de noter que les conclusions de l’enquête ne pourront être généralisées qu’à la population observée.

Dans notre exemple, il se peut que certains élèves de secondaire 5 à temps plein soient absents de l’école au moment de l’enquête. Puisqu’il serait trop difficile de rejoindre ces élèves pour les consulter, ils ne feraient donc pas partie de la population qui serait interrogée, même s’ils font partie de la population cible.

De plus, il est possible que certains concepts ou méthodes d’enquête ne soient pas appropriés pour certains segments de la population. Prenons par exemple une enquête sur les diplômés d’études postsecondaires dont l’objectif serait de déterminer s’ils ont trouvé un emploi et, le cas échéant, quel genre d’emploi ils ont décroché. Dans un tel cas, on pourrait exclure de la population cible les diplômés qui ont étudié dans des écoles spécialisées telles que les collèges militaires. Ces types de diplômés seraient presque certains d’obtenir un emploi dans leur domaine. Ainsi, la population cible pourrait comprendre seulement ceux qui ont obtenu un diplôme d’une université, d’un collège ou d’une école professionnelle.

Il peut aussi s’avérer nécessaire d’imposer des limites géographiques en omettant certaines parties de la population cible. Certaines régions pourraient être inaccessibles en raison des coûts de déplacement élevés ou autres difficultés. On peut imaginer, par exemple, qu’une entreprise faisant une enquête au moyen d’entrevues en personne voudrait tirer un échantillon dans des régions densément peuplées afin de minimiser les déplacements.

Besoins en données

Afin de définir les besoins en données, il faut se poser les questions suivantes : « Que veut-on savoir au juste? » et « Comment se servira-t-on de l’information recueillie? ».

Dans notre exemple, voici quelques questions que le comité organisateur pourrait considérer :

  • Faut-il savoir le nombre de personnes qui ont l’intention d’aller au bal? (On pourrait aussi le savoir d’après le nombre de billets vendus.)
  • Si l’on décide de demander aux élèves s’ils ont l’intention d’aller au bal, devrait-on poser des questions particulières à ceux qui ne prévoient pas y aller? En comprenant mieux leurs raisons de se désister, il serait possible de planifier des activités qui les intéressent, ce qui pourrait leur faire changer d’idée!
  • Pour connaître les préférences des élèves en ce qui concerne le bal, quels aspects veut-on considérer? Sans doute des éléments comme :
    • le coût du billet,
    • la musique,
    • le type de nourriture et de breuvages,
    • le jour de la semaine,
    • l’emplacement.
  • Y a-t-il d’autres facteurs à considérer? Les élèves veulent-ils un photographe? Est-ce que tous préfèrent un repas avant le bal dansant, ou certains veulent-ils uniquement un bal?
  • Les élèves voudraient-ils avoir des gardes de sécurité à l’entrée du bal? Quel moyen de transport prévoient-ils utiliser pour s’y rendre? (On pourrait considérer la location d’un autobus qui partirait d’un endroit central.)

Lorsque l’on planifie le contenu d’une enquête, il est tentant de vouloir recueillir le plus d’information possible. Cependant, plus il y a de questions, plus l’enquête prendra du temps et plus elle coûtera cher. Il faut se demander « A-t-on vraiment besoin de cette information? » tout en tenant compte du temps et des ressources nécessaires pour tester le questionnaire, traiter les données et analyser les résultats.

De plus, il faut tenir compte du fardeau de réponse afin de ne pas trop incommoder les répondants. Dans les enquêtes, le fardeau de réponse est affecté par :

  • le nombre de questions posées,
  • la nature délicate des questions posées,
  • le nombre de fois qu’on communique avec le répondant (lors d’une même enquête ou lors de plusieurs enquêtes),
  • le détail du renseignement demandé (par exemple, si on demande un revenu précis, le répondant doit consulter ses documents officiels, mais si on demande plutôt de choisir entre cinq tranches de revenu, il peut répondre plus facilement),
  • le temps qu’il faut pour remplir le questionnaire.

Choix du type de collecte

Le degré de précision et de détails de l’information que l’on vise à collecter ainsi que les ressources dont on dispose influencent le choix du type de collecte. Les avantages et inconvénients de chaque type ont été discutés précédemment dans la section sur les types de données.

Dans notre exemple, le comité organisateur peut choisir de faire un recensement de tous les finissants ou d’interroger un échantillon seulement de ce groupe.

Le type de collecte est souvent déterminé en fonction du budget alloué pour mener l’enquête. Les coûts représentent une des principales raisons de mener une enquête-échantillon au lieu d’un recensement. Grâce à l’échantillonnage, il est possible d’obtenir des résultats valables au moyen d’un échantillon relativement petit de la population cible. Par exemple, s’il faut obtenir des données sur tous les citoyens canadiens de 15 ans et plus, une enquête menée auprès d’un petit nombre de ces derniers (1 000 ou 2 000 personnes selon les besoins en données) pourrait fournir des résultats satisfaisants.

Un autre avantage de l’enquête-échantillon est qu’il permet de produire des données peu de temps après qu’un besoin d’information ait été identifié, selon un échéancier rapide. Par exemple, si un organisme veut mesurer le degré de sensibilisation du public à la suite de sa campagne publicitaire, il doit mener une enquête peu de temps après la réalisation de sa campagne. En utilisant un échantillon de la population cible, la durée de la collecte et du traitement des données est diminuée et davantage de temps est consacré à la planification de l’enquête et au contrôle de qualité.

Minimiser l’erreur

Lors de la planification, il faut prévoir les sources potentielles d’erreurs afin de les réduire le plus possible.

Dans une enquête-échantillon, la variation qui existe parmi différents échantillons cause une certaine incertitude qu’on appelle l’erreur due à l’échantillonnage. Par exemple, disons que vous estimez la distance moyenne entre la maison et l’école des élèves d’une classe de 25 élèves, à partir d’un échantillon de 5 élèves. Votre estimation dépendra de l’identité des 5 élèves échantillonnés. Si ceux-ci vivent tous très près de l’école, les résultats ne seront pas représentatifs de l’ensemble de la classe. C’est la variation d’un échantillon à l’autre qui cause l’erreur d’échantillonnage.

En général, plus il y a de personnes dans l’échantillon, plus l’erreur due à l’échantillonnage sera petite. Il est souvent possible d’estimer l’erreur associée à différentes méthodes d’échantillonnage pour ensuite tenter de la réduire.

En choisissant de faire un recensement, l’erreur liée à la variation dans l’échantillon est évitée, mais pas les autres sources d’erreurs, appelées les erreurs non dues à l’échantillonnage. Par exemple, une question pourrait être posée de façon à encourager une certaine réponse ou bien des erreurs pourraient survenir en traitant les données ou en calculant un pourcentage pour un tableau de données. Il faut éviter le plus possible ce type d’erreurs en portant attention au contrôle de qualité durant toutes les étapes de l’enquête.

Les deux types d’erreurs seront discutés plus en détail dans la sous-section consacrée à l’estimation.

Taille de l'échantillon

Puisque les enquêtes-échantillons sont toutes différentes, il n’existe pas de règles rigoureuses et universelles pour déterminer la taille d’un échantillon. Les facteurs décisifs sont l’échéancier, les coûts, les contraintes opérationnelles et la précision désirée des résultats. En évaluant chacun de ces facteurs, il est plus facile de prendre une décision par rapport à la taille de l’échantillon. De plus, il faut tenir compte du niveau acceptable d’erreur d’échantillonnage. S’il existe une caractéristique en particulier à mesurer qui est primordiale dans l’enquête et que des variations considérables de cette caractéristique sont observées au sein de la population, la taille de l’échantillon devra être plus grande afin d’obtenir une meilleure précision.

Plan d'analyse

Après avoir identifié tous les éléments ou variables à mesurer et préparé le plan d’échantillonnage, la prochaine étape consiste à élaborer le plan d’analyse. Il s’agit de concevoir les tableaux qu’il sera possible de produire à partir des variables de l’enquête. Ces tableaux ne contiendront pas encore de données, mais ils montreront les croisements proposés entre les variables.

Dans notre exemple, le comité organisateur pourrait concevoir des tableaux de résultats pour chaque variable prévue, présentés sous forme de nombre et de pourcentage (par exemple le nombre et le pourcentage d’élèves ayant préféré l’emplacement A et l’emplacement B pour le bal). Certains tableaux pourraient aussi présenter des croisements comme « La musique préférée selon le genre ».

Ces tableaux aident à vérifier si les questions prévues permettent de répondre aux objectifs de l’enquête. Ils illustrent de façon concrète comment l’information recueillie pourra être utilisée et comment elle constitue une réponse adéquate aux besoins en données.

Conception du questionnaire

Le questionnaire est développé à partir des besoins en données précédemment identifiés et du plan d’analyse qui a été développé. Pour formuler les questions, il est utile de consulter les utilisateurs des données et les experts en la matière ou d’examiner les questions d’autres enquêtes portant sur le même sujet ou sur des thèmes semblables. Les bonnes pratiques en matière de conception et de mise à l’essai des questionnaires seront discutées dans la sous-section consacrée à la collecte des données.

Méthodes de collecte de données

Le choix de la méthode pour recueillir les données aura des conséquences directes sur les coûts, les ressources matérielles et humaines, le temps requis pour mener l’enquête et pour évaluer la qualité des données. Une première option est l’entrevue, qui peut être faite sur place ou au téléphone, avec ou sans ordinateur. Une seconde option est le questionnaire à remplir soi-même, en format papier ou en format électronique.

L’entrevue en personne, qui est menée par un intervieweur qualifié, peut comporter des techniques de questionnement structuré ou non structuré. Lorsque l’entrevue se déroule au téléphone, les questions sont structurées au moyen d’un protocole formel.

Le questionnaire à remplir soi-même doit être très structuré puisque le répondant ne pourra pas obtenir autant d’aide qu’avec d’un intervieweur. Il retournera le questionnaire par la poste, par un autre mode ou encore il le complétera en ligne.

Dans notre exemple, le comité organisateur pourrait opter pour l’entrevue en personne assistée par ordinateur. Elle serait menée par des intervieweurs qui utiliseraient un ordinateur portable pour saisir les réponses des élèves à l’aide d’un questionnaire électronique. Si certains élèves s’inquiétaient en ce qui concerne la confidentialité de leurs réponses, l’intervieweur pourrait leur donner l’option de saisir eux-mêmes leurs réponses. Cependant, cette option pourrait causer un plus grand nombre d’erreurs et compromettre la qualité des données recueillies, ce qui augmenterait le temps consacré au traitement de données.

Plan de traitement de données

Il s’agit du processus servant à convertir les réponses du questionnaire en données de sortie. Les tâches à accomplir durant l’étape de traitement des données sont le codage, la saisie et la mise en forme des données, la vérification, l’imputation et la construction de variables dérivées. Bref, l’objectif de cette étape est de produire un fichier de données sans valeur invalide ou manquante qui pourra être utilisé pour l’estimation et l’analyse des données.

Contrôle de la qualité

Ce processus sert à repérer les erreurs et à vérifier les résultats. Malgré une planification et des essais rigoureux, il est impossible de prévoir toutes les difficultés d’une enquête. C’est pourquoi aucune enquête n’est parfaite. Les tâches de contrôle de la qualité sont nécessaires afin de réduire les erreurs non dues à l’échantillonnage qui se sont glissées à chaque étape de l’enquête. Ces tâches de contrôle incluent la formation des intervieweurs, l’essai des systèmes informatiques, le suivi auprès des non-répondants et la vérification des données recueillies et des données de sortie. Les programmes de contrôle statistique de la qualité visent à ce que le taux d’erreur soit réduit au minimum.

Analyse et diffusion des résultats

Après la collecte et le traitement des données, il faut prévoir les étapes de l’analyse et de la diffusion des résultats de l’enquête, c’est-à-dire :

  • organiser les données à l’aide de tableaux de distribution de fréquences,
  • résumer les données au moyen des mesures de tendance centrale et de dispersion,
  • présenter les données au moyen de différents types de diagrammes,
  • rédiger les conclusions de l’enquête pour ensuite les présenter au public et les publier.

Dans notre exemple, les membres du comité organisateur du bal pourraient se partager les tâches d’organisation et d’analyse des données et de rédaction des conclusions de l’enquête. Les décisions concernant le lieu du bal, le prix du billet, le type de musique, etc. seraient alors fondées sur ces conclusions. En publiant les faits saillants de l’enquête dans le journal de l’école, le conseil étudiant pourrait montrer que ses décisions sont basées sur les attentes exprimées par l’ensemble des élèves.

Les sections sur l’exploration et la visualisation des données présenteront certaines de ces étapes plus en détail.


Date de modification :