Les statistiques : le pouvoir des données!
Glossaire

Début du texte

Les définitions qui suivent visent à renseigner ceux qui ont des questions concernant certains termes utilisés en statistique , mais qui n'ont pas besoin d'une définition hautement technique. Ces définitions représentent parfois une grande simplification de notions très complexes. Pour obtenir des explications plus détaillées, vous pouvez consulter les références fournies sur la page Bibliographie.

A B C D E F G H I J K L M
N O P Q R S T U V W X Y Z

Définition de mots commencant par la lettre A

  • Approche participative

    Approche qui consiste à recueillir des renseignements provenant d’une vaste communauté d’utilisateurs et qui repose sur le principe selon lequel chaque citoyen est un expert dans son milieu.

Définition de mots commencant par la lettre B

  • Base de données

    Ensemble structuré d’éléments d’information, généralement sous forme de tables.

  • Boîte à moustaches

    Type de diagramme qui permet de visualiser le résumé en cinq nombres, soit le minimum, le quartile inférieur, la médiane, le quartile supérieur et le maximum. Synonymes : diagramme en boîte, diagramme de quartiles.

Définition de mots commencant par la lettre C

  • Codage de données

    Processus qui vise à assigner une valeur (un code) à une réponse. Le code peut être une valeur numérique ou une chaîne de caractère.

  • Coefficient de variation

    Rapport entre l’erreur type de l’estimation et la valeur moyenne de l’estimation sur l’ensemble des échantillons possibles.

  • Couplage d’enregistrements

    Processus par lequel des enregistrements ou des unités provenant de différentes sources de données sont réunis dans un seul fichier à l’aide d’identifiants non uniques, tels que des noms, des dates de naissance, des adresses et d’autres caractéristiques. Synonymes : appariement des données, jumelage des données, résolution d’entités.

Définition de mots commencant par la lettre D

  • Dispersion

    Mesure de l’étalement d’une distribution de données autour de la tendance centrale.

  • Distribution de fréquences

    Tableau ou graphique montrant combien de fois chaque valeur ou chaque intervalle de valeurs d’une variable apparaissent dans un ensemble de données.

  • Données

    Faits, chiffres, observations ou enregistrements qui peuvent se présenter sous la forme d’image, de son, de texte ou de mesure physique (distance, poids, longueur d’onde, etc.). Les données peuvent être collectées et traitées dans le but de tirer des conclusions.

  • Données administratives

    Données qui sont collectées par des organismes dans le cadre de leurs opérations quotidiennes.

  • Données agrégées

    Ensemble de données dans lequel un enregistrement est un résumé de plusieurs unités d’observation.

  • Données non structurées

    Données qui ne sont pas organisées selon un modèle prédéfini.

  • Données ouvertes

    Données structurées, directement exploitables par un ordinateur, qui sont partagées gratuitement et qui peuvent être utilisées sans restriction.

  • Données structurées

    Données qui sont organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d’information spécifique.

Définition de mots commencant par la lettre E

  • Écart interquartile

    Étendue du 50 % des données qui sont au centre de la distribution, c’est-à-dire la différence entre le quartile supérieur et le quartile inférieur.

  • Écart semi-interquartile

    Moitié de l’écart interquartile.

  • Écart-type

    Racine carrée de la variance.

  • Échantillon

    Sous-ensemble des unités d’une population.

  • Élément d’information

    Plus petite pièce d’information que l’on peut collecter d’une source d’information.

  • Enquête

    N’importe quelle activité de collecte d’information organisée et méthodique à propos des caractéristiques des unités d’une population. Le mot enquête est souvent utilisé pour faire référence à une enquête-échantillon, par opposition à un recensement.

  • Enquête-échantillon

    Enquête dont les données sont collectées seulement pour certaines unités d’une population cible.

  • Ensemble de données

    Regroupement de données qui ont en commun les définitions des unités d’observation et des variables. Synonyme : jeu de données.

  • Erreur due à l’échantillonnage

    Différence entre l’estimation dérivée d’une enquête par sondage et la vraie valeur qui serait obtenue si un recensement de la population entière était effectué dans les mêmes conditions.

  • Erreur non due à l’échantillonnage

    Toutes les sources d’erreur qui ne sont pas liées à l’échantillonnage.

  • Erreur type

    Racine carrée de la variance échantillonnale.

  • Étendue

    Différence entre la plus petite valeur (minimum) et la plus grande valeur (maximum).

Définition de mots commencant par la lettre F

  • Feuille de calcul

    Feuille de travail créée par un tableur, dans laquelle on entre des données et qui permet d’effectuer des calculs simples et complexes.

  • Fichier texte délimité

    Fichier texte utilisé pour stocker des données, dans lequel chaque ligne représente une unité et chaque ligne présente des champs séparés par un délimiteur. Les délimiteurs les plus communs sont la virgule, le point-virgule et la tabulation.

  • Fréquence

    Nombre de fois qu’une valeur apparaît dans un ensemble de données. Il peut également s’agir du nombre d’évènements ou d’items. Synonymes : compte.

  • Fournisseur de données

    Individus ou organisations qui collectent et traitent les données parce qu’ils ont besoin d’information, et qui rendent accessibles ces données aux utilisateurs des données.

Définition de mots commencant par la lettre I

  • Imputation des données

    Processus utilisé pour assigner des valeurs de remplacement aux valeurs manquantes, invalides ou incohérentes qui ont été identifiées lors de la vérification des données.

  • Information statistique

    Données qui ont été enregistrées, classées, organisées, reliées ou interprétées à l’intérieur d’un cadre conceptuel de sorte qu’une signification en a émergé. Synonyme : renseignement statistique.

  • Intervalle de confiance

    Intervalle de valeurs autour de l’estimation qui a une certaine probabilité d’inclure la vraie valeur de la mesure d’intérêt dans la population.

Définition de mots commencant par la lettre M

  • Marge d'erreur

    Moitié de la largeur de l’intervalle de confiance associé à une estimation.

  • Médiane

    Point milieu d’un jeu de données, de sorte que 50 % des unités ont une valeur inférieure ou égale à la médiane et 50 % des unités ont une valeur supérieure ou égale. Synonyme : deuxième quartile.

  • Mégadonnées

    Ensemble de données dont le nombre d’enregistrements et le nombre de variables sont si élevés qu’ils dépassent les capacités des logiciels traditionnels à traiter l’information en un temps raisonnable.

  • Métadonnées

    Données à propos des données, incluant la description des données, la propriété, les chemins d’accès, les droits d’accès, la qualité et d’autres informations pour les données mettre en contexte.

  • Microdonnées

    Ensemble de données dans lequel un enregistrement représente une seule unité d’observation.

  • Mode

    Pour les variables catégoriques ou discrètes, il s’agit de la valeur ou des valeurs qui correspondent à la fréquence maximale observée. Pour les variables continues, les intervalles de classe modale correspondent aux sommets de la distribution de fréquences. Lorsqu’il est unique, le mode est une mesure de tendance centrale.

  • Moissonnage du web

    Processus par lequel des renseignements sont recueillis et copiés à partir du web aux fins d’analyses ultérieures.

  • Moyenne

    Mesure de tendance centrale qui correspond à la somme de l’ensemble des valeurs divisée par le nombre de valeurs.

Définition de mots commencant par la lettre Q

  • Quartile inférieur

    Valeur au-dessous de laquelle se trouvent 25 % des données lorsqu’elles sont arrangées en ordre croissant. Synonyme : premier quartile.

  • Quartile supérieur

    Valeur au-dessous de laquelle se trouvent 75 % des données lorsqu’elles sont arrangées en ordre croissant. Synonyme : troisième quartile.

  • Question fermée

    Dans un questionnaire, une question fermée propose au répondant une liste de réponses prédéfinies et le répondant doit sélectionner une ou plusieurs réponses dans la liste.

  • Question ouverte

    Dans un questionnaire, une question ouverte donne au répondant l’occasion de répondre à la question dans ses propres mots.

  • Questionnaire

    Série de questions conçues pour l’obtention de renseignements sur un ou plusieurs sujets auprès d’un répondant.

Définition de mots commencant par la lettre R

  • Recensement

    En général, enquête qui vise à collecter des données pour toutes les unités d’une population. Les recensements sont également utilisés pour lister et dénombrer les unités d’une population.

  • Registre statistique

    Ensembles de données créés à des fins statistiques qui sont continuellement mises à jour avec des renseignements sur toutes les unités d’une population.

  • Renseignement statistique

    Voir Information statistique.

Définition de mots commencant par la lettre S

  • Saisie des données

    Processus qui permet de convertir les données dans un format exploitable par un ordinateur.

  • Source de données primaires

    Les données d’une source primaire ont été collectées dans le but de produire des statistiques et de l’information statistique.

  • Source de données secondaires

    Les données d’une source secondaire ont été collectées dans un but autre que celui de produire de l’information statistique.

  • Statistiques

    Type d’information obtenu en soumettant les valeurs à des opérations mathématiques.

Définition de mots commencant par la lettre T

  • Télédétection

    Acquisition à distance de renseignements à propos d’un objet ou d’un phénomène.

  • Tendance centrale

    Mesure de l’emplacement où se trouve le milieu ou le centre d’une distribution.

  • Traitement des données

    Transformation des données brutes, de façon à pouvoir les utiliser pour produire des estimations ou différentes analyses.

Définition de mots commencant par la lettre V

  • Valeur manquante

    Point de données vierge ou absent.

  • Variable

    Caractéristique mesurable qui peut prendre différentes valeurs.

  • Variable catégorique

    Caractéristique qui n’est pas quantifiable. Synonyme : variable qualitative.

  • Variable continue

    Variable numérique qui peut prendre un nombre infini de valeurs réelles possibles à l’intérieur d’un intervalle donné.

  • Variable discrète

    Variable numérique qui ne peut prendre qu’un nombre fini de valeurs réelles possibles à l’intérieur d’un intervalle donné. Les valeurs possibles peuvent être énumérées et comptées.

  • Variable nominale

    Variable catégorique qui décrit un nom, une étiquette ou une catégorie sans ordre naturel.

  • Variable numérique

    Caractéristique quantifiable dont les valeurs sont des nombres. Synonyme : variable quantitative.

  • Variable ordinale

    Variable catégorique dont les valeurs sont définies par une relation d’ordre entre les catégories possibles.

  • Variance

    Écart élevé au carré moyen entre chaque donnée et le centre de la distribution mesurée par la moyenne.

  • Variance échantillonnale

    Écart élevé au carré moyen entre une estimation et la moyenne des estimations de l’ensemble des échantillons possibles.

  • Vérification des données

    Application de contrôles pour détecter les entrées manquantes, invalides ou incohérentes ou pour indiquer les enregistrements de données qui sont potentiellement erronés.


Date de modification :