Les statistiques : le pouvoir des données!
Glossaire
Début du texte
Les définitions qui suivent visent à renseigner ceux qui ont des questions concernant certains termes utilisés en statistique , mais qui n'ont pas besoin d'une définition hautement technique. Ces définitions représentent parfois une grande simplification de notions très complexes. Pour obtenir des explications plus détaillées, vous pouvez consulter les références fournies sur la page Bibliographie.
Définition de mots commencant par la lettre A
-
Approche participative
Approche qui consiste à recueillir des renseignements provenant d’une vaste communauté d’utilisateurs et qui repose sur le principe selon lequel chaque citoyen est un expert dans son milieu.
Définition de mots commencant par la lettre B
-
Base de données
Ensemble structuré d’éléments d’information, généralement sous forme de tables.
-
Boîte à moustaches
Type de diagramme qui permet de visualiser le résumé en cinq nombres, soit le minimum, le quartile inférieur, la médiane, le quartile supérieur et le maximum. Synonymes : diagramme en boîte, diagramme de quartiles.
Définition de mots commencant par la lettre C
-
Codage de données
Processus qui vise à assigner une valeur (un code) à une réponse. Le code peut être une valeur numérique ou une chaîne de caractère.
-
Coefficient de variation
Rapport entre l’erreur type de l’estimation et la valeur moyenne de l’estimation sur l’ensemble des échantillons possibles.
-
Couplage d’enregistrements
Processus par lequel des enregistrements ou des unités provenant de différentes sources de données sont réunis dans un seul fichier à l’aide d’identifiants non uniques, tels que des noms, des dates de naissance, des adresses et d’autres caractéristiques. Synonymes : appariement des données, jumelage des données, résolution d’entités.
Définition de mots commencant par la lettre D
-
Dispersion
Mesure de l’étalement d’une distribution de données autour de la tendance centrale.
-
Distribution de fréquences
Tableau ou graphique montrant combien de fois chaque valeur ou chaque intervalle de valeurs d’une variable apparaissent dans un ensemble de données.
-
Données
Faits, chiffres, observations ou enregistrements qui peuvent se présenter sous la forme d’image, de son, de texte ou de mesure physique (distance, poids, longueur d’onde, etc.). Les données peuvent être collectées et traitées dans le but de tirer des conclusions.
-
Données administratives
Données qui sont collectées par des organismes dans le cadre de leurs opérations quotidiennes.
-
Données agrégées
Ensemble de données dans lequel un enregistrement est un résumé de plusieurs unités d’observation.
-
Données non structurées
Données qui ne sont pas organisées selon un modèle prédéfini.
-
Données ouvertes
Données structurées, directement exploitables par un ordinateur, qui sont partagées gratuitement et qui peuvent être utilisées sans restriction.
-
Données structurées
Données qui sont organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d’information spécifique.
Définition de mots commencant par la lettre E
-
Écart interquartile
Étendue du 50 % des données qui sont au centre de la distribution, c’est-à-dire la différence entre le quartile supérieur et le quartile inférieur.
-
Écart semi-interquartile
Moitié de l’écart interquartile.
-
Écart-type
Racine carrée de la variance.
-
Échantillon
Sous-ensemble des unités d’une population.
-
Élément d’information
Plus petite pièce d’information que l’on peut collecter d’une source d’information.
-
Enquête
N’importe quelle activité de collecte d’information organisée et méthodique à propos des caractéristiques des unités d’une population. Le mot enquête est souvent utilisé pour faire référence à une enquête-échantillon, par opposition à un recensement.
-
Enquête-échantillon
Enquête dont les données sont collectées seulement pour certaines unités d’une population cible.
-
Ensemble de données
Regroupement de données qui ont en commun les définitions des unités d’observation et des variables. Synonyme : jeu de données.
-
Erreur due à l’échantillonnage
Différence entre l’estimation dérivée d’une enquête par sondage et la vraie valeur qui serait obtenue si un recensement de la population entière était effectué dans les mêmes conditions.
-
Erreur non due à l’échantillonnage
Toutes les sources d’erreur qui ne sont pas liées à l’échantillonnage.
-
Erreur type
Racine carrée de la variance échantillonnale.
-
Étendue
Différence entre la plus petite valeur (minimum) et la plus grande valeur (maximum).
Définition de mots commencant par la lettre F
-
Feuille de calcul
Feuille de travail créée par un tableur, dans laquelle on entre des données et qui permet d’effectuer des calculs simples et complexes.
-
Fichier texte délimité
Fichier texte utilisé pour stocker des données, dans lequel chaque ligne représente une unité et chaque ligne présente des champs séparés par un délimiteur. Les délimiteurs les plus communs sont la virgule, le point-virgule et la tabulation.
-
Fréquence
Nombre de fois qu’une valeur apparaît dans un ensemble de données. Il peut également s’agir du nombre d’évènements ou d’items. Synonymes : compte.
-
Fournisseur de données
Individus ou organisations qui collectent et traitent les données parce qu’ils ont besoin d’information, et qui rendent accessibles ces données aux utilisateurs des données.
Définition de mots commencant par la lettre I
-
Imputation des données
Processus utilisé pour assigner des valeurs de remplacement aux valeurs manquantes, invalides ou incohérentes qui ont été identifiées lors de la vérification des données.
-
Information statistique
Données qui ont été enregistrées, classées, organisées, reliées ou interprétées à l’intérieur d’un cadre conceptuel de sorte qu’une signification en a émergé. Synonyme : renseignement statistique.
-
Intervalle de confiance
Intervalle de valeurs autour de l’estimation qui a une certaine probabilité d’inclure la vraie valeur de la mesure d’intérêt dans la population.
Définition de mots commencant par la lettre M
-
Marge d'erreur
Moitié de la largeur de l’intervalle de confiance associé à une estimation.
-
Médiane
Point milieu d’un jeu de données, de sorte que 50 % des unités ont une valeur inférieure ou égale à la médiane et 50 % des unités ont une valeur supérieure ou égale. Synonyme : deuxième quartile.
-
Mégadonnées
Ensemble de données dont le nombre d’enregistrements et le nombre de variables sont si élevés qu’ils dépassent les capacités des logiciels traditionnels à traiter l’information en un temps raisonnable.
-
Métadonnées
Données à propos des données, incluant la description des données, la propriété, les chemins d’accès, les droits d’accès, la qualité et d’autres informations pour les données mettre en contexte.
-
Microdonnées
Ensemble de données dans lequel un enregistrement représente une seule unité d’observation.
-
Mode
Pour les variables catégoriques ou discrètes, il s’agit de la valeur ou des valeurs qui correspondent à la fréquence maximale observée. Pour les variables continues, les intervalles de classe modale correspondent aux sommets de la distribution de fréquences. Lorsqu’il est unique, le mode est une mesure de tendance centrale.
-
Moissonnage du web
Processus par lequel des renseignements sont recueillis et copiés à partir du web aux fins d’analyses ultérieures.
-
Moyenne
Mesure de tendance centrale qui correspond à la somme de l’ensemble des valeurs divisée par le nombre de valeurs.
Définition de mots commencant par la lettre Q
-
Quartile inférieur
Valeur au-dessous de laquelle se trouvent 25 % des données lorsqu’elles sont arrangées en ordre croissant. Synonyme : premier quartile.
-
Quartile supérieur
Valeur au-dessous de laquelle se trouvent 75 % des données lorsqu’elles sont arrangées en ordre croissant. Synonyme : troisième quartile.
-
Question fermée
Dans un questionnaire, une question fermée propose au répondant une liste de réponses prédéfinies et le répondant doit sélectionner une ou plusieurs réponses dans la liste.
-
Question ouverte
Dans un questionnaire, une question ouverte donne au répondant l’occasion de répondre à la question dans ses propres mots.
-
Questionnaire
Série de questions conçues pour l’obtention de renseignements sur un ou plusieurs sujets auprès d’un répondant.
Définition de mots commencant par la lettre R
-
Recensement
En général, enquête qui vise à collecter des données pour toutes les unités d’une population. Les recensements sont également utilisés pour lister et dénombrer les unités d’une population.
-
Registre statistique
Ensembles de données créés à des fins statistiques qui sont continuellement mises à jour avec des renseignements sur toutes les unités d’une population.
-
Renseignement statistique
Voir Information statistique.
Définition de mots commencant par la lettre S
-
Saisie des données
Processus qui permet de convertir les données dans un format exploitable par un ordinateur.
-
Source de données primaires
Les données d’une source primaire ont été collectées dans le but de produire des statistiques et de l’information statistique.
-
Source de données secondaires
Les données d’une source secondaire ont été collectées dans un but autre que celui de produire de l’information statistique.
-
Statistiques
Type d’information obtenu en soumettant les valeurs à des opérations mathématiques.
Définition de mots commencant par la lettre T
-
Télédétection
Acquisition à distance de renseignements à propos d’un objet ou d’un phénomène.
-
Tendance centrale
Mesure de l’emplacement où se trouve le milieu ou le centre d’une distribution.
-
Traitement des données
Transformation des données brutes, de façon à pouvoir les utiliser pour produire des estimations ou différentes analyses.
Définition de mots commencant par la lettre V
-
Valeur manquante
Point de données vierge ou absent.
-
Variable
Caractéristique mesurable qui peut prendre différentes valeurs.
-
Variable catégorique
Caractéristique qui n’est pas quantifiable. Synonyme : variable qualitative.
-
Variable continue
Variable numérique qui peut prendre un nombre infini de valeurs réelles possibles à l’intérieur d’un intervalle donné.
-
Variable discrète
Variable numérique qui ne peut prendre qu’un nombre fini de valeurs réelles possibles à l’intérieur d’un intervalle donné. Les valeurs possibles peuvent être énumérées et comptées.
-
Variable nominale
Variable catégorique qui décrit un nom, une étiquette ou une catégorie sans ordre naturel.
-
Variable numérique
Caractéristique quantifiable dont les valeurs sont des nombres. Synonyme : variable quantitative.
-
Variable ordinale
Variable catégorique dont les valeurs sont définies par une relation d’ordre entre les catégories possibles.
-
Variance
Écart élevé au carré moyen entre chaque donnée et le centre de la distribution mesurée par la moyenne.
-
Variance échantillonnale
Écart élevé au carré moyen entre une estimation et la moyenne des estimations de l’ensemble des échantillons possibles.
-
Vérification des données
Application de contrôles pour détecter les entrées manquantes, invalides ou incohérentes ou pour indiquer les enregistrements de données qui sont potentiellement erronés.
- Date de modification :