Faire le pont entre les mégadonnées et la méthodologie d’échantillonnage : que sont les données « méga » et où le pont se trouve-t-il?

Articles et rapports : 12-001-X202500100009
Description : Le nombre d’utilisateurs de mégadonnées et la communauté de recherche sur les mégadonnées croissent rapidement. Les statisticiens en général semblent se diviser en deux groupes : ceux qui sont enthousiastes et ceux qui sont inquiets, voire carrément hostiles. Les mégadonnées représentent-elles également un grand pas en avant, qui ferait vraiment augmenter notre capacité à extraire des renseignements significatifs et une connaissance réelle des données? Les mégadonnées minimisent-elles l’inférence statistique traditionnelle comme nous la connaissons, en remplaçant la technique d’enquête par une option futuriste à faible coût? Dans le présent document, je vais tenter de mettre en lumière la relation complexe qui lie les mégadonnées à la méthodologie d’échantillonnage. En expliquant au départ les raisons pour lesquelles il devrait être intéressant d’évaluer les mégadonnées du point de vue d’un statisticien spécialiste de l’échantillonnage, je vais approfondir la définition plutôt ambiguë des mégadonnées et faire état de quelques considérations et points de vue très personnels sur le sujet. Au cours de ce processus, plusieurs questions ouvertes surgiront lors de la discussion d’une sélection personnelle d’idées traçables à travers le vaste ensemble de littérature sur la statistique portant sur les mégadonnées et la méthodologie d’échantillonnage. L’exposé portera sur différents aspects qui seront étudiés en fonction de neuf points clés. Il se conclura par une perspective tournée vers l’avenir sur un défi important auquel devront faire face de futurs travaux de recherche : la prise en compte des hypothèses solides nécessaires pour gérer les écarts par rapport à une collecte de données purement aléatoire.
Numéro d'exemplaire : 2025001
Auteur(s) : Mecatti, Fulvia
Produit principal : Techniques d'enquête
Format Date de sortie Informations supplémentaires
HTML juin 30 2025
PDF juin 30 2025