Pondération et estimation

Aide à l'ordre
entrées

Résultats

Tout (580)

Tout (580) (570 à 580 de 580 résultats)

  • Articles et rapports : 12-001-X197900254834
    Description : On propose en remplacement de la sélection directe de l’échantillon une autre solution qui, tout en maintenant l’efficacité au même niveau, simplifie les processus de sélection et d’estimation des variances dans un grand nombre de cas. Si n* représente la plus grande taille possible de l’échantillon prélevé selon une méthode qui donne à chaque unité une probabilité d’inclusion proportionnelle à la taille (pPT) à partir d’une population donnée de taille N, la méthode proposée suppose alors la sélection des unités m (= N - n*) en utilisant le schéma pPT et en retirant ces unités de la population de manière à ce que le reste soit un échantillon pPT d’unités n*; l’échantillon définitif des unités n est ensuite prélevé comme sous-échantillon à partir de l’ensemble restant. Cette méthode de sélection de l’échantillon pPT peut être considérée comme l’équivalent de l’EAS dans lequel il est bien connu que la partie « non échantillonnée » de la population et tout sous-échantillon de cette partie constituent également l’EAS de l’ensemble de la population, si l’on applique la procédure EAS. La méthode est très pratique dans les cas où m est inférieur à la taille réelle n de l’échantillon. De plus, elle présente un autre avantage pour les enquêtes permanentes, par exemple l’Enquête sur la population active du Canada (EPA) où il faut augmenter (ou diminuer) le nombre des unités primaires d’échantillonnage (UPE) après la sélection initiale de l’échantillon. La méthode est également intéressante dans le cas du renouvellement de l’échantillon. Le document présente les avantages et inconvénients du plan proposé. L’efficacité de la méthode y est aussi évaluée de façon empirique.
    Date de diffusion : 1979-12-15

  • Articles et rapports : 12-001-X197900100003
    Description : Deux méthodes d’estimation de la variance de réponse carrelée d’un estimateur d’enquête sont examinées à partir d’une comparaison théorique et d’une étude empirique. On examine ensuite la variance de ces estimateurs et les effets des observations détachées. Enfin, un estimateur amélioré est défini et évalué.
    Date de diffusion : 1979-06-15

  • Articles et rapports : 12-001-X197900100005
    Description : Dalenius (1950) et Glasser (1962) ont énoncé des règles approximatives de partage pour la stratification d’une population en un univers à tirage complet et un univers à tirage partiel. Ils ont exprimé la valeur seuil (qui marque la frontière entre les deux types d’univers) en fonction de la moyenne, du poids de l’échantillonnage et de la variance de la population. Leurs valeurs de partage ont été calculées à partir de l’hypothèse d’un échantillon aléatoire unique de taille n tiré sans remise d’une population de taille N.

    Ici, l’auteur a élaboré des règles de partage exactes et approximatives pour une situation semblable. Au lieu d’avoir la taille de l’échantillon, on dispose de la précision (coefficient de variation). Il est à noter que dans de nombreux cas d’échantillonnage le chercheur a un ensemble d’objectifs exprimés en fonction de la fiabilité et non de la taille de l’échantillon. Le résultat est particulièrement utile lorsqu’il s’agit de déterminer la limite de partage pour des échantillons tirés d’une population connue. Cette méthode est également utilisée dans le cas de l’estimation par quotient.
    Date de diffusion : 1979-06-15

  • Articles et rapports : 12-001-X197900100006
    Description : Dans un plan de sondage séquentiel, la proportion défectueuse de l’échantillon est en général un estimateur biaisé de la valeur de la population. L’auteur de l’article propose un estimateur sans biais, dont un estimateur sans biais de la variance est également défini. Les résultats sont appliqués à un problème d’estimation tiré du recensement de 1976.
    Date de diffusion : 1979-06-15

  • Articles et rapports : 12-001-X197800254833
    Description : Les petits entrepreneurs se plaignent de la quantité de formules qu’il leur faut remplir et ont tendance à accuser les responsables de la collecte des statistiques. Les dossiers administratifs constituent une autre source possible, mais il y manque souvent des renseignements essentiels aux enquêteurs.

    Le système d’imputation à l’aide des données fiscales a recours aux données fiscales recueillies par Revenu Canada auprès d’un grand nombre d’entreprises et aux données obtenues par sondage auprès d’un petit sous-ensemble de ces entreprises. Les données sur les entreprises qui ne font pas partie de l’échantillon du sondage sont imputées (estimées) par la méthode du hot-deck, certaines corrections étant apportées pour assurer le respect de diverses règles de validation. Les résultats d’une simulation semblent indiquer que cette méthode possède des propriétés statistiques raisonnables. Les estimateurs (des moyennes ou des totaux) sont sans biais, et leurs variances présentent des grandeurs comparables à celles des variances des estimateurs obtenus par la méthode du quotient.
    Date de diffusion : 1978-12-15

  • Articles et rapports : 12-001-X197800254835
    Description : On suggère dans cet article que certains estimateurs pourraient remplacer l’estimateur habituel basé sur l’échantillonnage avec probabilité proportionnelle à la taille dans le cas où la mesure de taille utilisée dans l’échantillonnage avec probabilité proportionnelle à la taille n’est pas corrélée avec la variable étudiée et où l’on dispose de données sur une autre variable supplémentaire (mesure de taille). On étudie les propriétés de ces estimateurs dans le contexte des modèles basés sur une population infinie, ainsi qu’empiriquement.
    Date de diffusion : 1978-12-15

  • Articles et rapports : 12-001-X197800154831
    Description : Une grande partie de la littérature sur l’échantillonnage se concentre sur l’effet que le plan d’échantillonnage utilisé pour rassembler des données dans une enquête porte sur les statistiques linéaires. Récemment, on a considéré davantage l’effet du plan d’échantillonnage sur les statistiques non linéaires. Le facteur le plus important qui empêche ces recherches a été le problème de l’estimation d’au moins les deux premiers moments de ces statistiques. Le présent article étudie le problème de l’estimation des variances des statistiques non linéaires des échantillons complexes, en considérant la littérature existante. On étudie les attributs de la statistique du chi carré calculée à partir d’un échantillon complexe pour tester des hypothèses de la qualité de l’ajustement ou d’indépendance. On développe des tests alternatifs et on étudie leurs attributs en faisant des expériences simulées.
    Date de diffusion : 1978-06-15

  • Articles et rapports : 12-001-X197800154833
    Description : La variance totale d’un estimateur dans une enquête comprend la variance due à l’échantillonnage, la variance due aux réponses simples et la variance due aux réponses corrélées. Ce dernier composant reflète la partie de la variance totale causée par une influence commune sur un groupe de répondants. Dans le cas du recensement canadien, on a adopté l’auto-énumération comme méthode générale d’énumération pour le Recensement de 1971. Un facteur en faveur de l’introduction de cette méthode était l’évidence, dans le Recensement de 1961, que la variance due aux réponses corrélées apportait une contribution importante à la variance totale des estimations du recensement. Le présent article, basé sur une étude faite en utilisant l’interpénétration des intervieweurs, compare les variances dues aux réponses corrélées des recensements de 1961, 1971 et 1976. Les résultats démontrent que, bien que la méthode d’auto-énumération adoptée pour le Recensement de 1971 n’ait pas enlevé complètement la variance due aux réponses corrélées, cette approche a considérablement réduit l’importance de cette composante de la variance pour presque toutes les caractéristiques examinées.
    Date de diffusion : 1978-06-15

  • Articles et rapports : 12-001-X197800154835
    Description : Les estimateurs d’échantillon en formation donnent des estimations de la valeur, dans la population, des caractéristiques qui ont été étudiées à partir d’un échantillon, en utilisant les totaux des rangées et des colonnes d’un tableau de contingence des caractéristiques qui ont été étudiées pour toutes les unités de la population. Dans cet article, on donne la variance asymptotique de l’estimateur du maximum de vraisemblance d’une caractéristique échantillonné, soumise aux contraintes marginales dudit tableau de contingence. À partir de cette variance, on peut calculer, dans une étude empirique, la diminution de l’efficacité des estimateurs d’échantillon en formation relatifs à l’estimateur du maximum de vraisemblance.
    Date de diffusion : 1978-06-15

  • Articles et rapports : 12-001-X197500254824
    Description :

    Madow (l968) a proposé un schéma d’échantillonnage à deux degrés suivant lequel le biais de réponse peut être éliminé des enquêtes par sondage en obtenant des valeurs « réelles » pour un sous-échantillon de l’échantillon original. Comme c’est souvent le cas aux recensements ou aux enquêtes en cours, les données des sous-échantillons ne servent pas à corriger les estimations de l’enquête principale, mais à évaluer leur fiabilité. Ce document vise d’abord à présenter des méthodes permettant d’obtenir des estimations de fiabilité lorsque les valeurs « réelles » peuvent être établies pour un sous-échantillon d’unités.

    Date de diffusion : 1975-12-15
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (553)

Analyses (553) (0 à 10 de 553 résultats)

  • Articles et rapports : 18-001-X2024001
    Description : Cette étude applique l’estimation sur petits domaines (EPD) et un nouveau concept géographique appelé Zone de travail autonome (ZTA) à l'Enquête canadienne sur la situation des entreprises (ECSE) en mettant l'accent sur les opportunités de travail à distance sur les marchés du travail ruraux. Grâce à la modélisation EPD, nous avons estimé les proportions d'entreprises, classées par secteur industriel général (prestataires de services et producteurs de biens), qui offriraient principalement des opportunités de travail à distance à leur main-d'œuvre.
    Date de diffusion : 2024-04-22

  • Stats en bref : 11-001-X202411338008
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2024-04-22

  • Articles et rapports : 11-522-X202200100001
    Description : Le couplage d’enregistrements vise à mettre en évidence les paires d’enregistrements liées à la même unité et observées dans deux ensembles de données différents, disons A et B. Fellegi et Sunter (1969) proposent de mettre à l’essai chaque paire d’enregistrements, qu’elle soit générée à partir de l’ensemble de paires appariées ou non. La fonction de décision est le rapport entre m(y) et u(y), les probabilités d’observer une comparaison y d’un ensemble de k>3 variables d’identification clés dans une paire d’enregistrements, sous l’hypothèse que la paire constitue, respectivement, un appariement ou non. On estime habituellement ces paramètres au moyen de l’algorithme EM en utilisant comme données les comparaisons pour toutes les paires du produit cartésien ?=A×B. On émet l’hypothèse que ces observations (sur les comparaisons et sur l’état des paires comme appariement ou non) sont générées indépendamment des autres paires, hypothèse caractérisant la majeure partie de la littérature sur le couplage d’enregistrements et mise en œuvre dans les outils logiciels (p. ex., RELAIS, Cibella et coll. 2012). Au contraire, les comparaisons y et l’état d’appariement dans O sont dépendants de manière déterministe. Par conséquent, les estimations sur m(y) et u(y) fondées sur l’algorithme EM sont généralement mauvaises. Ce fait compromet l’efficacité de l’application de la méthode de Fellegi-Sunter, ainsi que le calcul automatique des mesures de la qualité et la possibilité d’appliquer des méthodes efficaces aux fins d’estimation du modèle sur des données couplées (p. ex. les fonctions de régression), comme dans Chambers et coll. (2015). Nous proposons d’examiner O au moyen d’un ensemble d’échantillons, chacun tiré de manière à préserver l’indépendance des comparaisons entre les paires d’enregistrements sélectionnées. Les simulations sont encourageantes.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100003
    Description : L’estimation à de fins niveaux d’agrégation est nécessaire pour mieux décrire une société. Les approches fondées sur un modèle d’estimation sur petits domaines qui combinent des données d’enquête parcimonieuses à des données riches provenant de sources auxiliaires se sont révélées utiles pour améliorer la fiabilité des estimations sur petits domaines. Nous examinons ici un scénario où des estimations basées sur un modèle pour petits domaines, produit à un niveau d’agrégation donné, devaient être désagrégées pour mieux décrire la structure sociale à des niveaux plus fins. Pour ce scénario, nous avons élaboré une méthode de répartition afin de mettre en œuvre la désagrégation, surmontant les problèmes associés à la disponibilité des données et à l’élaboration de modèles à des niveaux de cette finesse. La méthode est appliquée à l’estimation de la littératie et de la numératie des adultes au niveau du comté par groupe, au moyen des données du Programme pour l’évaluation internationale des compétences des adultes (PEICA) des États-Unis. Dans cette application, les groupes sont définis en fonction de l’âge ou de la scolarité, mais la méthode pourrait être appliquée à l’estimation d’autres groupes en quête d’équité.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100004
    Description : Conformément au Plan d’action sur les données désagrégées (PADD) à long terme de Statistique Canada, plusieurs initiatives ont été mises en œuvre dans l’Enquête sur la population active (EPA). Une des initiatives les plus directes fut une augmentation ciblée dans la taille de l’échantillon mensuel de l’EPA. En outre, un programme d’enquête supplémentaire régulier a été introduit, où une série supplémentaire de questions a été posée à un sous-ensemble de répondants de l’EPA et analysée dans un cycle de production mensuel ou trimestriel. Enfin, les estimations fondées sur les méthodologies de l’estimation sur petits domaines (EPD) sont réintroduites dans l’EPA et comprendront une portée élargie avec davantage de valeur analytique qu’auparavant. Le présent article donne un aperçu de ces trois initiatives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100005
    Description : Le lissage de la variance due à l’échantillonnage est un sujet important dans l’estimation sur petits domaines. Dans le présent article, nous proposons des méthodes de lissage de la variance due à l’échantillonnage aux fins d’estimation sur petits domaines. En particulier, nous considérons la fonction de variance généralisée et les méthodes d’effet de plan aux fins de lissage de la variance due à l’échantillonnage. Nous évaluons et comparons les variances dues à l’échantillonnage lissées et les estimations sur petits domaines fondées sur des estimations de la variance lissées au moyen de l’analyse de données d’enquête de Statistique Canada. Les résultats de l’analyse de données réelles indiquent que les méthodes de lissage de la variance due à l’échantillonnage proposées fonctionnent très bien pour l’estimation sur petits domaines.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100013
    Description : Les répondants des enquêtes auprès des ménages usuelles tendent à fortement sous-déclarer leur éventuel recours à l'aide alimentaire distribuée par les associations. Cette sous-déclaration est très vraisemblablement liée au stigmate social ressenti par les personnes dans une situation de très grandes difficultés financières. Les estimations du nombre de bénéficiaires de cette aide issues des enquêtes sont ainsi très inférieures aux décomptes directs des associations. Ces décomptes, eux, tendent à la surestimation en raison de doubles comptes. L'enquête Aide alimentaire (EAA) collectée fin 2021 en France dans un échantillon de sites d'associations distribuant de l'aide alimentaire permet, par son protocole adapté, de contrôler les biais qui affectent les autres sources et de clarifier l'ampleur du recours à cette aide.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100015
    Description : Nous présentons des estimateurs de type Horvitz-Thompson et de type multiplicité fondés sur le plan de sondage de la taille de la population, ainsi que du total et de la moyenne d’une variable de réponse associée aux éléments d’une population cachée à utiliser avec la variante d’échantillonnage par dépistage de liens proposée par Félix-Medina et Thompson (2004). Étant donné que le calcul des estimateurs nécessite de connaître les probabilités d’inclusion des personnes échantillonnées, mais qu’elles sont inconnues, nous proposons un modèle bayésien qui nous permet de les estimer et, par conséquent, de calculer les estimateurs des paramètres de population. Les résultats d’une petite étude numérique indiquent que les performances des estimateurs proposés sont acceptables.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100018
    Description : Le Programme d'élaboration de données sociales longitudinales (PEDSL) est une approche d'intégration des données sociales destinée à fournir des opportunités analytiques longitudinales sans imposer un fardeau de réponse supplémentaire aux répondants. Le PEDSL tire parti d'une multitude de signaux qui proviennent de différentes sources de données pour la même personne, ce qui permet de mieux comprendre leurs interactions et de suivre l'évolution dans le temps. Cet article traitera de la façon dont le statut d'ethnicité des personnes au Canada peut être estimé au niveau désagrégé le plus détaillé possible en utilisant les résultats d'une variété de règles opérationnelles appliquées aux données déjà appariées et au dénominateur du PEDSL puis montrera comment des améliorations ont pu être obtenues en utilisant des méthodes d'apprentissage automatique telles que des arbres de décision et des techniques de forêt aléatoire.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X202300200002
    Description : Il est essentiel de pouvoir quantifier l’exactitude (biais, variance) des résultats publiés dans les statistiques officielles. Dans ces dernières, les résultats sont presque toujours divisés en sous-populations selon une variable de classification, comme le revenu moyen par catégorie de niveau de scolarité. Ces résultats sont également appelés « statistiques de domaine ». Dans le présent article, nous nous limitons aux variables de classification binaire. En pratique, des erreurs de classification se produisent et contribuent au biais et à la variance des statistiques de domaine. Les méthodes analytiques et numériques servant actuellement à estimer cet effet présentent deux inconvénients. Le premier inconvénient est qu’elles exigent que les probabilités de classification erronée soient connues au préalable et le deuxième est que les estimations du biais et de la variance sont elles-mêmes biaisées. Dans le présent article, nous présentons une nouvelle méthode, un modèle de mélange gaussien estimé par un algorithme espérance-maximisation (EM) combiné à un bootstrap, appelé « méthode bootstrap EM ». Cette nouvelle méthode n’exige pas que les probabilités de classification erronée soient connues au préalable, bien qu’elle soit plus efficace quand on utilise un petit échantillon de vérification qui donne une valeur de départ pour les probabilités de classification erronée dans l’algorithme EM. Nous avons comparé le rendement de la nouvelle méthode et celui des méthodes numériques actuellement disponibles, à savoir la méthode bootstrap et la méthode SIMEX. Des études antérieures ont démontré que pour les paramètres non linéaires, le bootstrap donne de meilleurs résultats que les expressions analytiques. Pour presque toutes les conditions mises à l’essai, les estimations du biais et de la variance obtenues par la méthode bootstrap EM sont plus proches de leurs vraies valeurs que celles obtenues par les méthodes bootstrap et SIMEX. Nous terminons l’article par une discussion sur les résultats et d’éventuels prolongements de la méthode.
    Date de diffusion : 2024-01-03
Références (27)

Références (27) (0 à 10 de 27 résultats)

  • Enquêtes et programmes statistiques — Documentation : 98-306-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage, de pondération et d'estimation utilisées pour le Recensement de la population. Il fournit les justifications opérationnelles et théoriques et présente les résultats des évaluations de ces méthodes.

    Date de diffusion : 2023-10-04

  • Avis et consultations : 75F0002M2019006
    Description :

    En 2018, Statistique Canada a diffusé deux nouveaux tableaux de données présentant des estimations des taux d’imposition et de transfert effectifs des déclarants et des familles de recensement. Ces estimations sont tirées de la Banque de données administratives longitudinales. La publication fournit une description détaillée des méthodes utilisées pour produire les estimations des taux d’imposition et de transfert effectifs.

    Date de diffusion : 2019-04-16

  • Enquêtes et programmes statistiques — Documentation : 75F0002M2015003
    Description :

    Cette note porte sur les estimations révisées du revenu tirées de l’Enquête sur la dynamique du travail et du revenu (EDTR). Les révisions aux estimations de l’EDTR permettent de comparer les résultats de l’Enquête canadienne sur le revenu (ECR) à ceux des années précédentes puisqu’elles offrent une solution aux problèmes associés aux différences méthodologiques entre l’EDTR et l’ECR.

    Date de diffusion : 2015-12-17

  • Enquêtes et programmes statistiques — Documentation : 91-528-X
    Description :

    Ce manuel offre des descriptions détaillées des sources de données et des méthodes utilisées par Statistique Canada pour produire des estimations de la population. Elles comportent : les estimations postcensitaires et intercensitaires de la population; la population de départ; les naissances et les décès; l'immigration; les émigrations; les résidents non permanents; la migration interprovinciale; les estimations infraprovinciales de la population; les estimations de la population selon l'âge, le sexe et l'état matrimonial et les estimations des familles de recensement. Un glossaire des termes courants est inclus à la fin du manuel, suivi de la notation normalisée utilisée.

    Auparavant, la documentation sur les changements méthodologiques pour le calcul des estimations était éparpillée dans plusieurs publications et documents d'information de Statistique Canada. Ce manuel offre aux utilisateurs de statistiques démographiques un recueil exhaustif des procédures actuelles utilisées par Statistique Canada pour élaborer des estimations de la population et des familles.

    Date de diffusion : 2015-11-17

  • Enquêtes et programmes statistiques — Documentation : 13-605-X201500414166
    Description :

    Estimations de l’économie souterraine par province et territoire pour la période 2007 à 2012 sont maintenant disponibles pour la première fois. L’objet de cette note technique est d’expliquer comment la méthodologie utilisée afin de calculer les estimations de l’activité économique souterraine à la borne supérieure pour les provinces et les territoires diffère de celle utilisée afin de calculer les estimations nationales.

    Date de diffusion : 2015-04-29

  • Enquêtes et programmes statistiques — Documentation : 99-002-X2011001
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage et de pondération utilisées pour l’Enquête nationale auprès des ménages de 2011. Il fournit les justifications opérationnelles et théoriques et présente les résultats des études d'évaluation de ces méthodes.

    Date de diffusion : 2015-01-28

  • Enquêtes et programmes statistiques — Documentation : 99-002-X
    Description : Ce rapport donne une description des méthodes d'échantillonnage et de pondération utilisées pour l’Enquête nationale auprès des ménages de 2011. Il fournit les justifications opérationnelles et théoriques et présente les résultats des études d'évaluation de ces méthodes.
    Date de diffusion : 2015-01-28

  • Enquêtes et programmes statistiques — Documentation : 92-568-X
    Description :

    Ce rapport donne une description des méthodes d'échantillonnage et de pondération utilisées pour le Recensement de 2006. Il fournit un historique de l'application de ces méthodes aux recensements du Canada ainsi que les fondements opérationnels et théoriques de ces méthodes, et présente les résultats des études d'évaluation.

    Date de diffusion : 2009-08-11

  • Enquêtes et programmes statistiques — Documentation : 71F0031X2006003
    Description :

    Cet article est une introduction ainsi qu'une discussion sur les modifications apportées aux estimations de l'Enquête sur la population active en janvier 2006. Parmi ces modifications on retrouve notamment l'ajustement des estimations des chiffres de la population, des améliorations aux estimations des secteurs public et privé, ainsi que des mises à jour historiques de plusieurs petites agglomérations de recensement (AR).

    Date de diffusion : 2006-01-25

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2005002
    Description :

    Le présent document fournit un aperçu des différences entre l'ancienne et la nouvelle méthodologie de pondération, ainsi que des effets du nouveau système de pondération sur les estimations.

    Date de diffusion : 2005-06-30
Date de modification :