Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

1 facets displayed. 0 facets selected.

Enquête ou programme statistique

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (18)

Tout (18) (0 à 10 de 18 résultats)

  • Articles et rapports : 12-001-X201100111444
    Description :

    L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 11-522-X200800010975
    Description :

    Un problème important dans le domaine de la statistique officielle est l'accès à des mesures objectives permettant de prendre des décisions fondées sur des données factuelles. Istat a mis en place un système d'information en vue d'évaluer la qualité des enquêtes. Entre autres indicateurs standard de la qualité, les taux de non-réponse sont calculés et sauvegardés systématiquement pour toutes les enquêtes. Cette riche base d'information permet d'effecteur des analyses au cours du temps et des comparaisons entre enquêtes. Le présent article porte sur l'analyse des interdépendances entre le mode de collecte des données, ainsi que d'autres caractéristiques des enquêtes et la non-réponse totale. Une attention particulière est accordée à la mesure dans laquelle la collecte de données multimode améliore les taux de réponse.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800011003
    Description :

    Le but de la présente étude est d'examiner la possibilité d'élaborer des facteurs de correction pour rajuster les mesures de l'indice de masse corporelle fondées sur des données autodéclarées afin d'obtenir des valeurs plus proches de celles calculées d'après des données mesurées. Les données proviennent de l'Enquête sur la santé dans les collectivités canadiennes de 2005 (ESCC) dans le cadre de laquelle on a demandé aux répondants d'indiquer leur taille et leur poids, lesquels ont ensuite été mesurés. Des analyses par régression ont été effectuées pour déterminer quelles caractéristiques sociodémographiques et relatives à la santé sont associées aux écarts entre les valeurs fondées sur des données autodéclarées et des données mesurées. L'échantillon a ensuite été divisé en deux groupes. Pour le premier, on a procédé à la régression de l'indice de masse corporelle (IMC) fondé sur des données autodéclarées et des prédicteurs des écarts sur l'IMC fondé sur des données mesurées. Des équations de correction ont été établies en utilisant toutes les variables explicatives ayant un effet significatif au seuil de signification de p<0,05. Puis, ces équations de correction ont été testées dans le deuxième groupe afin de calculer des estimations de la sensibilité, de la spécificité et de la prévalence de l'obésité. La relation entre l'IMC fondé sur des données mesurées, déclarées et corrigées, d'une part, et les problèmes de santé liés à l'obésité, d'autre part, a été examinée par régression logistique. Les estimations corrigées ont produit des mesures plus exactes de la prévalence de l'obésité, de l'IMC moyen et des niveaux de sensibilité. Les données autodéclarées exagéraient la relation entre l'IMC et les problèmes de santé, tandis que dans la plupart des cas, les estimations corrigées produisaient des rapports de cotes plus semblables à ceux obtenus pour l'IMC fondé sur des données mesurées.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X20050019473
    Description :

    La communication donnera un bref aperçu de certaines techniques, en soulignant les avantages et les inconvénients de chacune, et en insistant particulièrement sur les types de données habituellement rencontrés dans les sciences sociales. L'aperçu traitera des méthodes naïves fondées sur l'utilisation de scores pour variables latentes et sur des méthodes visant à corriger et/ou à éviter les biais associés à ce genre d'analyse. La communication se conclura par une brève description de certaine applications récentes à la régression probit et logistique avec variables prédictives latentes, et par des suggestions de futurs travaux de recherche.

    Date de diffusion : 2007-03-02

  • Articles et rapports : 11-522-X20030017595
    Géographie : Canada
    Description :

    Dans cet article, on examine les défis que pose le dépistage des nouveaux immigrants ainsi que les stratégies mises en oeuvre pour augmenter les taux de réponse de l'Enquête longitudinale auprès des immigrants du Canada (ELIC). On présente également une technique assistée par modèle pour corriger la non-réponse, fondée sur l'approche proposée par Eltinge et Yanseneh pour définir les classes d'ajustement.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20030017598
    Description :

    Dans ce document, on examine certaines statistiques descriptives permettant d'évaluer la non-réponse à l'Enquête sur la population active (EPA) ainsi que des moyens d'améliorer la méthode courante d'ajustement pour la non-réponse.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030026777
    Description :

    L'enquête d'évaluation de l'exactitude et de la couverture a été réalisée pour estimer la couverture du Recensement des États-Unis de 2000. Après l'achèvement des opérations sur le terrain, il a fallu prendre des mesures pour traiter plusieurs types de données manquantes en vue d'appliquer l'estimateur à système dual. Certaines unités de logement n'avaient pas été interviewées. Le cas échéant, on a conçu deux méthodes de correction pour la non-interview d'après un même ensemble d'interviews, une pour chaque point dans le temps. En outre, il a fallu déterminer la situation de résidence, d'appariement ou de recensement de certains répondants. Les méthodes appliquées par le passé ont été remplacées pour pouvoir respecter les délais plus courts pour calculer et vérifier les estimations. Le présent article décrit la portée des données manquantes dans l'enquête et les méthodes de traitement appliquées, compare ces dernières à d'autres méthodes passées et courantes, et donne un résumé analytique des procédures, y compris la comparaison des estimations démographiques selon le système dual sous d'autres méthodes de traitement des données manquantes. Comme les niveaux de données manquantes étaient faibles, il semble que l'utilisation des autres méthodes n'aurait pas affecté considérablement les résultats. Cependant, on constate certains changements dans les estimations.

    Date de diffusion : 2004-01-27

  • Articles et rapports : 12-001-X20010026097
    Description :

    Par séries chronologiques compositionelles, on entend une série chronologique multivariée pour laquelle les valeurs de chaque série sont comprises entre les bornes zéro et un et la somme des séries est égale à l'unité à chaque point dans le temps. Des données présentant ces caractéristiques sont obtenues dans le cas d'enquêtes répétées, lorsque la réponse pour l'une des variables observées est multinomiale, mais que l'on s'intéresse à la proportion d'unités classées dans chacune des catégories. Dans ce cas, les estimations d'enquête représentent des proportions d'un tout subordonné à une contrainte de somme unitaire. Dans le présent article, nous employons une méthode espace-état pour modéliser la série chronologique compositionnelle d'après des enquêtes répétées en tenant compte des erreurs d'échantillonnage. Nous utilisons la transformation logistique additive pour être certains que les prédictions et les estimations du signal soient comprises entre zéro et un et satisfassent la contrainte de somme unitaire. Nous appliquons la méthode à des données compositionnelles provenant de l'Enquête sur la population active du Brésil. Nous obtenons des estimations du vecteur des proportions et des taux de chômage. En outre, nous produisons les composantes structurelles du vecteur de signaux, tels que les évènements saisonniers et les tendances.

    Date de diffusion : 2002-02-28

  • Articles et rapports : 12-001-X20010015858
    Description :

    L'objectif de cet article consiste à étudier et à mesurer le changement (du poids initial au poids final) qui est produit par la procédure de modification des poids. Une décomposition des poids finaux est proposée pour évaluer l'incidence relative de l'ajustement de non-réponse, la correction pour la poststratification et l'interaction entre ces deux ajustements. On utilise cette mesure de changement comme outil pour comparer l'efficacité de diverses méthodes d'ajustement pour la non-réponse, notamment les méthodes reposant sur la formation de groupes de réponse homogénes. La mesure de changement est étudiée par l'entremise d'une étude de simulation utilisant les données d'une enquête longitudinale de Statistique Canada, soit l'Enquête sur la dynamique du travail et du revenu. La mesure de changement est également appliquée aux données d'une deuxième enquête longitudinale, c'est-à-dire à l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 2001-08-22

  • Articles et rapports : 81-003-X19990045143
    Géographie : Canada
    Description :

    Dans cet article, on observe les différences régionales chez les étudiants qui ont abandonné leurs études universitaires ou collégiales.

    Date de diffusion : 2000-09-01
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (16)

Analyses (16) (0 à 10 de 16 résultats)

  • Articles et rapports : 12-001-X201100111444
    Description :

    L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 11-522-X200800010975
    Description :

    Un problème important dans le domaine de la statistique officielle est l'accès à des mesures objectives permettant de prendre des décisions fondées sur des données factuelles. Istat a mis en place un système d'information en vue d'évaluer la qualité des enquêtes. Entre autres indicateurs standard de la qualité, les taux de non-réponse sont calculés et sauvegardés systématiquement pour toutes les enquêtes. Cette riche base d'information permet d'effecteur des analyses au cours du temps et des comparaisons entre enquêtes. Le présent article porte sur l'analyse des interdépendances entre le mode de collecte des données, ainsi que d'autres caractéristiques des enquêtes et la non-réponse totale. Une attention particulière est accordée à la mesure dans laquelle la collecte de données multimode améliore les taux de réponse.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800011003
    Description :

    Le but de la présente étude est d'examiner la possibilité d'élaborer des facteurs de correction pour rajuster les mesures de l'indice de masse corporelle fondées sur des données autodéclarées afin d'obtenir des valeurs plus proches de celles calculées d'après des données mesurées. Les données proviennent de l'Enquête sur la santé dans les collectivités canadiennes de 2005 (ESCC) dans le cadre de laquelle on a demandé aux répondants d'indiquer leur taille et leur poids, lesquels ont ensuite été mesurés. Des analyses par régression ont été effectuées pour déterminer quelles caractéristiques sociodémographiques et relatives à la santé sont associées aux écarts entre les valeurs fondées sur des données autodéclarées et des données mesurées. L'échantillon a ensuite été divisé en deux groupes. Pour le premier, on a procédé à la régression de l'indice de masse corporelle (IMC) fondé sur des données autodéclarées et des prédicteurs des écarts sur l'IMC fondé sur des données mesurées. Des équations de correction ont été établies en utilisant toutes les variables explicatives ayant un effet significatif au seuil de signification de p<0,05. Puis, ces équations de correction ont été testées dans le deuxième groupe afin de calculer des estimations de la sensibilité, de la spécificité et de la prévalence de l'obésité. La relation entre l'IMC fondé sur des données mesurées, déclarées et corrigées, d'une part, et les problèmes de santé liés à l'obésité, d'autre part, a été examinée par régression logistique. Les estimations corrigées ont produit des mesures plus exactes de la prévalence de l'obésité, de l'IMC moyen et des niveaux de sensibilité. Les données autodéclarées exagéraient la relation entre l'IMC et les problèmes de santé, tandis que dans la plupart des cas, les estimations corrigées produisaient des rapports de cotes plus semblables à ceux obtenus pour l'IMC fondé sur des données mesurées.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X20050019473
    Description :

    La communication donnera un bref aperçu de certaines techniques, en soulignant les avantages et les inconvénients de chacune, et en insistant particulièrement sur les types de données habituellement rencontrés dans les sciences sociales. L'aperçu traitera des méthodes naïves fondées sur l'utilisation de scores pour variables latentes et sur des méthodes visant à corriger et/ou à éviter les biais associés à ce genre d'analyse. La communication se conclura par une brève description de certaine applications récentes à la régression probit et logistique avec variables prédictives latentes, et par des suggestions de futurs travaux de recherche.

    Date de diffusion : 2007-03-02

  • Articles et rapports : 11-522-X20030017595
    Géographie : Canada
    Description :

    Dans cet article, on examine les défis que pose le dépistage des nouveaux immigrants ainsi que les stratégies mises en oeuvre pour augmenter les taux de réponse de l'Enquête longitudinale auprès des immigrants du Canada (ELIC). On présente également une technique assistée par modèle pour corriger la non-réponse, fondée sur l'approche proposée par Eltinge et Yanseneh pour définir les classes d'ajustement.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20030017598
    Description :

    Dans ce document, on examine certaines statistiques descriptives permettant d'évaluer la non-réponse à l'Enquête sur la population active (EPA) ainsi que des moyens d'améliorer la méthode courante d'ajustement pour la non-réponse.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030026777
    Description :

    L'enquête d'évaluation de l'exactitude et de la couverture a été réalisée pour estimer la couverture du Recensement des États-Unis de 2000. Après l'achèvement des opérations sur le terrain, il a fallu prendre des mesures pour traiter plusieurs types de données manquantes en vue d'appliquer l'estimateur à système dual. Certaines unités de logement n'avaient pas été interviewées. Le cas échéant, on a conçu deux méthodes de correction pour la non-interview d'après un même ensemble d'interviews, une pour chaque point dans le temps. En outre, il a fallu déterminer la situation de résidence, d'appariement ou de recensement de certains répondants. Les méthodes appliquées par le passé ont été remplacées pour pouvoir respecter les délais plus courts pour calculer et vérifier les estimations. Le présent article décrit la portée des données manquantes dans l'enquête et les méthodes de traitement appliquées, compare ces dernières à d'autres méthodes passées et courantes, et donne un résumé analytique des procédures, y compris la comparaison des estimations démographiques selon le système dual sous d'autres méthodes de traitement des données manquantes. Comme les niveaux de données manquantes étaient faibles, il semble que l'utilisation des autres méthodes n'aurait pas affecté considérablement les résultats. Cependant, on constate certains changements dans les estimations.

    Date de diffusion : 2004-01-27

  • Articles et rapports : 12-001-X20010026097
    Description :

    Par séries chronologiques compositionelles, on entend une série chronologique multivariée pour laquelle les valeurs de chaque série sont comprises entre les bornes zéro et un et la somme des séries est égale à l'unité à chaque point dans le temps. Des données présentant ces caractéristiques sont obtenues dans le cas d'enquêtes répétées, lorsque la réponse pour l'une des variables observées est multinomiale, mais que l'on s'intéresse à la proportion d'unités classées dans chacune des catégories. Dans ce cas, les estimations d'enquête représentent des proportions d'un tout subordonné à une contrainte de somme unitaire. Dans le présent article, nous employons une méthode espace-état pour modéliser la série chronologique compositionnelle d'après des enquêtes répétées en tenant compte des erreurs d'échantillonnage. Nous utilisons la transformation logistique additive pour être certains que les prédictions et les estimations du signal soient comprises entre zéro et un et satisfassent la contrainte de somme unitaire. Nous appliquons la méthode à des données compositionnelles provenant de l'Enquête sur la population active du Brésil. Nous obtenons des estimations du vecteur des proportions et des taux de chômage. En outre, nous produisons les composantes structurelles du vecteur de signaux, tels que les évènements saisonniers et les tendances.

    Date de diffusion : 2002-02-28

  • Articles et rapports : 12-001-X20010015858
    Description :

    L'objectif de cet article consiste à étudier et à mesurer le changement (du poids initial au poids final) qui est produit par la procédure de modification des poids. Une décomposition des poids finaux est proposée pour évaluer l'incidence relative de l'ajustement de non-réponse, la correction pour la poststratification et l'interaction entre ces deux ajustements. On utilise cette mesure de changement comme outil pour comparer l'efficacité de diverses méthodes d'ajustement pour la non-réponse, notamment les méthodes reposant sur la formation de groupes de réponse homogénes. La mesure de changement est étudiée par l'entremise d'une étude de simulation utilisant les données d'une enquête longitudinale de Statistique Canada, soit l'Enquête sur la dynamique du travail et du revenu. La mesure de changement est également appliquée aux données d'une deuxième enquête longitudinale, c'est-à-dire à l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 2001-08-22

  • Articles et rapports : 81-003-X19990045143
    Géographie : Canada
    Description :

    Dans cet article, on observe les différences régionales chez les étudiants qui ont abandonné leurs études universitaires ou collégiales.

    Date de diffusion : 2000-09-01
Références (2)

Références (2) ((2 résultats))

  • Enquêtes et programmes statistiques — Documentation : 12-001-X20000015183
    Description :

    Pour les enquêtes dont la collecte des données comprend plus d'une étape, on recommande, comme méthode de correction des poids selon la non-réponse (après la première étape de la collecte des données), d'utiliser des variables auxiliaires (tirées des étapes antérieures de la collecte des données) qui sont reconnues comme des prédicteurs de la non-réponse.

    Date de diffusion : 2000-08-30

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015036
    Description :

    En tant que généralisation de la régression logistique, la régression logistique multivariée, introduite par Glonek et McCullagh (1995), facilite l'analyse des données longitudinales en acceptant les observations répétées et dépendantes d'une variable nominale ainsi que des jeux de réponses incomplets. L'auteur montre comment étendre cette méthode au traitement des données d'une enquête complexe et en fournit l'illustration grâce à l'Enquête sur la population active suisse. Il examine également l'incidence des poids d'échantillonnage sur l'estimation des paramètres et des erreurs-types.

    Date de diffusion : 1999-10-22
Date de modification :