Recherche par mot-clé

Résultats

Tout (18)

Tout (18) (0 to 10 of 18 results)

1. Estimation du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées Archivé
Articles et rapports : 12-001-X201100111444
Description :
L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.
Date de diffusion : 2011-06-29
2. Collecte de données multimode : que peut-on encore espérer? Archivé
Articles et rapports : 11-522-X200800010975
Description :
Un problème important dans le domaine de la statistique officielle est l'accès à des mesures objectives permettant de prendre des décisions fondées sur des données factuelles. Istat a mis en place un système d'information en vue d'évaluer la qualité des enquêtes. Entre autres indicateurs standard de la qualité, les taux de non-réponse sont calculés et sauvegardés systématiquement pour toutes les enquêtes. Cette riche base d'information permet d'effecteur des analyses au cours du temps et des comparaisons entre enquêtes. Le présent article porte sur l'analyse des interdépendances entre le mode de collecte des données, ainsi que d'autres caractéristiques des enquêtes et la non-réponse totale. Une attention particulière est accordée à la mesure dans laquelle la collecte de données multimode améliore les taux de réponse.
Date de diffusion : 2009-12-03
3. Correction des estimations de la prévalence de l'obésité fondées sur des données autodéclarées : pouvons-nous obtenir des valeurs plus proches de celles calculées au moyen de données mesurées? Archivé
Articles et rapports : 11-522-X200800011003
Description :
Le but de la présente étude est d'examiner la possibilité d'élaborer des facteurs de correction pour rajuster les mesures de l'indice de masse corporelle fondées sur des données autodéclarées afin d'obtenir des valeurs plus proches de celles calculées d'après des données mesurées. Les données proviennent de l'Enquête sur la santé dans les collectivités canadiennes de 2005 (ESCC) dans le cadre de laquelle on a demandé aux répondants d'indiquer leur taille et leur poids, lesquels ont ensuite été mesurés. Des analyses par régression ont été effectuées pour déterminer quelles caractéristiques sociodémographiques et relatives à la santé sont associées aux écarts entre les valeurs fondées sur des données autodéclarées et des données mesurées. L'échantillon a ensuite été divisé en deux groupes. Pour le premier, on a procédé à la régression de l'indice de masse corporelle (IMC) fondé sur des données autodéclarées et des prédicteurs des écarts sur l'IMC fondé sur des données mesurées. Des équations de correction ont été établies en utilisant toutes les variables explicatives ayant un effet significatif au seuil de signification de p<0,05. Puis, ces équations de correction ont été testées dans le deuxième groupe afin de calculer des estimations de la sensibilité, de la spécificité et de la prévalence de l'obésité. La relation entre l'IMC fondé sur des données mesurées, déclarées et corrigées, d'une part, et les problèmes de santé liés à l'obésité, d'autre part, a été examinée par régression logistique. Les estimations corrigées ont produit des mesures plus exactes de la prévalence de l'obésité, de l'IMC moyen et des niveaux de sensibilité. Les données autodéclarées exagéraient la relation entre l'IMC et les problèmes de santé, tandis que dans la plupart des cas, les estimations corrigées produisaient des rapports de cotes plus semblables à ceux obtenus pour l'IMC fondé sur des données mesurées.
Date de diffusion : 2009-12-03
4. Régression en deux étapes sur variables latentes revisitée Archivé
Articles et rapports : 11-522-X20050019473
Description :
La communication donnera un bref aperçu de certaines techniques, en soulignant les avantages et les inconvénients de chacune, et en insistant particulièrement sur les types de données habituellement rencontrés dans les sciences sociales. L'aperçu traitera des méthodes naïves fondées sur l'utilisation de scores pour variables latentes et sur des méthodes visant à corriger et/ou à éviter les biais associés à ce genre d'analyse. La communication se conclura par une brève description de certaine applications récentes à la régression probit et logistique avec variables prédictives latentes, et par des suggestions de futurs travaux de recherche.
Date de diffusion : 2007-03-02
5. Dépistage et ajustement pour la non-réponse dans l'Enquête longitudinale auprès des immigrants du Canada Archivé
Articles et rapports : 11-522-X20030017595
Géographie : Canada
Description :
Dans cet article, on examine les défis que pose le dépistage des nouveaux immigrants ainsi que les stratégies mises en oeuvre pour augmenter les taux de réponse de l'Enquête longitudinale auprès des immigrants du Canada (ELIC). On présente également une technique assistée par modèle pour corriger la non-réponse, fondée sur l'approche proposée par Eltinge et Yanseneh pour définir les classes d'ajustement.
Date de diffusion : 2005-01-26
6. Évaluation et ajustement pour la non-réponse à l'Enquête sur la population active du Canada Archivé
Articles et rapports : 11-522-X20030017598
Description :
Dans ce document, on examine certaines statistiques descriptives permettant d'évaluer la non-réponse à l'Enquête sur la population active (EPA) ainsi que des moyens d'améliorer la méthode courante d'ajustement pour la non-réponse.
Date de diffusion : 2005-01-26
7. Traitement des données manquantes dans l'enquête d'évaluation de l'exactitude et de la couverture de 2000 Archivé
Articles et rapports : 12-001-X20030026777
Description :
L'enquête d'évaluation de l'exactitude et de la couverture a été réalisée pour estimer la couverture du Recensement des États-Unis de 2000. Après l'achèvement des opérations sur le terrain, il a fallu prendre des mesures pour traiter plusieurs types de données manquantes en vue d'appliquer l'estimateur à système dual. Certaines unités de logement n'avaient pas été interviewées. Le cas échéant, on a conçu deux méthodes de correction pour la non-interview d'après un même ensemble d'interviews, une pour chaque point dans le temps. En outre, il a fallu déterminer la situation de résidence, d'appariement ou de recensement de certains répondants. Les méthodes appliquées par le passé ont été remplacées pour pouvoir respecter les délais plus courts pour calculer et vérifier les estimations. Le présent article décrit la portée des données manquantes dans l'enquête et les méthodes de traitement appliquées, compare ces dernières à d'autres méthodes passées et courantes, et donne un résumé analytique des procédures, y compris la comparaison des estimations démographiques selon le système dual sous d'autres méthodes de traitement des données manquantes. Comme les niveaux de données manquantes étaient faibles, il semble que l'utilisation des autres méthodes n'aurait pas affecté considérablement les résultats. Cependant, on constate certains changements dans les estimations.
Date de diffusion : 2004-01-27
8. Modélisation de séries chronologiques compositionnelles d'après des données d'enquêtes répétées Archivé
Articles et rapports : 12-001-X20010026097
Description :
Par séries chronologiques compositionelles, on entend une série chronologique multivariée pour laquelle les valeurs de chaque série sont comprises entre les bornes zéro et un et la somme des séries est égale à l'unité à chaque point dans le temps. Des données présentant ces caractéristiques sont obtenues dans le cas d'enquêtes répétées, lorsque la réponse pour l'une des variables observées est multinomiale, mais que l'on s'intéresse à la proportion d'unités classées dans chacune des catégories. Dans ce cas, les estimations d'enquête représentent des proportions d'un tout subordonné à une contrainte de somme unitaire. Dans le présent article, nous employons une méthode espace-état pour modéliser la série chronologique compositionnelle d'après des enquêtes répétées en tenant compte des erreurs d'échantillonnage. Nous utilisons la transformation logistique additive pour être certains que les prédictions et les estimations du signal soient comprises entre zéro et un et satisfassent la contrainte de somme unitaire. Nous appliquons la méthode à des données compositionnelles provenant de l'Enquête sur la population active du Brésil. Nous obtenons des estimations du vecteur des proportions et des taux de chômage. En outre, nous produisons les composantes structurelles du vecteur de signaux, tels que les évènements saisonniers et les tendances.
Date de diffusion : 2002-02-28
9. Mieux comprendre la transformation des poids à l'aide d'une mesure de changement Archivé
Articles et rapports : 12-001-X20010015858
Description : L'objectif de cet article consiste à étudier et à mesurer le changement (du poids initial au poids final) qui est produit par la procédure de modification des poids. Une décomposition des poids finaux est proposée pour évaluer l'incidence relative de l'ajustement de non-réponse, la correction pour la poststratification et l'interaction entre ces deux ajustements. On utilise cette mesure de changement comme outil pour comparer l'efficacité de diverses méthodes d'ajustement pour la non-réponse, notamment les méthodes reposant sur la formation de groupes de réponse homogénes. La mesure de changement est étudiée par l'entremise d'une étude de simulation utilisant les données d'une enquête longitudinale de Statistique Canada, soit l'Enquête sur la dynamique du travail et du revenu. La mesure de changement est également appliquée aux données d'une deuxième enquête longitudinale, c'est-à-dire à l'Enquête nationale longitudinale sur les enfants et les jeunes.
Date de diffusion : 2001-08-22
10. Facteurs déterminants du décrochage dans les universités et les collèges communautaires Archivé
Articles et rapports : 81-003-X19990045143
Géographie : Canada
Description :
Dans cet article, on observe les différences régionales chez les étudiants qui ont abandonné leurs études universitaires ou collégiales.
Date de diffusion : 2000-09-01

Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (17)

Analyses (17) (0 to 10 of 17 results)

1. Estimation du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées Archivé
Articles et rapports : 12-001-X201100111444
Description :
L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.
Date de diffusion : 2011-06-29
2. Collecte de données multimode : que peut-on encore espérer? Archivé
Articles et rapports : 11-522-X200800010975
Description :
Un problème important dans le domaine de la statistique officielle est l'accès à des mesures objectives permettant de prendre des décisions fondées sur des données factuelles. Istat a mis en place un système d'information en vue d'évaluer la qualité des enquêtes. Entre autres indicateurs standard de la qualité, les taux de non-réponse sont calculés et sauvegardés systématiquement pour toutes les enquêtes. Cette riche base d'information permet d'effecteur des analyses au cours du temps et des comparaisons entre enquêtes. Le présent article porte sur l'analyse des interdépendances entre le mode de collecte des données, ainsi que d'autres caractéristiques des enquêtes et la non-réponse totale. Une attention particulière est accordée à la mesure dans laquelle la collecte de données multimode améliore les taux de réponse.
Date de diffusion : 2009-12-03
3. Correction des estimations de la prévalence de l'obésité fondées sur des données autodéclarées : pouvons-nous obtenir des valeurs plus proches de celles calculées au moyen de données mesurées? Archivé
Articles et rapports : 11-522-X200800011003
Description :
Le but de la présente étude est d'examiner la possibilité d'élaborer des facteurs de correction pour rajuster les mesures de l'indice de masse corporelle fondées sur des données autodéclarées afin d'obtenir des valeurs plus proches de celles calculées d'après des données mesurées. Les données proviennent de l'Enquête sur la santé dans les collectivités canadiennes de 2005 (ESCC) dans le cadre de laquelle on a demandé aux répondants d'indiquer leur taille et leur poids, lesquels ont ensuite été mesurés. Des analyses par régression ont été effectuées pour déterminer quelles caractéristiques sociodémographiques et relatives à la santé sont associées aux écarts entre les valeurs fondées sur des données autodéclarées et des données mesurées. L'échantillon a ensuite été divisé en deux groupes. Pour le premier, on a procédé à la régression de l'indice de masse corporelle (IMC) fondé sur des données autodéclarées et des prédicteurs des écarts sur l'IMC fondé sur des données mesurées. Des équations de correction ont été établies en utilisant toutes les variables explicatives ayant un effet significatif au seuil de signification de p<0,05. Puis, ces équations de correction ont été testées dans le deuxième groupe afin de calculer des estimations de la sensibilité, de la spécificité et de la prévalence de l'obésité. La relation entre l'IMC fondé sur des données mesurées, déclarées et corrigées, d'une part, et les problèmes de santé liés à l'obésité, d'autre part, a été examinée par régression logistique. Les estimations corrigées ont produit des mesures plus exactes de la prévalence de l'obésité, de l'IMC moyen et des niveaux de sensibilité. Les données autodéclarées exagéraient la relation entre l'IMC et les problèmes de santé, tandis que dans la plupart des cas, les estimations corrigées produisaient des rapports de cotes plus semblables à ceux obtenus pour l'IMC fondé sur des données mesurées.
Date de diffusion : 2009-12-03
4. Régression en deux étapes sur variables latentes revisitée Archivé
Articles et rapports : 11-522-X20050019473
Description :
La communication donnera un bref aperçu de certaines techniques, en soulignant les avantages et les inconvénients de chacune, et en insistant particulièrement sur les types de données habituellement rencontrés dans les sciences sociales. L'aperçu traitera des méthodes naïves fondées sur l'utilisation de scores pour variables latentes et sur des méthodes visant à corriger et/ou à éviter les biais associés à ce genre d'analyse. La communication se conclura par une brève description de certaine applications récentes à la régression probit et logistique avec variables prédictives latentes, et par des suggestions de futurs travaux de recherche.
Date de diffusion : 2007-03-02
5. Dépistage et ajustement pour la non-réponse dans l'Enquête longitudinale auprès des immigrants du Canada Archivé
Articles et rapports : 11-522-X20030017595
Géographie : Canada
Description :
Dans cet article, on examine les défis que pose le dépistage des nouveaux immigrants ainsi que les stratégies mises en oeuvre pour augmenter les taux de réponse de l'Enquête longitudinale auprès des immigrants du Canada (ELIC). On présente également une technique assistée par modèle pour corriger la non-réponse, fondée sur l'approche proposée par Eltinge et Yanseneh pour définir les classes d'ajustement.
Date de diffusion : 2005-01-26
6. Évaluation et ajustement pour la non-réponse à l'Enquête sur la population active du Canada Archivé
Articles et rapports : 11-522-X20030017598
Description :
Dans ce document, on examine certaines statistiques descriptives permettant d'évaluer la non-réponse à l'Enquête sur la population active (EPA) ainsi que des moyens d'améliorer la méthode courante d'ajustement pour la non-réponse.
Date de diffusion : 2005-01-26
7. Traitement des données manquantes dans l'enquête d'évaluation de l'exactitude et de la couverture de 2000 Archivé
Articles et rapports : 12-001-X20030026777
Description :
L'enquête d'évaluation de l'exactitude et de la couverture a été réalisée pour estimer la couverture du Recensement des États-Unis de 2000. Après l'achèvement des opérations sur le terrain, il a fallu prendre des mesures pour traiter plusieurs types de données manquantes en vue d'appliquer l'estimateur à système dual. Certaines unités de logement n'avaient pas été interviewées. Le cas échéant, on a conçu deux méthodes de correction pour la non-interview d'après un même ensemble d'interviews, une pour chaque point dans le temps. En outre, il a fallu déterminer la situation de résidence, d'appariement ou de recensement de certains répondants. Les méthodes appliquées par le passé ont été remplacées pour pouvoir respecter les délais plus courts pour calculer et vérifier les estimations. Le présent article décrit la portée des données manquantes dans l'enquête et les méthodes de traitement appliquées, compare ces dernières à d'autres méthodes passées et courantes, et donne un résumé analytique des procédures, y compris la comparaison des estimations démographiques selon le système dual sous d'autres méthodes de traitement des données manquantes. Comme les niveaux de données manquantes étaient faibles, il semble que l'utilisation des autres méthodes n'aurait pas affecté considérablement les résultats. Cependant, on constate certains changements dans les estimations.
Date de diffusion : 2004-01-27
8. Modélisation de séries chronologiques compositionnelles d'après des données d'enquêtes répétées Archivé
Articles et rapports : 12-001-X20010026097
Description :
Par séries chronologiques compositionelles, on entend une série chronologique multivariée pour laquelle les valeurs de chaque série sont comprises entre les bornes zéro et un et la somme des séries est égale à l'unité à chaque point dans le temps. Des données présentant ces caractéristiques sont obtenues dans le cas d'enquêtes répétées, lorsque la réponse pour l'une des variables observées est multinomiale, mais que l'on s'intéresse à la proportion d'unités classées dans chacune des catégories. Dans ce cas, les estimations d'enquête représentent des proportions d'un tout subordonné à une contrainte de somme unitaire. Dans le présent article, nous employons une méthode espace-état pour modéliser la série chronologique compositionnelle d'après des enquêtes répétées en tenant compte des erreurs d'échantillonnage. Nous utilisons la transformation logistique additive pour être certains que les prédictions et les estimations du signal soient comprises entre zéro et un et satisfassent la contrainte de somme unitaire. Nous appliquons la méthode à des données compositionnelles provenant de l'Enquête sur la population active du Brésil. Nous obtenons des estimations du vecteur des proportions et des taux de chômage. En outre, nous produisons les composantes structurelles du vecteur de signaux, tels que les évènements saisonniers et les tendances.
Date de diffusion : 2002-02-28
9. Mieux comprendre la transformation des poids à l'aide d'une mesure de changement Archivé
Articles et rapports : 12-001-X20010015858
Description : L'objectif de cet article consiste à étudier et à mesurer le changement (du poids initial au poids final) qui est produit par la procédure de modification des poids. Une décomposition des poids finaux est proposée pour évaluer l'incidence relative de l'ajustement de non-réponse, la correction pour la poststratification et l'interaction entre ces deux ajustements. On utilise cette mesure de changement comme outil pour comparer l'efficacité de diverses méthodes d'ajustement pour la non-réponse, notamment les méthodes reposant sur la formation de groupes de réponse homogénes. La mesure de changement est étudiée par l'entremise d'une étude de simulation utilisant les données d'une enquête longitudinale de Statistique Canada, soit l'Enquête sur la dynamique du travail et du revenu. La mesure de changement est également appliquée aux données d'une deuxième enquête longitudinale, c'est-à-dire à l'Enquête nationale longitudinale sur les enfants et les jeunes.
Date de diffusion : 2001-08-22
10. Facteurs déterminants du décrochage dans les universités et les collèges communautaires Archivé
Articles et rapports : 81-003-X19990045143
Géographie : Canada
Description :
Dans cet article, on observe les différences régionales chez les étudiants qui ont abandonné leurs études universitaires ou collégiales.
Date de diffusion : 2000-09-01

Références (1)

Références (1) ((1 result))

1. Régression logistique multidimensionnelle applicable aux données tirées d'enquêtes complexes Archivé
Enquêtes et programmes statistiques — Documentation : 11-522-X19980015036
Description :
En tant que généralisation de la régression logistique, la régression logistique multivariée, introduite par Glonek et McCullagh (1995), facilite l'analyse des données longitudinales en acceptant les observations répétées et dépendantes d'une variable nominale ainsi que des jeux de réponses incomplets. L'auteur montre comment étendre cette méthode au traitement des données d'une enquête complexe et en fournit l'illustration grâce à l'Enquête sur la population active suisse. Il examine également l'incidence des poids d'échantillonnage sur l'estimation des paramètres et des erreurs-types.
Date de diffusion : 1999-10-22

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.

Date de modification :: 2026-07-19