Recherche par mot-clé
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Sujet
- Adultes âgés et vieillissement démographique (1)
- Agriculture et alimentation (5)
- Éducation, formation et apprentissage (1)
- Enfants et jeunes (3)
- Immigration et diversité ethnoculturelle (1)
- Logement (2)
- Méthodes statistiques (81)
- Population et démographie (1)
- Rendement des entreprises et propriété (1)
- Revenu, pensions, dépenses et richesse (2)
- Santé (37)
- Société et communauté (1)
- Travail (3)
Type
Géographie
Enquête ou programme statistique
Résultats
Tout (88)
Tout (88) (20 à 30 de 88 résultats)
- Articles et rapports : 11-522-X200600110390Description :
Nous proposons un modèle linéaire généralisé avec composantes aléatoires additives (GLMARC pour generalized linear model with additive random components) de niveau agrégé applicable aux dénombrements binaires provenant d'enquêtes. Ce modèle comporte une partie linéaire (pour les effets aléatoires) et une partie non linéaire (pour les effets fixes) pour la modélisation de la fonction de moyenne et appartient donc à la classe des modèles mixtes linéaires et non linéaires (MLNL). Il permet d'adopter une approche de type modèle linéaire mixte (LMM) pour l'estimation sur petits domaines (EPD) semblable dans une certaine mesure à la méthode bien connue de Fay Herriot (1979) et tient donc compte du plan d'échantillonnage. Contrairement à l'approche bayésienne hiérarchique (BH) de You et Rao (2002), la méthode proposée donne lieu à des estimations sur petits domaines et des diagnostics fréquentistes faciles à interpréter, ainsi qu'à un auto étalonnage reposant sur des estimations directes fiables sur grands domaines. La méthodologie habituelle des LMM ne convient pas dans le cas de dénombrements, à cause de l'absence de contraintes d'intervalle pour la fonction de moyenne et de la possibilité d'obtenir des estimations non raisonnables (p. ex. 0 dans le contexte de l'EPD) des composantes de variance, car le modèle ne permet pas que la partie des effets aléatoires de la fonction de moyenne conditionnelle dépende de la moyenne marginale. La méthode proposée est une amélioration de la méthode élaborée antérieurement par Vonesh et Carter (1992) qui s'appuyait aussi sur des modèles mixtes linéaires et non linéaires, mais qui ne tenait pas compte de la relation entre la variance et la moyenne, quoique cela se fasse habituellement par des contraintes d'intervalle pour les effets aléatoires. En outre, les effets du plan de sondage et l'estimation des effets aléatoires n'étaient pas envisagés. En revanche, dans notre application à l'estimation sur petits domaines, il est important d'obtenir des estimations appropriées des effets fixes ainsi qu'aléatoires. Il convient de souligner que, contrairement au modèle linéaire mixte généralisé (GLMM), le modèle GLMARC se caractérise, comme les LMM, par une grande simplicité d'ajustement. Cette dernière est due au remplacement des effets fixes et aléatoires originaux du GLMM par un nouvel ensemble de paramètres du GLMARC dont l'interprétation est assez différente, car l'effet aléatoire n'est plus intégré dans la fonction prédictrice non linéaire. Toutefois, cela n'a aucune conséquence pour estimation sur petits domaines, parce que les paramètres de petit domaine correspondent aux moyennes conditionnelles globales et non aux paramètres individuels du modèle. Nous proposons pour l'estimation des paramètres une méthode s'appuyant sur l'application itérative du meilleur prédicteur linéaire sans biais (BLUP pour best linear unbiased predictor) qui permet l'auto étalonnage après un agrandissement approprié du modèle. Le problème des petits domaines pour lesquels la taille d'échantillon est faible, voire nulle, ou des estimations directes nulles est résolu en regroupant les domaines pour l'étape de l'estimation des paramètres uniquement. L'application du modèle à l'Enquête sur la santé dans les collectivités canadiennes de 2000 2001 en vue d'estimer la proportion de fumeurs quotidiens dans les sous populations définies par les régions sociosanitaires provinciales selon le groupe âge sexe est présentée à titre d'illustration.
Date de diffusion : 2008-03-17 - 22. Utilisation de la loi t pour traiter les valeurs aberrantes dans l'estimation pour de petits domaines ArchivéArticles et rapports : 11-522-X200600110391Description :
L'estimation sur petits domaines au moyen de modèles linéaires au niveau du domaine repose habituellement sur l'hypothèse de normalité des effets aléatoires au niveau du domaine (erreurs de modélisation) et des erreurs de sondage dans les estimations directes par sondage. Les observations aberrantes peuvent poser un problème et être dues à des valeurs aberrantes des erreurs de modélisation ou des erreurs de sondage, deux possibilités dont les incidences sont fort différentes. Nous considérons ici les deux possibilités et étudions empiriquement comment l'utilisation d'une approche bayésienne reposant sur l'hypothèse que l'une des composantes de l'erreur suit une loi t permet de traiter les valeurs aberrantes éventuelles. Les exemples empiriques reposent sur des modèles des rapports de pauvreté dans les États américains utilisés par le Small Area Income and Poverty Estimates program du U.S. Census Bureau, en étendant les modèles gaussiens habituels afin de supposer que l'erreur de modélisation ou l'erreur de sondage suit une loi t. Nous examinons comment les résultats sont influencés par la variation du nombre de degrés de liberté (supposé connu) de la loi t. Nous constatons que l'utilisation d'une loi t à faible nombre de degrés de liberté peut réduire les effets des valeurs aberrantes, mais dans les exemples discutés, les résultats ne vont pas jusqu'à s'approcher du rejet catégorique des observations.
Date de diffusion : 2008-03-17 - 23. Inférence bayésienne prédictive robuste pour les quantiles de population finie d'un petit domaine ArchivéArticles et rapports : 11-522-X200600110392Description :
Nous suivons une méthode bayésienne robuste pour analyser des données pouvant présenter un biais de non-réponse et un biais de sélection non ignorables. Nous utilisons un modèle de régression logistique robuste pour établir le lien entre les indicateurs de réponse (variable aléatoire de Bernoulli) et les covariables, dont nous disposons pour tous les membres de la population finie. Ce lien permet d'expliquer l'écart entre les répondants et les non-répondants de l'échantillon. Nous obtenons ce modèle robuste en élargissant le modèle de régression logistique conventionnel à un mélange de lois de Student, ce qui nous fournit des scores de propension (probabilité de sélection) que nous utilisons pour construire des cellules d'ajustement. Nous introduisons les valeurs des non-répondants en tirant un échantillon aléatoire à partir d'un estimateur à noyau de la densité, formé d'après les valeurs des répondants à l'intérieur des cellules d'ajustement. La prédiction fait appel à une régression linéaire spline, fondée sur les rangs, de la variable de réponse sur les covariables selon le domaine, en échantillonnant les erreurs à partir d'un autre estimateur à noyau de la densité, ce qui rend notre méthode encore plus robuste. Nous utilisons des méthodes de Monte-Carlo par chaînes de Markov (MCMC) pour ajuster notre modèle. Dans chaque sous-domaine, nous obtenons la loi a posteriori d'un quantile de la variable de réponse à l'intérieur de chaque sous-domaine en utilisant les statistiques d'ordre sur l'ensemble des individus (échantillonnés et non échantillonnés). Nous comparons notre méthode robuste à des méthodes paramétriques proposées récemment.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110393Description :
Dans le présent article, nous calculons un estimateur de deuxième ordre sans biais (ou presque sans biais) de l'erreur quadratique moyenne de prédiction (EQMP) du meilleur prédicteur linéaire sans biais empirique (MPLSBE) d'un total de petit domaine pour une extension, selon l'hypothèse de non-normalité, du modèle bien connu de Fay-Herriot. Plus précisément, nous calculons notre estimateur de l'EQMP en posant essentiellement certaines conditions de moment pour les distributions de l'erreur d'échantillonnage et des effets aléatoires. L'estimateur de l'EQMP de Prasad-Rao fondé sur l'hypothèse de normalité se révèle étonnamment robuste en ce sens qu'il reste un estimateur de deuxième ordre sans biais dans des conditions de non-normalité des effets aléatoires lorsqu'un estimateur simple de la méthode des moments est employé pour la composante de variance et lorsque l'erreur d'échantillonnage suit une distribution normale. Nous montrons que l'estimateur de l'EQMP fondé sur l'hypothèse de normalité n'est plus un estimateur de deuxième ordre sans biais lorsque l'erreur d'échantillonnage suit une distribution non normale ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance même si l'erreur d'échantillonnage suit une distribution normale. Il est intéressant de noter que lorsque l'estimateur simple de la méthode des moments est utilisé pour la composante de variance, l'estimateur de l'EQMP que nous proposons n'exige pas une estimation du kurtosis des effets aléatoires. Les résultats d'une étude de simulation sur l'exactitude de l'estimateur de l'EQMP proposé, dans des conditions de non-normalité de la distribution tant de l'erreur d'échantillonnage que des effets aléatoires, sont également présentés.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110394Description :
Statistique Canada a mené en 2004 l'Enquête sur la santé dans les collectivités canadiennes sur la nutrition. L'objectif principal de l'enquête était d'estimer les distributions d'apports alimentaires habituels des Canadiens au niveau provincial pour 15 groupes d'âge et de sexe. En général, on estime de telles distributions à l'aide du logiciel SIDE, mais obtenir ces estimations en tenant compte des choix qui ont été faits en termes de plan d'échantillonnage et de méthode d'estimation de la variabilité d'échantillonnage n'est pas chose facile. Cet article traite des défis méthodologiques reliés à l'estimation de distributions d'apports habituels à l'aide de SIDE avec les données de l'enquête.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110395Description :
Cette étude a pour but d'examiner les facteurs associés à l'obésité au Canada et aux États-Unis à l'aide de données provenant de l'Enquête conjointe Canada-États-Unis sur la santé de 2002 2003, enquête téléphonique réalisée de concert par Statistique Canada et le National Center for Health Statistics des États-Unis. Les deux pays ont utilisé essentiellement le même questionnaire au même moment, ce qui a produit un ensemble de données garantissant une comparabilité sans précédent des estimations nationales calculées pour les deux pays. L'analyse des distributions empiriques de l'indice de masse corporelle (IMC) révèle que les Américaines sont sensiblement plus grosses que les Canadiennes, mais que la distribution de l'IMC est presque la même pour les hommes, qu'ils soient Américains ou Canadiens. Les facteurs susceptibles d'expliquer les écarts observés chez les femmes sont examinés.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110396Description :
À partir des données sur l'Enquête sur la santé dans les collectivités canadiennes, il est possible d'estimer les distributions des apports habituels de nutriments. Il est plus difficile d'estimer la consommation habituelle d'aliments. Cette dernière doit être estimée en jumelant la fréquence de consommation de l'aliment avec la distribution de l'apport habituel de l'aliment chez les consommateurs. Il peut être difficile d'estimer cette distribution pour des aliments plus rares et il est pratiquement impossible d'obtenir des estimations fiables de la fréquence de consommation de l'aliment en se fiant sur seulement deux jours de données par répondant. L'utilisation d'une source extérieure ou d'une hypothèse paramétrique peut solutionner en partie ce problème. Une alternative est d'utiliser une approche indirecte pour estimer l'impact d'un aliment sur la distribution de l'apport habituel d'un nutriment en éliminant ou en remplaçant en tout ou en partie l'aliment par un autre.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110397Description :
En pratique, il arrive souvent que certaines données recueillies comportent une erreur de mesure. Parfois, des covariables (ou facteurs de risque) d'intérêt sont difficiles à observer avec précision en raison de l'emplacement physique ou du coût. D'autres fois, il est impossible de mesurer précisément les covariables à cause de leur nature. Dans d'autres situations, une covariable peut représenter la moyenne d'une certaine grandeur mesurable au cours du temps, et tout moyen pratique de mesurer cette grandeur comporte nécessairement une erreur de mesure. Lorsqu'on procède à des inférences statistiques dans de telles conditions, il est important de tenir compte des effets des covariables mesurées incorrectement; sinon, les résultats risques d'être incorrects, voire même trompeurs. Dans le présent article, nous discutons de plusieurs exemples d'erreur de mesure survenant dans des contextes distincts. Nous accordons une attention particulière aux données sur la survie en présence de covariables sujettes à une erreur de mesure. Nous discutons d'une méthode de simulation extrapolation pour la correction des effets de l'erreur de mesure. Enfin, nous présentons une étude par simulation.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110398Description :
L'étude de données longitudinales est essentielle si l'on veut observer correctement l'évolution des variables d'intérêt chez les personnes, les collectivités et les populations plus importantes au cours du temps. Les modèles linéaires à effets mixtes (pour les réponses continues observées au fil du temps), ainsi que les modèles linéaires généralisés à effets mixtes et les équations d'estimation généralisées (pour les réponses plus générales, telles que les données binaires ou les dénombrements observés au fil du temps) sont les méthodes les plus répandues pour analyser les données longitudinales provenant d'études sur la santé, même si, comme toute méthode de modélisation, elles ont leurs limites, dues en partie aux hypothèses sous jacentes. Dans le présent article, nous discutons de certains progrès, dont l'utilisation de méthodes fondées sur des courbes, qui rendent la modélisation des données longitudinales plus souple. Nous présentons trois exemples d'utilisation de ces méthodes plus souples tirés de la littérature sur la santé, dans le but de démontrer que certaines questions par ailleurs difficiles peuvent être résolues raisonnablement lors de l'analyse de données longitudinales complexes dans les études sur la santé des populations.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110399Description :
Dans le contexte des études sur la santé, il est assez fréquent de recueillir des réponses binaires ou numériques répétées au moyen d'un ensemble de covariables multidimensionnelles durant une courte période auprès d'un grand nombre de familles indépendantes. Ces familles sont sélectionnées dans une population finie, conformément à certains plans de sondage complexes. Il est intéressant d'examiner les effets des covariables sur les réponses familiales longitudinales après voir tenu compte de la variation des effets familiaux et des corrélations longitudinales des réponses répétées. Cette communication traitera des avantages et des inconvénients des méthodes existantes d'estimation des effets de régression, de la variance des effets familiaux et des corrélations longitudinales. On décrira ensuite les avantages d'une nouvelle méthode unifiée généralisée de quasi vraisemblance pour analyser les données familiales longitudinales fondées sur un plan de sondage complexe. On analysera certaines études numériques existantes en vue d'illustrer les méthodes prises en considération dans la communication.
Date de diffusion : 2008-03-17
- Précédent Go to previous page of Tout results
- 1 Aller à la page 1 des résultats «!tag»
- 2 Aller à la page 2 des résultats «!tag»
- 3 (actuel) Aller à la page 3 des résultats «!tag»
- 4 Aller à la page 4 des résultats «!tag»
- 5 Aller à la page 5 des résultats «!tag»
- 6 Aller à la page 6 des résultats «!tag»
- 7 Aller à la page 7 des résultats «!tag»
- 8 Aller à la page 8 des résultats «!tag»
- 9 Aller à la page 9 des résultats «!tag»
- Suivant Go to next page of Tout results
Données (1)
Données (1) ((1 résultat))
- Tableau : 71-585-XDescription :
Ce compendium fournit les données de la nouvelle Enquête sur le milieu de travail et les employés (EMTE) qui est effectuée par Statistique Canada avec le soutien de Développement des ressources humaines Canada L'EMTE compte deux volets: (1) une enquête auprès des établissements sur les changements organisationnels, la formation et d' autres pratiques en matière de ressources humaines, les stratégies d'entreprise ainsi que le roulement de la main-d'oeuvre au sein du milieu de travail; et (2) une enquête auprès des employés de ces mêmes milieux de travail, afin de recueillir des données sur leurs salaires, leurs heures de travail, le genre de travail qu'ils effectuent, le capital humain, l'utilisation de la technologie et la formation. Il en résulte une riche source nouvelle de renseignements interreliés sur les milieux de travail et leurs employés.
Date de diffusion : 2008-09-24
Analyses (84)
Analyses (84) (20 à 30 de 84 résultats)
- Articles et rapports : 11-522-X200600110393Description :
Dans le présent article, nous calculons un estimateur de deuxième ordre sans biais (ou presque sans biais) de l'erreur quadratique moyenne de prédiction (EQMP) du meilleur prédicteur linéaire sans biais empirique (MPLSBE) d'un total de petit domaine pour une extension, selon l'hypothèse de non-normalité, du modèle bien connu de Fay-Herriot. Plus précisément, nous calculons notre estimateur de l'EQMP en posant essentiellement certaines conditions de moment pour les distributions de l'erreur d'échantillonnage et des effets aléatoires. L'estimateur de l'EQMP de Prasad-Rao fondé sur l'hypothèse de normalité se révèle étonnamment robuste en ce sens qu'il reste un estimateur de deuxième ordre sans biais dans des conditions de non-normalité des effets aléatoires lorsqu'un estimateur simple de la méthode des moments est employé pour la composante de variance et lorsque l'erreur d'échantillonnage suit une distribution normale. Nous montrons que l'estimateur de l'EQMP fondé sur l'hypothèse de normalité n'est plus un estimateur de deuxième ordre sans biais lorsque l'erreur d'échantillonnage suit une distribution non normale ou lorsque la méthode des moments de Fay-Herriot est utilisée pour estimer la composante de variance même si l'erreur d'échantillonnage suit une distribution normale. Il est intéressant de noter que lorsque l'estimateur simple de la méthode des moments est utilisé pour la composante de variance, l'estimateur de l'EQMP que nous proposons n'exige pas une estimation du kurtosis des effets aléatoires. Les résultats d'une étude de simulation sur l'exactitude de l'estimateur de l'EQMP proposé, dans des conditions de non-normalité de la distribution tant de l'erreur d'échantillonnage que des effets aléatoires, sont également présentés.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110394Description :
Statistique Canada a mené en 2004 l'Enquête sur la santé dans les collectivités canadiennes sur la nutrition. L'objectif principal de l'enquête était d'estimer les distributions d'apports alimentaires habituels des Canadiens au niveau provincial pour 15 groupes d'âge et de sexe. En général, on estime de telles distributions à l'aide du logiciel SIDE, mais obtenir ces estimations en tenant compte des choix qui ont été faits en termes de plan d'échantillonnage et de méthode d'estimation de la variabilité d'échantillonnage n'est pas chose facile. Cet article traite des défis méthodologiques reliés à l'estimation de distributions d'apports habituels à l'aide de SIDE avec les données de l'enquête.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110395Description :
Cette étude a pour but d'examiner les facteurs associés à l'obésité au Canada et aux États-Unis à l'aide de données provenant de l'Enquête conjointe Canada-États-Unis sur la santé de 2002 2003, enquête téléphonique réalisée de concert par Statistique Canada et le National Center for Health Statistics des États-Unis. Les deux pays ont utilisé essentiellement le même questionnaire au même moment, ce qui a produit un ensemble de données garantissant une comparabilité sans précédent des estimations nationales calculées pour les deux pays. L'analyse des distributions empiriques de l'indice de masse corporelle (IMC) révèle que les Américaines sont sensiblement plus grosses que les Canadiennes, mais que la distribution de l'IMC est presque la même pour les hommes, qu'ils soient Américains ou Canadiens. Les facteurs susceptibles d'expliquer les écarts observés chez les femmes sont examinés.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110396Description :
À partir des données sur l'Enquête sur la santé dans les collectivités canadiennes, il est possible d'estimer les distributions des apports habituels de nutriments. Il est plus difficile d'estimer la consommation habituelle d'aliments. Cette dernière doit être estimée en jumelant la fréquence de consommation de l'aliment avec la distribution de l'apport habituel de l'aliment chez les consommateurs. Il peut être difficile d'estimer cette distribution pour des aliments plus rares et il est pratiquement impossible d'obtenir des estimations fiables de la fréquence de consommation de l'aliment en se fiant sur seulement deux jours de données par répondant. L'utilisation d'une source extérieure ou d'une hypothèse paramétrique peut solutionner en partie ce problème. Une alternative est d'utiliser une approche indirecte pour estimer l'impact d'un aliment sur la distribution de l'apport habituel d'un nutriment en éliminant ou en remplaçant en tout ou en partie l'aliment par un autre.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110397Description :
En pratique, il arrive souvent que certaines données recueillies comportent une erreur de mesure. Parfois, des covariables (ou facteurs de risque) d'intérêt sont difficiles à observer avec précision en raison de l'emplacement physique ou du coût. D'autres fois, il est impossible de mesurer précisément les covariables à cause de leur nature. Dans d'autres situations, une covariable peut représenter la moyenne d'une certaine grandeur mesurable au cours du temps, et tout moyen pratique de mesurer cette grandeur comporte nécessairement une erreur de mesure. Lorsqu'on procède à des inférences statistiques dans de telles conditions, il est important de tenir compte des effets des covariables mesurées incorrectement; sinon, les résultats risques d'être incorrects, voire même trompeurs. Dans le présent article, nous discutons de plusieurs exemples d'erreur de mesure survenant dans des contextes distincts. Nous accordons une attention particulière aux données sur la survie en présence de covariables sujettes à une erreur de mesure. Nous discutons d'une méthode de simulation extrapolation pour la correction des effets de l'erreur de mesure. Enfin, nous présentons une étude par simulation.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110398Description :
L'étude de données longitudinales est essentielle si l'on veut observer correctement l'évolution des variables d'intérêt chez les personnes, les collectivités et les populations plus importantes au cours du temps. Les modèles linéaires à effets mixtes (pour les réponses continues observées au fil du temps), ainsi que les modèles linéaires généralisés à effets mixtes et les équations d'estimation généralisées (pour les réponses plus générales, telles que les données binaires ou les dénombrements observés au fil du temps) sont les méthodes les plus répandues pour analyser les données longitudinales provenant d'études sur la santé, même si, comme toute méthode de modélisation, elles ont leurs limites, dues en partie aux hypothèses sous jacentes. Dans le présent article, nous discutons de certains progrès, dont l'utilisation de méthodes fondées sur des courbes, qui rendent la modélisation des données longitudinales plus souple. Nous présentons trois exemples d'utilisation de ces méthodes plus souples tirés de la littérature sur la santé, dans le but de démontrer que certaines questions par ailleurs difficiles peuvent être résolues raisonnablement lors de l'analyse de données longitudinales complexes dans les études sur la santé des populations.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110399Description :
Dans le contexte des études sur la santé, il est assez fréquent de recueillir des réponses binaires ou numériques répétées au moyen d'un ensemble de covariables multidimensionnelles durant une courte période auprès d'un grand nombre de familles indépendantes. Ces familles sont sélectionnées dans une population finie, conformément à certains plans de sondage complexes. Il est intéressant d'examiner les effets des covariables sur les réponses familiales longitudinales après voir tenu compte de la variation des effets familiaux et des corrélations longitudinales des réponses répétées. Cette communication traitera des avantages et des inconvénients des méthodes existantes d'estimation des effets de régression, de la variance des effets familiaux et des corrélations longitudinales. On décrira ensuite les avantages d'une nouvelle méthode unifiée généralisée de quasi vraisemblance pour analyser les données familiales longitudinales fondées sur un plan de sondage complexe. On analysera certaines études numériques existantes en vue d'illustrer les méthodes prises en considération dans la communication.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110400Description :
On peut obtenir des estimations du nombre attribuable de décès (DA), toutes causes confondues, en commençant par estimer le risque attribuable corrigé (RA) au sein de la population pour tenir compte des covariables confusionnelles, puis en multipliant le RA par le nombre de décès, déterminé d'après les statistiques de l'état civil sur la mortalité, survenus pendant une période de référence précise. Nous obtenons par la méthode de régression à risques proportionnels des estimations des risques relatifs corrigés basées sur des données sur la mortalité provenant du suivi d'une cohorte ou d'une enquête que nous combinons à une distribution conjointe du facteur de risque et des covariables confusionnelles pour calculer un risque attribuable (RA) corrigé. Nous examinons deux estimateurs du RA corrigé, qui se distinguent par la population de référence d'après laquelle la distribution conjointe du facteur de risque et des variables confusionnelles est obtenue. Les deux populations de référence considérées sont : i) la population qui est représentée par la cohorte de référence et : ii) une population extérieure à la cohorte. Nous appliquons des méthodes fondées sur la théorie de la fonction d'influence pour obtenir des expressions permettant d'estimer la variance de l'estimateur du nombre attribuable de décès (DA). Ces estimateurs de la variance peuvent être appliqués à des données recueillies auprès d'échantillons allant de l'échantillon aléatoire simple à l'échantillon en grappes stratifié à plusieurs degrés pondéré par les poids de sondage utilisés pour réaliser les enquêtes nationales auprès des ménages. Nous illustrons l'estimation de la variance du nombre attribuable de décès au moyen d'une analyse de la surmortalité liée à l'indice de masse corporelle non idéal dans une population réalisée sur des données provenant de la deuxième étude de la mortalité basée sur la National Health and Examination Survey (NHANES) et de la NHANES de 1999-2002. Ces méthodes peuvent également être utilisées pour estimer le nombre attribuable de décès par cause d'une maladie ou de nouveaux cas ainsi que leurs erreurs types, lorsque la période de référence est brève.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110401Description :
L'Australian Bureau of Statistics (ABS) entamera la création d'un ensemble de données statistiques longitudinales de recensement (EDSLR) en sélectionnant un échantillon de 5 % de personnes provenant de la population du Recensement de 2006 en vue de le coupler de manière probabiliste aux données des futurs recensements. L'un des objectifs à long terme est de profiter de la force des riches données démographiques longitudinales fournies par l'EDSLR pour offrir des éclaircissements sur diverses questions qui ne peuvent être résolues à l'aide de données transversales. L'EDSLR pourrait être amélioré par couplage probabiliste avec les données sur les naissances, les décès et l'immigration, ainsi qu'avec celles des registres des maladies. Le présent article décrit brièvement les progrès récents dans le domaine du couplage des données à l'ABS, expose les grandes lignes, la méthodologie de couplage des données et les mesures de la qualité qui ont été envisagées et résume les résultats provisoires à l'aide des données du test du recensement.
Date de diffusion : 2008-03-17 - 30. Appariement de données régionales du recensement avec des données d'enquête et des données administratives ArchivéArticles et rapports : 11-522-X200600110402Description :
Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d'enquête ou à des données administratives. Nous citons des exemples d'ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs, notamment les ensembles de données administratives. À l'aide de quatre exemples, nous illustrons des situations courantes dans lesquelles se trouvent les chercheurs : (1) cas où les données d'enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques de même niveau et sont codés selon la même année de référence du découpage géographique aux fins du recensement (par exemple, si les deux ont des données 2001 AD); (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement (par exemple, 1996 SD dans l'enquête, mais 1996 SR dans les données du recensement); (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes de géographie telles que 1996 SD pour l'enquête, mais 2001 AD pour le recensement); (4) cas où les données d'enquête n'ont pas d'identificateurs géographiques, ceux-ci devant d'abord être produits à partir des codes postaux du fichier d'enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s'appliquent à d'autres langages de programmation ou progiciels statistiques.
Date de diffusion : 2008-03-17
- Précédent Go to previous page of Analyses results
- 1 Aller à la page 1 des résultats «!tag»
- 2 Aller à la page 2 des résultats «!tag»
- 3 (actuel) Aller à la page 3 des résultats «!tag»
- 4 Aller à la page 4 des résultats «!tag»
- 5 Aller à la page 5 des résultats «!tag»
- 6 Aller à la page 6 des résultats «!tag»
- 7 Aller à la page 7 des résultats «!tag»
- 8 Aller à la page 8 des résultats «!tag»
- 9 Aller à la page 9 des résultats «!tag»
- Suivant Go to next page of Analyses results
Références (3)
Références (3) ((3 résultats))
- Enquêtes et programmes statistiques — Documentation : 62F0026M2009001Géographie : Province ou territoireDescription :
Ce guide présente de l'information qui intéresse les utilisateurs des données provenant de l'Enquête sur les dépenses des ménages, nous avons obtenu des renseignements sur les habitudes de dépense, les caractéristiques des logements et de l'équipement ménager des ménages canadiens. L'enquête a porté sur les ménages privés des dix provinces. (Dans le but de réduire le fardeau de réponse pour les ménages du nord, l'EDM est menée dans le nord seulement tous les deux ans, débutant a partir de 1999.)
Ce guide comprend les définitions des termes et des variables de l'enquête, ainsi que des descriptions de la méthode, la qualité des données, et le contenu de tableaux standards de données. Il contient aussi une section décrivant les différentes statistiques pouvant être créées au moyen des données sur les dépenses (p. ex. part du budget, part du marché, et agrégat de dépenses).
Date de diffusion : 2008-12-22 - Enquêtes et programmes statistiques — Documentation : 75F0002M199201ADescription :
À partir de janvier 1994, l'Enquête sur la dynamique du travail et du revenu (EDTR) va suivre un panel de familles et d'individus durant une période d'au moins six ans afin de cerner leurs expériences de travail ainsi que les changements monétaires et familiaux. Un document intitulé "Contenu de l'Enquête sur la dynamique du travail et du revenu: document de travail " a été distribué en février 1992.
Ce document servait de base pour consulter les utilisateurs concernés. Lors de ce processus, le contenu a subi plusieurs modifications. Un test à grande échelle de l'EDTR sera effectué en février et mai 1993 pour évaluer le nouveau contenu.
Ce présent document porte sur le contenu touchant la démographique et le travail qui sera utilisé pour le test.
Date de diffusion : 2008-10-21 - Enquêtes et programmes statistiques — Documentation : 62F0026M2008001Géographie : Province ou territoireDescription :
Ce guide présente de l'information qui intéresse les utilisateurs des données provenant de l'Enquête sur les dépenses des ménages (EDM) de 2005. Les données ont été recueillies au moyen d'entrevues personnelles menées en janvier, en février et en mars 2006, à l'aide d'un questionnaire papier. Nous avons obtenu des renseignements sur les habitudes de dépense, les caractéristiques des logements et de l'équipement ménager des ménages canadiens en 2005. L'enquête a porté sur les ménages privés des dix provinces et des trois territoires du Nord. (Dans le but de réduire le fardeau de réponse pour les ménages du nord, l'EDM est menée dans le nord seulement tous les deux ans, débutant a partir de 1999.)
Ce guide comprend les définitions des termes et des variables de l'enquête, ainsi que des descriptions de la méthode, la qualité des données, et le contenu de tableaux standards de données. Il contient aussi une section décrivant les différentes statistiques pouvant être créées au moyen des données sur les dépenses (p. ex. part du budget, part du marché, et agrégat de dépenses).
Date de diffusion : 2008-02-26
- Date de modification :