Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

1 facets displayed. 1 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (11)

Tout (11) (0 à 10 de 11 résultats)

  • Microdonnées à grande diffusion : 56M0002G
    Description :

    Ce guide est pour le fichier de microdonnées de l'Enquête sur l'utilisation de l'internet à la maison. L'Enquête sur l'utilisation de l'internet à la maison, menée par Statistique Canada pour le compte de Industrie Canada, permettra au Projet de remaniement des sciences et de la technologie à Statistique Canada de satisfaire aux exigences d'une entente conclue entre celui-ci et la Division de la politique des télécommunications à Industrie Canada. L'Enquête sur l'utilisation de l'internet à la maison est une enquête volontaire qui nous fournira des renseignements sur l'utilisation des ordinateurs à des fins de communication, sur l'accès à l'internet des foyers canadiens et sur l'usage qu'en font ceux-ci.

    L'Enquête vise d'abord à évaluer la demande de services de télécommunications des ménages canadiens. Pour ce faire, on calcule, entre autres, la fréquence et l'intensité d'usage de ce qu'on appelle « l'autoroute de l'information » en demandant aux ménages de détailler leur accès à l'internet à la maison, au travail et ailleurs.

    Les renseignements recueillis serviront à mettre à jour et enrichir les données d'enquêtes antérieures menées par Statistique Canada au sujet de l'autoroute de l'information.

    Date de diffusion : 2004-09-28

  • Enquêtes et programmes statistiques — Documentation : 92-393-X
    Description :

    Ce rapport constitue un guide concis destiné aux utilisateurs des données sur le revenu du recensement. Il présente une description générale des diverses étapes du recensement de 2001, depuis celle de la collecte des données jusqu'à celle de la diffusion en passant par le traitement des cas de non-réponse. Il comprend également des descriptions des changements apportés aux données sur le revenu au cours des diverses étapes de traitement ainsi que des données sommaires sur ces changements. À des fins de comparaison, des données tirées des comptes nationaux et de sources de données fiscales, à un niveau d'agrégation élevé, sont également fournies afin de mettre en contexte la qualité des données sur le revenu du recensement de 2001. Le rapport renferme aussi, à l'intention des utilisateurs désireux de comparer les données sur le revenu d'un recensement à l'autre, des explications sur les changements apportés, au fil des ans, au contenu ayant trait au revenu et à la couverture de l'univers. Il présente finalement une description complète de tous les produits du recensement renfermant des données sur le revenu.

    Date de diffusion : 2004-09-16

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2004-09-15

  • Articles et rapports : 11-522-X20020016728
    Description :

    On recueille les données de presque toutes les enquêtes selon un plan d'échantillonnage complexe et on les utilise souvent pour effectuer des analyses statistiques allant plus loin que l'estimation de simples paramètres descriptifs de la population cible. Nombre de procédures offertes par les progiciels statistiques les plus utilisés ne conviennent pas pour cette tâche, car les analyses sont fondées sur l'hypothèse qu'on a procédé à un échantillonnage aléatoire simple. Par conséquent, les résultats ne sont pas valides en cas d'échantillonnage à plusieurs degrés, de stratification ou de mise en grappes. Deux méthodes utilisées couramment pour analyser les données d'enquêtes complexes sont les techniques de rééchantillonnage (répétitions) et de linéarisation de Taylor. Cet article traite de l'utilisation du logiciel WesVar pour calculer des estimations et pour produire des estimations répétées de la variance en reflétant correctement l'échantillonnage complexe et les méthodes d'estimation. On illustre aussi les caractéristiques de WesVar à l'aide de données provenant de deux enquêtes réalisées par Westat basées sur des plans d'échantillonnage complexes, à savoir la Third International Mathematics and Science Study (TIMSS) et la National Health and Nutrition Examination Survey (NHANES).

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016729
    Description :

    Dans la grande majorité, sinon la totalité, des enquêtes par sondage, on doit faire face au problème de données manquantes. Les données manquantes sont habituellement causées par la non-réponse (le refus de participer à l'enquête ou l'intervieweur n'a pas été capable de rencontrer le répondant), mais elles peuvent aussi être créées à l'étape de la vérification des données pour résoudre des problèmes d'incohérences ou de réponses suspectes. La présence de données manquantes (non-réponse) entraîne généralement du biais et de l'incertitude dans les estimations. Pour surmonter cette difficulté, l'utilisation appropriée de toute l'information auxiliaire disponible permet de réduire au maximum le biais et la variance dus à la non-réponse. Dans le cadre de cette présentation, on définit le problème et on décrit la méthode sur laquelle le SEVANI est basé, puis on examine les utilisations possibles du système. En dernier lieu, on présente quelques exemples basés sur des données réelles illustrant la théorie en pratique.

    En pratique, il est très difficile d'estimer le biais dû à la non-réponse. Il est cependant possible d'évaluer la variance due à la non-réponse en supposant que le biais est négligeable. Au cours de la dernière décennie, plusieurs méthodes ont d'ailleurs été proposées pour estimer cette variance, dont certaines ont été implantées dans le Système d'estimation de la variance due à la non-réponse et à l'imputation (SEVANI).

    La méthode utilisée pour développer le SEVANI est basée sur la théorie de l'échantillonnage à deux phases où l'on suppose que la deuxième phase de sélection est la non-réponse. Toutefois, contrairement à l'échantillonnage à deux phases, un modèle d'imputation ou de non-réponse est requis pour l'estimation de la variance. Le SEVANI suppose également que la non-réponse est traitée en repondérant les unités répondantes ou en imputant les valeurs manquantes. On étudie trois techniques d'imputation : l'imputation d'une variable auxiliaire, l'imputation par la régression (déterministe ou aléatoire) et l'imputation par le plus proche voisin.

    Date de diffusion : 2004-09-13

  • Enquêtes et programmes statistiques — Documentation : 92-390-X
    Description :

    Ce rapport renferme une définition sur le concept de lieu de travail en 2001 et sur la géographie du lieu de travail, ainsi qu'un texte normalisé sur la collecte des données et la couverture (méthodes de collecte des données, études spéciales sur la couverture, échantillonnage et pondération, contrôle et suivi, considérations sur la couverture et le contenu). Il contient également des textes généraux et spécialisés sur l'assimilation des données (codage automatisé et interactif), sur le contrôle et l'imputation ainsi que sur l'évaluation des données. Enfin, ce rapport technique contient une section traitant de la comparabilité des données dans le temps.

    Date de diffusion : 2004-08-26

  • Articles et rapports : 12-001-X20040016993
    Description :

    L'estimateur à cellules de pondération corrige la non réponse totale par subdivision de l'échantillon en groupes homogènes (cellules) et application d'une correction par quotient aux répondants compris dans chaque cellule. Les études antérieures des propriétés statistiques des estimateurs à cellules de pondération se fondaient sur l'hypothèse que ces cellules correspondent à des cellules de population connues dont les caractéristiques sont homogènes. Dans le présent article, nous étudions les propriétés de l'estimateur à cellules de pondération sous un modèle de probabilité de réponse qui ne nécessite pas la spécification correcte de cellules de population homogènes. Nous supposons plutôt que la probabilité de réponse est une fonction lisse, mais par ailleurs non spécifiée, d'une variable auxiliaire connue. Sous ce modèle plus général, nous étudions la robustesse de l'estimateur à cellules de pondération à la spécification incorrecte du modèle. Nous montrons que, même si les cellules de population sont inconnues, l'estimateur est convergent par rapport au plan d'échantillonnage et au modèle de réponse. Nous décrivons l'effet du nombre de cellules de pondération sur les propriétés asymptotiques de l'estimateur. Au moyen d'expériences de simulation, nous explorons les propriétés de population finie de l'estimateur. Pour conclure, nous donnons certaines lignes directrices concernant le choix de la taille des cellules et de leur nombre pour l'application pratique de l'estimation fondée sur des cellules de pondération lorsqu'on ne peut spécifier ces cellules a priori.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 12-001-X20040016997
    Description :

    Les modèles multiniveaux sont souvent ajustés en fonction des données d'enquête recueillies dans le cadre d'un plan d'échantillonnage complexe à plusieurs degrés. Toutefois, lorsqu'un tel plan est informatif - en ce sens que les probabilités d'inclusion, même si on les subordonne aux covariables, dépendent de la variable réponse -, les estimateurs standard du maximum de vraisemblance seront biaisés. Dans la présente étude, nous inspirant de l'approche du pseudo maximum de vraisemblance (PMV) de Skinner (1989), nous proposons une procédure d'estimation à pondération probabiliste dans le cadre de modèles multiniveaux ordinaux et binaires, de façon à supprimer le biais découlant du caractère informatif du plan d'échantillonnage. On utilise la valeur inverse des probabilités d'inclusion à chaque degré d'échantillonnage pour pondérer la fonction logarithmique de vraisemblance; les estimateurs pondérés que l'on obtient ainsi sont testés au moyen d'une étude de simulation dans le cas simple d'un modèle binaire à l'ordonnée à l'origine aléatoire, avec et sans covariables. Les estimateurs de la variance sont obtenus au moyen d'une procédure bootstrap. Pour maximiser le logarithme du rapport de vraisemblance pondéré du modèle, nous avons recours à la procédure NLMIXED du SAS, qui repose elle-même sur une version adaptative de la quadrature gaussienne. Également, l'estimation bootstrap des variances est effectuée dans l'environnement du SAS.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 12-001-X20040016999
    Description :

    Des données recueillies lors de l'Enquête sur la fécondité et la famille réalisée en Belgique sont combinées à des données sur les répondants et les non répondants aux niveaux individuel et municipal provenant du Recensement de la population de la Belgique de 1991 pour estimer des modèles de régression logistique multiniveaux de la possibilité de prise de contact et de la propension à la coopération. Une sélection de caractéristiques indirectes, dont aucune ne peut être contrôlée directement par les chercheurs, sont introduites comme covariables. Contrairement aux études antérieures, nous constatons que le statut socioéconomique est positivement associé à la coopération. Un autre résultat inattendu est l'absence de tout effet important des corrélats environnementaux, tels que l'urbanité.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 75F0002M2004008
    Description :

    Dans ce document, on présente les principes ayant servi de base à la méthodologie de la pondération longitudinale avec panels combinés ainsi que les étapes nécessaires à sa création.

    Date de diffusion : 2004-06-29
Données (1)

Données (1) ((1 résultat))

  • Microdonnées à grande diffusion : 56M0002G
    Description :

    Ce guide est pour le fichier de microdonnées de l'Enquête sur l'utilisation de l'internet à la maison. L'Enquête sur l'utilisation de l'internet à la maison, menée par Statistique Canada pour le compte de Industrie Canada, permettra au Projet de remaniement des sciences et de la technologie à Statistique Canada de satisfaire aux exigences d'une entente conclue entre celui-ci et la Division de la politique des télécommunications à Industrie Canada. L'Enquête sur l'utilisation de l'internet à la maison est une enquête volontaire qui nous fournira des renseignements sur l'utilisation des ordinateurs à des fins de communication, sur l'accès à l'internet des foyers canadiens et sur l'usage qu'en font ceux-ci.

    L'Enquête vise d'abord à évaluer la demande de services de télécommunications des ménages canadiens. Pour ce faire, on calcule, entre autres, la fréquence et l'intensité d'usage de ce qu'on appelle « l'autoroute de l'information » en demandant aux ménages de détailler leur accès à l'internet à la maison, au travail et ailleurs.

    Les renseignements recueillis serviront à mettre à jour et enrichir les données d'enquêtes antérieures menées par Statistique Canada au sujet de l'autoroute de l'information.

    Date de diffusion : 2004-09-28
Analyses (6)

Analyses (6) ((6 résultats))

  • Articles et rapports : 11-522-X20020016728
    Description :

    On recueille les données de presque toutes les enquêtes selon un plan d'échantillonnage complexe et on les utilise souvent pour effectuer des analyses statistiques allant plus loin que l'estimation de simples paramètres descriptifs de la population cible. Nombre de procédures offertes par les progiciels statistiques les plus utilisés ne conviennent pas pour cette tâche, car les analyses sont fondées sur l'hypothèse qu'on a procédé à un échantillonnage aléatoire simple. Par conséquent, les résultats ne sont pas valides en cas d'échantillonnage à plusieurs degrés, de stratification ou de mise en grappes. Deux méthodes utilisées couramment pour analyser les données d'enquêtes complexes sont les techniques de rééchantillonnage (répétitions) et de linéarisation de Taylor. Cet article traite de l'utilisation du logiciel WesVar pour calculer des estimations et pour produire des estimations répétées de la variance en reflétant correctement l'échantillonnage complexe et les méthodes d'estimation. On illustre aussi les caractéristiques de WesVar à l'aide de données provenant de deux enquêtes réalisées par Westat basées sur des plans d'échantillonnage complexes, à savoir la Third International Mathematics and Science Study (TIMSS) et la National Health and Nutrition Examination Survey (NHANES).

    Date de diffusion : 2004-09-13

  • Articles et rapports : 11-522-X20020016729
    Description :

    Dans la grande majorité, sinon la totalité, des enquêtes par sondage, on doit faire face au problème de données manquantes. Les données manquantes sont habituellement causées par la non-réponse (le refus de participer à l'enquête ou l'intervieweur n'a pas été capable de rencontrer le répondant), mais elles peuvent aussi être créées à l'étape de la vérification des données pour résoudre des problèmes d'incohérences ou de réponses suspectes. La présence de données manquantes (non-réponse) entraîne généralement du biais et de l'incertitude dans les estimations. Pour surmonter cette difficulté, l'utilisation appropriée de toute l'information auxiliaire disponible permet de réduire au maximum le biais et la variance dus à la non-réponse. Dans le cadre de cette présentation, on définit le problème et on décrit la méthode sur laquelle le SEVANI est basé, puis on examine les utilisations possibles du système. En dernier lieu, on présente quelques exemples basés sur des données réelles illustrant la théorie en pratique.

    En pratique, il est très difficile d'estimer le biais dû à la non-réponse. Il est cependant possible d'évaluer la variance due à la non-réponse en supposant que le biais est négligeable. Au cours de la dernière décennie, plusieurs méthodes ont d'ailleurs été proposées pour estimer cette variance, dont certaines ont été implantées dans le Système d'estimation de la variance due à la non-réponse et à l'imputation (SEVANI).

    La méthode utilisée pour développer le SEVANI est basée sur la théorie de l'échantillonnage à deux phases où l'on suppose que la deuxième phase de sélection est la non-réponse. Toutefois, contrairement à l'échantillonnage à deux phases, un modèle d'imputation ou de non-réponse est requis pour l'estimation de la variance. Le SEVANI suppose également que la non-réponse est traitée en repondérant les unités répondantes ou en imputant les valeurs manquantes. On étudie trois techniques d'imputation : l'imputation d'une variable auxiliaire, l'imputation par la régression (déterministe ou aléatoire) et l'imputation par le plus proche voisin.

    Date de diffusion : 2004-09-13

  • Articles et rapports : 12-001-X20040016993
    Description :

    L'estimateur à cellules de pondération corrige la non réponse totale par subdivision de l'échantillon en groupes homogènes (cellules) et application d'une correction par quotient aux répondants compris dans chaque cellule. Les études antérieures des propriétés statistiques des estimateurs à cellules de pondération se fondaient sur l'hypothèse que ces cellules correspondent à des cellules de population connues dont les caractéristiques sont homogènes. Dans le présent article, nous étudions les propriétés de l'estimateur à cellules de pondération sous un modèle de probabilité de réponse qui ne nécessite pas la spécification correcte de cellules de population homogènes. Nous supposons plutôt que la probabilité de réponse est une fonction lisse, mais par ailleurs non spécifiée, d'une variable auxiliaire connue. Sous ce modèle plus général, nous étudions la robustesse de l'estimateur à cellules de pondération à la spécification incorrecte du modèle. Nous montrons que, même si les cellules de population sont inconnues, l'estimateur est convergent par rapport au plan d'échantillonnage et au modèle de réponse. Nous décrivons l'effet du nombre de cellules de pondération sur les propriétés asymptotiques de l'estimateur. Au moyen d'expériences de simulation, nous explorons les propriétés de population finie de l'estimateur. Pour conclure, nous donnons certaines lignes directrices concernant le choix de la taille des cellules et de leur nombre pour l'application pratique de l'estimation fondée sur des cellules de pondération lorsqu'on ne peut spécifier ces cellules a priori.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 12-001-X20040016997
    Description :

    Les modèles multiniveaux sont souvent ajustés en fonction des données d'enquête recueillies dans le cadre d'un plan d'échantillonnage complexe à plusieurs degrés. Toutefois, lorsqu'un tel plan est informatif - en ce sens que les probabilités d'inclusion, même si on les subordonne aux covariables, dépendent de la variable réponse -, les estimateurs standard du maximum de vraisemblance seront biaisés. Dans la présente étude, nous inspirant de l'approche du pseudo maximum de vraisemblance (PMV) de Skinner (1989), nous proposons une procédure d'estimation à pondération probabiliste dans le cadre de modèles multiniveaux ordinaux et binaires, de façon à supprimer le biais découlant du caractère informatif du plan d'échantillonnage. On utilise la valeur inverse des probabilités d'inclusion à chaque degré d'échantillonnage pour pondérer la fonction logarithmique de vraisemblance; les estimateurs pondérés que l'on obtient ainsi sont testés au moyen d'une étude de simulation dans le cas simple d'un modèle binaire à l'ordonnée à l'origine aléatoire, avec et sans covariables. Les estimateurs de la variance sont obtenus au moyen d'une procédure bootstrap. Pour maximiser le logarithme du rapport de vraisemblance pondéré du modèle, nous avons recours à la procédure NLMIXED du SAS, qui repose elle-même sur une version adaptative de la quadrature gaussienne. Également, l'estimation bootstrap des variances est effectuée dans l'environnement du SAS.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 12-001-X20040016999
    Description :

    Des données recueillies lors de l'Enquête sur la fécondité et la famille réalisée en Belgique sont combinées à des données sur les répondants et les non répondants aux niveaux individuel et municipal provenant du Recensement de la population de la Belgique de 1991 pour estimer des modèles de régression logistique multiniveaux de la possibilité de prise de contact et de la propension à la coopération. Une sélection de caractéristiques indirectes, dont aucune ne peut être contrôlée directement par les chercheurs, sont introduites comme covariables. Contrairement aux études antérieures, nous constatons que le statut socioéconomique est positivement associé à la coopération. Un autre résultat inattendu est l'absence de tout effet important des corrélats environnementaux, tels que l'urbanité.

    Date de diffusion : 2004-07-14

  • Articles et rapports : 75F0002M2004008
    Description :

    Dans ce document, on présente les principes ayant servi de base à la méthodologie de la pondération longitudinale avec panels combinés ainsi que les étapes nécessaires à sa création.

    Date de diffusion : 2004-06-29
Références (4)

Références (4) ((4 résultats))

  • Enquêtes et programmes statistiques — Documentation : 92-393-X
    Description :

    Ce rapport constitue un guide concis destiné aux utilisateurs des données sur le revenu du recensement. Il présente une description générale des diverses étapes du recensement de 2001, depuis celle de la collecte des données jusqu'à celle de la diffusion en passant par le traitement des cas de non-réponse. Il comprend également des descriptions des changements apportés aux données sur le revenu au cours des diverses étapes de traitement ainsi que des données sommaires sur ces changements. À des fins de comparaison, des données tirées des comptes nationaux et de sources de données fiscales, à un niveau d'agrégation élevé, sont également fournies afin de mettre en contexte la qualité des données sur le revenu du recensement de 2001. Le rapport renferme aussi, à l'intention des utilisateurs désireux de comparer les données sur le revenu d'un recensement à l'autre, des explications sur les changements apportés, au fil des ans, au contenu ayant trait au revenu et à la couverture de l'univers. Il présente finalement une description complète de tous les produits du recensement renfermant des données sur le revenu.

    Date de diffusion : 2004-09-16

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2004-09-15

  • Enquêtes et programmes statistiques — Documentation : 92-390-X
    Description :

    Ce rapport renferme une définition sur le concept de lieu de travail en 2001 et sur la géographie du lieu de travail, ainsi qu'un texte normalisé sur la collecte des données et la couverture (méthodes de collecte des données, études spéciales sur la couverture, échantillonnage et pondération, contrôle et suivi, considérations sur la couverture et le contenu). Il contient également des textes généraux et spécialisés sur l'assimilation des données (codage automatisé et interactif), sur le contrôle et l'imputation ainsi que sur l'évaluation des données. Enfin, ce rapport technique contient une section traitant de la comparabilité des données dans le temps.

    Date de diffusion : 2004-08-26

  • Enquêtes et programmes statistiques — Documentation : 92-389-X
    Description :

    Ce rapport présente des renseignements de base sur les concepts et la qualité des données visant à faciliter l'utilisation et l'interprétation des données du recensement portant sur l'industrie. Il donne un aperçu du cycle de traitement des données, qui comprend notamment le dépouillement régional, le contrôle et l'imputation ainsi que le calcul des taux d'erreur. On y traite des changements importants apportés à la structure de classification des industries, ainsi que des différences par rapport au recensement précédent (1996) en ce qui touche les méthodes de codage. Enfin, ce rapport contient des tableaux sommaires faisant état de la qualité des données sur l'industrie du recensement de 2001.

    Date de diffusion : 2004-05-04
Date de modification :