Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Portail

    Contenu

    1 facets displayed. 0 facets selected.
    Aide à l'ordre
    entrées

    Résultats

    Tout (185)

    Tout (185) (0 à 10 de 185 résultats)

    • Microdonnées à grande diffusion : 99M0001X
      Description : Le Fichier des particuliers, Enquête nationale auprès des ménages, 2011 (fichier de microdonnées à grande diffusion) fournit des données sur les caractéristiques de la population canadienne. Le fichier contient un échantillon de 2,7 % de réponses anonymes tirées du questionnaire de l’Enquête nationale auprès des ménages (ENM) de 2011. Le fichier a été examiné minutieusement afin de garantir l'entière confidentialité des réponses individuelles et les identificateurs géographiques ont été limités aux provinces/territoires et aux régions métropolitaines. Avec ces 133 variables, cet outil de travail complet est excellent pour les analystes des politiques, les organismes de sondage, les chercheurs en sciences sociales et quiconque souhaitant modéliser et effectuer des analyses de régression statistique à l'aide des données de l'Enquête nationale auprès des ménages.

      Les fichiers de microdonnées sont les seuls produits donnant aux utilisateurs l'accès à des données non agrégées. L'utilisateur des FMGD peut grouper et manipuler ces variables en fonction de ses besoins et de l'objet de ses recherches. Il peut produire des totalisations qui sont exclues des autres produits l'ENM ou analyser les relations entre les variables en effectuant divers tests statistiques. Les FMGD donnent rapidement accès à une très vaste base de données sociales et économiques sur le Canada et ses habitants.

      Ce produit, offert en format DVD-ROM, comprend le fichier de données (en format ASCII); la documentation de l'utilisateur et l'information complémentaire; toutes les ententes de licence; ainsi que les programmes (codes sources) SAS, SPSS, et Stata pour permettre aux utilisateurs de lire l'ensemble des enregistrements. Afin d'utiliser ce produit, il est important de noter que les utilisateurs doivent posséder des connaissances pour manipuler des ensembles de données (ou des logiciels) comme SAS ou SPSS ou Stata.

      Date de diffusion : 2023-09-12

    • Articles et rapports : 12-001-X202300100002
      Description : Nous envisageons ici l’analyse de régression dans le contexte de l’intégration de données. Pour combiner des renseignements partiels de sources externes, nous utilisons l’idée de calage assisté par un modèle qui introduit un modèle « de travail » réduit fondé sur les covariables observées. Ce modèle de travail réduit n’est pas nécessairement spécifié correctement, mais il peut être un outil utile pour intégrer les renseignements partiels provenant de données externes. La mise en œuvre en tant que telle est fondée sur une application nouvelle de la projection d’information et de la pondération par calage du modèle. La méthode proposée est particulièrement intéressante pour combiner des renseignements de plusieurs sources présentant différentes tendances en matière de données manquantes. La méthode est appliquée à un exemple de données réelles combinant les données d’enquête de l'enquête KNHANES (enquête nationale coréenne sur la santé et la nutrition) et les mégadonnées du NHISS (service national coréen de partage de l’assurance maladie).
      Date de diffusion : 2023-06-30

    • Articles et rapports : 11-522-X202100100009
      Description :

      Le recours à des données auxiliaires pour améliorer l’efficacité d’estimateurs de totaux et de moyennes au moyen d’une procédure d’estimation d’enquête assistée par un modèle de régression a reçu une attention considérable ces dernières années. Des estimateurs par la régression généralisée (GREG), fondés sur un modèle de régression linéaire, sont actuellement utilisés dans le cadre d’enquêtes auprès d’établissements, à Statistique Canada et au sein de plusieurs autres organismes de statistiques. Les estimateurs GREG utilisent des poids d’enquête communs à toutes les variables d’étude et un calage aux totaux de population de variables auxiliaires. De plus en plus de variables auxiliaires sont disponibles et certaines peuvent être superflues. Cela mène à des poids GREG instables lorsque toutes les variables auxiliaires disponibles, y compris les interactions parmi les variables catégoriques, sont utilisées dans le modèle de régression linéaire. En revanche, de nouvelles méthodes d’apprentissage automatique, comme les arbres de régression et la méthode LASSO, sélectionnent automatiquement des variables auxiliaires significatives et mènent à des poids non négatifs stables et à d’éventuels gains d’efficacité par rapport à la méthode GREG. Dans cet article, une étude par simulations, fondée sur un ensemble de données-échantillon d’une enquête-entreprise réelle traité comme la population cible, est menée afin d’examiner le rendement relatif de la méthode GREG, d’arbres de régression et de la méthode LASSO sur le plan de l’efficacité des estimateurs.

      Mots-clés : inférence assistée par modèle; estimation par calage; sélection du modèle; estimateur par la régression généralisée.

      Date de diffusion : 2021-10-29

    • Articles et rapports : 89-657-X2018001
      Description :

      Cette étude se sert de données tirées de la Base de données longitudinales sur les immigrants pour examiner la participation aux études postsecondaires (EPS) au Canada des immigrants adultes appartenant à la cohorte d'établissement de 2002 à 2005, en mettant explicitement l'accent sur les réfugiés réinstallés. L'étude examine les caractéristiques démographiques des participants, les caractéristiques associées à la participation, ainsi que le rendement économique des investissements dans les EPS au Canada. En outre, elle utilise une analyse de la régression multivariée afin d'examiner de manière plus approfondie les effets de la participation aux EPS au Canada sur la fréquence de l'emploi et le revenu des travailleurs, tout en contrôlant d'autres facteurs associés à une intégration économique réussie.

      Date de diffusion : 2018-11-14

    • Articles et rapports : 12-001-X201600114541
      Description :

      Le présent travail a pour objet de comparer des estimateurs non paramétriques pour des fonctions de répartition de populations finies fondés sur deux types de valeurs prédites, à savoir celles données par l’estimateur bien connu de Kuo et une version modifiée de ces dernières, qui intègre une estimation non paramétrique de la fonction de régression à la moyenne. Pour chaque type de valeurs prédites, nous considérons l’estimateur fondé sur un modèle correspondant et, après incorporation des poids de sondage, l’estimateur par la différence généralisée. Nous montrons sous des conditions assez générales que le terme principal de l’erreur quadratique moyenne sous le modèle n’est pas affecté par la modification des valeurs prédites, même si cette modification réduit la vitesse de convergence pour le biais sous le modèle. Les termes d’ordre deux des erreurs quadratiques moyennes sous le modèle sont difficiles à obtenir et ne seront pas calculés dans le présent article. La question est de savoir si les valeurs prédites modifiées offrent un certain avantage du point de vue de l’approche fondée sur un modèle. Nous examinons aussi les propriétés des estimateurs sous le plan de sondage et proposons pour l’estimateur par la différence généralisée un estimateur de variance fondé sur les valeurs prédites modifiées. Enfin, nous effectuons une étude en simulation. Les résultats des simulations laissent entendre que les valeurs prédites modifiées entraînent

      Date de diffusion : 2016-06-22

    • Articles et rapports : 12-001-X201600114543
      Description :

      L’estimateur par régression est utilisé de façon intensive en pratique, car il peut améliorer la fiabilité de l’estimation des paramètres d’intérêt tels que les moyennes ou les totaux. Il utilise les totaux de contrôle des variables connues au niveau de la population qui sont incluses dans le modèle de régression. Dans cet article, nous examinons les propriétés de l’estimateur par régression qui utilise les totaux de contrôle estimés à partir de l’échantillon, ainsi que ceux connus au niveau de la population. Cet estimateur est comparé aux estimateurs par régression qui utilisent uniquement les totaux connus du point de vue théorique et par simulation.

      Date de diffusion : 2016-06-22

    • Articles et rapports : 12-001-X201600114545
      Description :

      L’estimation des quantiles est une question d’intérêt dans le contexte non seulement de la régression, mais aussi de la théorie de l’échantillonnage. Les expectiles constituent une solution de rechange naturelle ou un complément aux quantiles. En tant que généralisation de la moyenne, les expectiles ont gagné en popularité ces dernières années parce qu’en plus d’offrir un portrait plus détaillé des données que la moyenne ordinaire, ils peuvent servir à calculer les quantiles grâce aux liens étroits qui les associent à ceux-ci. Nous expliquons comment estimer les expectiles en vertu d’un échantillonnage à probabilités inégales et comment les utiliser pour estimer la fonction de répartition. L’estimateur ajusté de la fonction de répartition obtenu peut être inversé pour établir les estimations des quantiles. Nous réalisons une étude par simulations pour examiner et comparer l’efficacité de l’estimateur fondé sur des expectiles.

      Date de diffusion : 2016-06-22

    • Articles et rapports : 11F0019M2016376
      Description : La mesure dans laquelle les travailleurs se déplacent d’une région géographique à une autre, que ce soit en raison de possibilités d’emploi émergentes ou à la suite de chocs défavorables sur la demande de main d’œuvre, constitue un élément clé entrant dans le processus d’ajustement d’une économie et dans la capacité de cette dernière à assurer une répartition adéquate des ressources.

      La présente étude a pour but d’estimer l’effet causal des traitements et salaires annuels réels après impôt sur la propension des jeunes hommes à migrer vers l’Alberta ou à y accepter des emplois tout en continuant de résider dans leur province d’origine. À cette fin, l’étude tire parti de la variation interprovinciale de la croissance des revenus, induite vraisemblablement par des hausses des cours mondiaux du pétrole durant les années 2000.

      Date de diffusion : 2016-04-11

    • Articles et rapports : 11F0019M2015371
      Description :

      Le présent document vise à déterminer si les régimes de pension agréés (RPA) aident les ménages à se préparer financièrement pour la retraite ou se substituent simplement à d’autres formes d’épargne privée. Cette question est abordée au moyen d’un panel de 1,8 million de ménages canadiens, qui figurent dans la Banque de données administratives longitudinales, pour la période de 1991 à 2010. L’analyse contrôle les corrélations entre l’épargne dans divers comptes qui est attribuable à des préférences non observées, en exploitant le fait que les taux de cotisation des employeurs augmentent de façon discontinue pour les gains supérieurs au salaire moyen par activité économique, une caractéristique propre aux régimes de retraite professionnels au Canada, dont l’effet est estimé dans un plan de régression coudé.

      Date de diffusion : 2015-12-21

    • Articles et rapports : 12-001-X201500214236
      Description :

      Nous proposons une extension assistée par modèle des mesures de l’effet de plan dû à la pondération. Nous élaborons une statistique de niveau sommaire pour différentes variables d’intérêt, sous échantillonnage à un degré et ajustement des poids par calage. La mesure de l’effet de plan que nous proposons traduit les effets conjoints d’un plan d’échantillonnage avec probabilités de sélection inégales, des poids inégaux produits en utilisant des ajustements par calage et de la force de l’association entre la variable d’analyse et les variables auxiliaires utilisées pour le calage. Nous comparons la mesure proposée aux mesures existantes de l’effet de plan au moyen de simulations en utilisant des variables semblables à celles pour lesquelles des données sont recueillies dans les enquêtes auprès des établissements et dans les enquêtes téléphoniques auprès des ménages.

      Date de diffusion : 2015-12-17
    Données (2)

    Données (2) ((2 résultats))

    • Microdonnées à grande diffusion : 99M0001X
      Description : Le Fichier des particuliers, Enquête nationale auprès des ménages, 2011 (fichier de microdonnées à grande diffusion) fournit des données sur les caractéristiques de la population canadienne. Le fichier contient un échantillon de 2,7 % de réponses anonymes tirées du questionnaire de l’Enquête nationale auprès des ménages (ENM) de 2011. Le fichier a été examiné minutieusement afin de garantir l'entière confidentialité des réponses individuelles et les identificateurs géographiques ont été limités aux provinces/territoires et aux régions métropolitaines. Avec ces 133 variables, cet outil de travail complet est excellent pour les analystes des politiques, les organismes de sondage, les chercheurs en sciences sociales et quiconque souhaitant modéliser et effectuer des analyses de régression statistique à l'aide des données de l'Enquête nationale auprès des ménages.

      Les fichiers de microdonnées sont les seuls produits donnant aux utilisateurs l'accès à des données non agrégées. L'utilisateur des FMGD peut grouper et manipuler ces variables en fonction de ses besoins et de l'objet de ses recherches. Il peut produire des totalisations qui sont exclues des autres produits l'ENM ou analyser les relations entre les variables en effectuant divers tests statistiques. Les FMGD donnent rapidement accès à une très vaste base de données sociales et économiques sur le Canada et ses habitants.

      Ce produit, offert en format DVD-ROM, comprend le fichier de données (en format ASCII); la documentation de l'utilisateur et l'information complémentaire; toutes les ententes de licence; ainsi que les programmes (codes sources) SAS, SPSS, et Stata pour permettre aux utilisateurs de lire l'ensemble des enregistrements. Afin d'utiliser ce produit, il est important de noter que les utilisateurs doivent posséder des connaissances pour manipuler des ensembles de données (ou des logiciels) comme SAS ou SPSS ou Stata.

      Date de diffusion : 2023-09-12

    • Tableau : 75-001-X19890022277
      Description :

      Cette étude compare le revenu des travailleurs bilingues et unilingues dans trois centres urbains: Montréal, Toronto et Ottawa-Hull. Les différences de revenu sont examinées à la lumière de plusieurs considérations d'ordre démographique. L'auteur examine aussi les différences entre les travailleurs bilingues et unilingues sur le plan des emplois détenus.

      Date de diffusion : 1989-06-30
    Analyses (173)

    Analyses (173) (0 à 10 de 173 résultats)

    • Articles et rapports : 12-001-X202300100002
      Description : Nous envisageons ici l’analyse de régression dans le contexte de l’intégration de données. Pour combiner des renseignements partiels de sources externes, nous utilisons l’idée de calage assisté par un modèle qui introduit un modèle « de travail » réduit fondé sur les covariables observées. Ce modèle de travail réduit n’est pas nécessairement spécifié correctement, mais il peut être un outil utile pour intégrer les renseignements partiels provenant de données externes. La mise en œuvre en tant que telle est fondée sur une application nouvelle de la projection d’information et de la pondération par calage du modèle. La méthode proposée est particulièrement intéressante pour combiner des renseignements de plusieurs sources présentant différentes tendances en matière de données manquantes. La méthode est appliquée à un exemple de données réelles combinant les données d’enquête de l'enquête KNHANES (enquête nationale coréenne sur la santé et la nutrition) et les mégadonnées du NHISS (service national coréen de partage de l’assurance maladie).
      Date de diffusion : 2023-06-30

    • Articles et rapports : 11-522-X202100100009
      Description :

      Le recours à des données auxiliaires pour améliorer l’efficacité d’estimateurs de totaux et de moyennes au moyen d’une procédure d’estimation d’enquête assistée par un modèle de régression a reçu une attention considérable ces dernières années. Des estimateurs par la régression généralisée (GREG), fondés sur un modèle de régression linéaire, sont actuellement utilisés dans le cadre d’enquêtes auprès d’établissements, à Statistique Canada et au sein de plusieurs autres organismes de statistiques. Les estimateurs GREG utilisent des poids d’enquête communs à toutes les variables d’étude et un calage aux totaux de population de variables auxiliaires. De plus en plus de variables auxiliaires sont disponibles et certaines peuvent être superflues. Cela mène à des poids GREG instables lorsque toutes les variables auxiliaires disponibles, y compris les interactions parmi les variables catégoriques, sont utilisées dans le modèle de régression linéaire. En revanche, de nouvelles méthodes d’apprentissage automatique, comme les arbres de régression et la méthode LASSO, sélectionnent automatiquement des variables auxiliaires significatives et mènent à des poids non négatifs stables et à d’éventuels gains d’efficacité par rapport à la méthode GREG. Dans cet article, une étude par simulations, fondée sur un ensemble de données-échantillon d’une enquête-entreprise réelle traité comme la population cible, est menée afin d’examiner le rendement relatif de la méthode GREG, d’arbres de régression et de la méthode LASSO sur le plan de l’efficacité des estimateurs.

      Mots-clés : inférence assistée par modèle; estimation par calage; sélection du modèle; estimateur par la régression généralisée.

      Date de diffusion : 2021-10-29

    • Articles et rapports : 89-657-X2018001
      Description :

      Cette étude se sert de données tirées de la Base de données longitudinales sur les immigrants pour examiner la participation aux études postsecondaires (EPS) au Canada des immigrants adultes appartenant à la cohorte d'établissement de 2002 à 2005, en mettant explicitement l'accent sur les réfugiés réinstallés. L'étude examine les caractéristiques démographiques des participants, les caractéristiques associées à la participation, ainsi que le rendement économique des investissements dans les EPS au Canada. En outre, elle utilise une analyse de la régression multivariée afin d'examiner de manière plus approfondie les effets de la participation aux EPS au Canada sur la fréquence de l'emploi et le revenu des travailleurs, tout en contrôlant d'autres facteurs associés à une intégration économique réussie.

      Date de diffusion : 2018-11-14

    • Articles et rapports : 12-001-X201600114541
      Description :

      Le présent travail a pour objet de comparer des estimateurs non paramétriques pour des fonctions de répartition de populations finies fondés sur deux types de valeurs prédites, à savoir celles données par l’estimateur bien connu de Kuo et une version modifiée de ces dernières, qui intègre une estimation non paramétrique de la fonction de régression à la moyenne. Pour chaque type de valeurs prédites, nous considérons l’estimateur fondé sur un modèle correspondant et, après incorporation des poids de sondage, l’estimateur par la différence généralisée. Nous montrons sous des conditions assez générales que le terme principal de l’erreur quadratique moyenne sous le modèle n’est pas affecté par la modification des valeurs prédites, même si cette modification réduit la vitesse de convergence pour le biais sous le modèle. Les termes d’ordre deux des erreurs quadratiques moyennes sous le modèle sont difficiles à obtenir et ne seront pas calculés dans le présent article. La question est de savoir si les valeurs prédites modifiées offrent un certain avantage du point de vue de l’approche fondée sur un modèle. Nous examinons aussi les propriétés des estimateurs sous le plan de sondage et proposons pour l’estimateur par la différence généralisée un estimateur de variance fondé sur les valeurs prédites modifiées. Enfin, nous effectuons une étude en simulation. Les résultats des simulations laissent entendre que les valeurs prédites modifiées entraînent

      Date de diffusion : 2016-06-22

    • Articles et rapports : 12-001-X201600114543
      Description :

      L’estimateur par régression est utilisé de façon intensive en pratique, car il peut améliorer la fiabilité de l’estimation des paramètres d’intérêt tels que les moyennes ou les totaux. Il utilise les totaux de contrôle des variables connues au niveau de la population qui sont incluses dans le modèle de régression. Dans cet article, nous examinons les propriétés de l’estimateur par régression qui utilise les totaux de contrôle estimés à partir de l’échantillon, ainsi que ceux connus au niveau de la population. Cet estimateur est comparé aux estimateurs par régression qui utilisent uniquement les totaux connus du point de vue théorique et par simulation.

      Date de diffusion : 2016-06-22

    • Articles et rapports : 12-001-X201600114545
      Description :

      L’estimation des quantiles est une question d’intérêt dans le contexte non seulement de la régression, mais aussi de la théorie de l’échantillonnage. Les expectiles constituent une solution de rechange naturelle ou un complément aux quantiles. En tant que généralisation de la moyenne, les expectiles ont gagné en popularité ces dernières années parce qu’en plus d’offrir un portrait plus détaillé des données que la moyenne ordinaire, ils peuvent servir à calculer les quantiles grâce aux liens étroits qui les associent à ceux-ci. Nous expliquons comment estimer les expectiles en vertu d’un échantillonnage à probabilités inégales et comment les utiliser pour estimer la fonction de répartition. L’estimateur ajusté de la fonction de répartition obtenu peut être inversé pour établir les estimations des quantiles. Nous réalisons une étude par simulations pour examiner et comparer l’efficacité de l’estimateur fondé sur des expectiles.

      Date de diffusion : 2016-06-22

    • Articles et rapports : 11F0019M2016376
      Description : La mesure dans laquelle les travailleurs se déplacent d’une région géographique à une autre, que ce soit en raison de possibilités d’emploi émergentes ou à la suite de chocs défavorables sur la demande de main d’œuvre, constitue un élément clé entrant dans le processus d’ajustement d’une économie et dans la capacité de cette dernière à assurer une répartition adéquate des ressources.

      La présente étude a pour but d’estimer l’effet causal des traitements et salaires annuels réels après impôt sur la propension des jeunes hommes à migrer vers l’Alberta ou à y accepter des emplois tout en continuant de résider dans leur province d’origine. À cette fin, l’étude tire parti de la variation interprovinciale de la croissance des revenus, induite vraisemblablement par des hausses des cours mondiaux du pétrole durant les années 2000.

      Date de diffusion : 2016-04-11

    • Articles et rapports : 11F0019M2015371
      Description :

      Le présent document vise à déterminer si les régimes de pension agréés (RPA) aident les ménages à se préparer financièrement pour la retraite ou se substituent simplement à d’autres formes d’épargne privée. Cette question est abordée au moyen d’un panel de 1,8 million de ménages canadiens, qui figurent dans la Banque de données administratives longitudinales, pour la période de 1991 à 2010. L’analyse contrôle les corrélations entre l’épargne dans divers comptes qui est attribuable à des préférences non observées, en exploitant le fait que les taux de cotisation des employeurs augmentent de façon discontinue pour les gains supérieurs au salaire moyen par activité économique, une caractéristique propre aux régimes de retraite professionnels au Canada, dont l’effet est estimé dans un plan de régression coudé.

      Date de diffusion : 2015-12-21

    • Articles et rapports : 12-001-X201500214236
      Description :

      Nous proposons une extension assistée par modèle des mesures de l’effet de plan dû à la pondération. Nous élaborons une statistique de niveau sommaire pour différentes variables d’intérêt, sous échantillonnage à un degré et ajustement des poids par calage. La mesure de l’effet de plan que nous proposons traduit les effets conjoints d’un plan d’échantillonnage avec probabilités de sélection inégales, des poids inégaux produits en utilisant des ajustements par calage et de la force de l’association entre la variable d’analyse et les variables auxiliaires utilisées pour le calage. Nous comparons la mesure proposée aux mesures existantes de l’effet de plan au moyen de simulations en utilisant des variables semblables à celles pour lesquelles des données sont recueillies dans les enquêtes auprès des établissements et dans les enquêtes téléphoniques auprès des ménages.

      Date de diffusion : 2015-12-17

    • Articles et rapports : 12-001-X201500114160
      Description :

      L’estimation composite est une technique applicable aux enquêtes répétées avec chevauchement contrôlé entre les enquêtes successives. Le présent article examine les estimateurs par la régression modifiée qui permettent d’intégrer l’information provenant de périodes antérieures dans les estimations pour la période courante. La gamme d’estimateurs par la régression modifiée est étendue au cas des enquêtes-entreprises dont la base de sondage évolue avec le temps en raison de l’ajout des « nouvelles entreprises » et de la suppression des « entreprises disparues ». Puisque les estimateurs par la régression modifiée peuvent s’écarter de l’estimateur par la régression généralisée au cours du temps, il est proposé d’utiliser un estimateur par la régression modifiée de compromis correspondant à la moyenne pondérée de l’estimateur par la régression modifiée et de l’estimateur par la régression généralisée. Une étude par simulation Monte Carlo montre que l’estimateur par la régression modifiée de compromis proposé donne lieu à d’importants gains d’efficacité en ce qui concerne les estimations ponctuelles ainsi que les estimations des variations.

      Date de diffusion : 2015-06-29
    Références (10)

    Références (10) ((10 résultats))

    • Enquêtes et programmes statistiques — Documentation : 11-522-X20010016308
      Description :

      Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

      Le Census Bureau utilise une analyse des erreurs de réponse pour évaluer l'efficacité des questions d'une enquête. Pour une enquête donnée, nous choisissons les questions à analyser que nous jugeons essentielles à l'enquête ou qui sont considérées comme problématiques à la suite d'une analyse antérieure. Les questions nouvelles ou révisées sont les plus susceptibles de faire l'objet d'une réinterview, c'est-à-dire d'une nouvelle interview qui consiste à poser de nouveau à un échantillon des répondants à l'enquête un sous-ensemble de questions provenant de l'interview originale. Pour chaque question de la réinterview, nous évaluons la proportion des répondants qui donnent des réponses incohérentes. Nous utilisons l'« indice d'incohérence » pour mesurer la variance de réponse. Pour chaque question, nous indiquons si la variance de réponse est faible, moyenne ou élevée. Dans le cas d'une variance élevée, les questions font l'objet d'un test cognitif et nous recommandons des modifications à apporter aux questions.

      Pour l'analyse des erreurs de réponse de la Schools and Staffing Survey (SASS) parrainée par le National Center for Education Statistics (NCES), nous étudions également les liens possibles entre les réponses incohérentes et les caractéristiques des écoles et des enseignants qui participent à l'enquête. On peut utiliser les résultats de cette analyse pour modifier la méthode d'enquête en vue d'améliorer la qualité des données.

      Date de diffusion : 2002-09-12

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015656
      Description :

      Les études de séries chronologiques montrent qu'il existe une association entre la concentration des polluants atmosphériques, d'une part, et la morbidité et la mortalité, d'autre part. En général, ces études sont réalisées dans une seule ville, en appliquant diverses méthodes. Les critiques concernant ces études ont trait à la validité des ensembles de données utilisés et aux méthodes statistiques qui leur sont appliquées, ainsi qu'au manque de cohérence des résultats des études menées dans des villes différentes et même des nouvelles analyses indépendantes des données d'une ville particulière. Dans le présent article, nous examinons certaines des méthodes statistiques utilisées pour analyser un sous-ensemble de données nationales sur la pollution atmosphérique, la mortalité et les conditions météorologiques recueillies durant la National Morbidity and Mortality Air Pollution Study (NMMAPS).

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015668
      Description :

      À la suite des problèmes d'estimation du sous-dénombrement qu'a posé le Recensement de l'Angleterre et du Pays de Galles de 1991, on s'est fixé comme objectif pour le Recensement de 2001 de créer une base de données entièrement corrigée pour tenir compte du sous-dénombrement net. Dans la présente communication, on examine l'application d'une méthode d'imputation pondérée par donneur qui se fonde sur des renseignements provenant tant du recensement que de l'Enquête sur la couverture du recensement (ECR). Le US Census Bureau envisage une approche similaire pour le Recensement des États-Unis de l'an 2000 (voir Isaki et coll. 1998). La méthode proposée fait la distinction entre les personnes qui ne sont pas dénombrées lors du recensement parce qu'on a manqué leur ménage et celles qui ne sont pas dénombrées dans les ménages qui ont été recensés. Les données de recensement sont couplées aux données de l'ECR. On utilise la régression logistique multinominale pour estimer la probabilité que des ménages soient omis dans le recensement, ainsi que la probabilité que des personnes ne soient pas dénombrées au sein de ménages recensés. On calcule des poids de couverture pour les ménages et pour les personnes d'après les probabilités estimatives, puis on les inègre à la méthode d'imputation par donneur.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015682
      Description :

      L'application de la méthode d'estimation à double système (EDS) aux données appariées du recensement et de l'enquête postcensitaire (EPC) afin de déterminer le sous-dénombrement net est bien comprise (Hogan, 1993). Cependant, cette méthode n'a pas été utilisée jusqu'à présent pour évaluer le sous-dénombrement net au Royaume-Uni. On l'appliquera pour la première fois à l'occasion de l'EPC de 2001. Le présent article décrit la méthodologie générale employée pour la conception de l'enquête et pour l'estimation de cette EPC (baptisée Enquête sur la couverture du Recensement de 2001). L'estimation combine l'EDS et un estimateur par quotient ou par régression. Une étude par simulations utilisant les données du Recensement de 1991 de l'Angleterre et du pays de Galles montre que le modèle du quotient est en général plus robuste que le modèle de régression.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015684
      Description :

      Il arrive souvent qu'on recueille, de façon pratiquement simultaée, la même information sur plusieurs enquêtes différentes. En France, cela est institutionnalisé dans les enquêtes auprès des ménages qui comportent un tronc commun de variables portant sur la situation démographique, l'emploi, le logement et les revenus. Ces variables sont des cofacteurs importants des variables d'intérêt de chacune des enquêtes et leur utilisation judicieuse peut permettre un renforcement des estimations dans chacune d'elle. Les techniques de calage sur information incertaine peuvent s'appliquer de façon naturelle dans ce contexte. Cela revient à rechercher le meilleur estimateur sans biais des variables communes et à caler chacune des enquêtes sur cet estimateur. Il se trouve que l'estimateur ainsi obtenu dans chaque enquête est toujours un estimateur linéaire dont les pondérations sont faciles à expliciter, que la variance s'obtient sans problème nouveau de même que l'estimation de variance. Si on veut compléter la panoplie des estimateurs par régression, on peut aussi voir cette technique comme un estimateur par ridge-regression, ou encore comme une estimation par régression bayésienne.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015688
      Description :

      Des données de sources multiples sont couplées pour examiner les liens géographique et temporel entre la pollution atmosphérique et l'asthme. Ces sources incluent les dossiers administratifs établis par 59 cabinets de médecins généralistes répartis à travers l'Angleterre et le Pays de Galles au sujet d'un demi million de patients venus à la consultation pour cause d'asthme, ainsi que des renseignements socioéconomiques recueillis dans le cadre d'une enquête par interview. Les codes postaux permettent de coupler ces données à celles sur i) la densité routière calculée pour les routes locales, ii) les émissions estimatives de dioxyde de soufre et d'oxydes d'azote, iii) la concentration de fumée noire, de dioxyde de soufre, de dioxyde d'azote et d'autres polluants mesurée ou interpolée aux emplacements des cabinets de médecins. Parallèlement, on analyse des séries chronologiques de Poisson, en tenant compte des variations entre cabinets de médecins, pour examiner les corrélations quotidiennes dans le cas des cabinets situés près des stations de surveillance de la qualité de l'air. Les analyses préliminaires montrent une association faible, en général non significative, entre les taux de consultations et les marqueurs de pollution. On examine les problèmes méthodologiques que posent la combinaison de données de ce genre et l'interprétation des résultats.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015692
      Description :

      Les tarifs d'électricité qui varient selon la période de la journée, appelés aussi tarifs horaires ou tarifs multiples, sont susceptibles d'accroître considérablement l'efficacité économique du marché de l'énergie. Plusieurs services publics d'électricité ont étudié les effets économiques des programmes de tarification selon la période de consommation offerts à leur clientèle résidentielle. On recourt ici à la méta-analyse pour regrouper les résultats de trente-huit programmes distincts en vue d'étudier l'effet des tarifs multiples sur la demande d'électricité. Quatre constations importantes se dégagent de l'analyse. Premièrement, le rapport entre le tarif de période de pointe et le tarif en période creuse doit être élevé pour que l'effet sur la demande de pointe soit important. Deuxièmement, les tarifs de période de pointe ontune incidence relativement plus importante sur la demande en été qu'en hiver. Troisièmement, les tarifs sont relativement plus efficaces s'ils sont sur une base permanente plutôt qu'expérimentale. Quatrièmement, la perception de frais en fonction de la demande concurrence les tarifs multiples ordinaires sur la demande de pointe.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015017
      Description :

      Les études longitudinales avec observations répétées sur des individus permettent de mieux caractériser les changements et de mieux évaluer les facteurs de risque éventuels. On possède toutefois peu d'expérience sur l'application de modèles perfectionnés à des données longitudinales avec plan d'échantillonnage complexe. Nous présentons ici les résultats d'une comparaison de différentes méthodes d'estimation de la variance applicables à des modèles à effets aléatoires évaluant l'évolution de la fonction cognitive chez les personnes âgées. Le plan d'échantillonnage consiste en un échantillon stratifié de personnes âgées de 65 ans et plus, prélevé dans le cadre d'une étude communautaire visant à examiner les facteurs de risque de la démence. Le modèle résume l'hétérogénéité de la population, en ce qui a trait au niveau global et au taux d'évolution de la fonction cognitive, en utilisant des effets aléatoires comme coordonnée à l'origine et comme pente. Nous discutons d'une méthode de régression non pondérée avec covariables représentant les variables de stratification, d'une méthode de régression pondérée et de la méthode bootstrap; nous présentons également quelques travaux préliminaires sur la méthode de répétition équilibrée et celle du jackknife.

      Date de diffusion : 1999-10-22

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015029
      Description :

      Dans le cas des enquêtes longitudinales, les sujets qui font partie de l'échantillon sont observés pendant plusieurs périodes. En général, cette caractéristique produit des observations dépendantes sur le même sujet, plus des corrélations ordinaires entre sujets résultant du plan d'échantillonnage. Nombre des travaux décrits dans la littérature portent surtout sur la modélisation de la moyenne marginale d'une réponse en fonction de covariables. Liang et Zeger (1986) se sont servis d'équations d'estimation généralisées nécessitant uniquement la spécification correcte de la moyenne marginale et ont obtenu les erreurs-types des estimations des paramètres de régression et les critères connexes du test de Wald, en supposant que les mesures répétées effectuées sur un sujet de l'échantillon présentent une structure de corrélation provisoire. Rotnitzky et Jewell (1990) ont développé des tests de quasi-résultat et des corrections de Rao-Scott aux tests de quasi-résultat provisoire dans le cadre de modèles marginaux. Ces méthodes sont asymptotiquement robustes en regard de la spécification erronée de la structure des corrélations propre à un sujet, mais supposent que les sujets de l'échantillon sont indépendants, ce qui n'est pas toujours vrai dans le cas de donneées d'enquêtes longitudinales complexes fondées sur un échantillonnage stratifié à plusieurs degrés. Nous proposons des tests de Wald et des tests de quasi-score asymptotiquement valides pour les données d'enquêtes longitudinales, fondés sur la méthode de linéarisation de Taylor et sur la méthode jackknife. Nous élaborons aussi d'autres tests, fondés sur les corrections apportées par Rao-Scott à des tests naïfs qui ne tiennent pas compte des caractéristiques du plan de sondage et sur les t de Bonferroni. Ces tests sont particulièrement utiles quand le nombre réel de degrés de liberté, ordinairement considéré comme égal au nombre total d'unités primaires dans l'échantillon (grappes) moins le nombre de strates, est petit.

      Date de diffusion : 1999-10-22

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015035
      Description :

      Dans le cadre d'une enquête longitudinale effectuée pendant k périodes, certaines unités peuvent être observées pour un nombre de périodes inférieur à k. Les enquêtes avec sous-échantillons se chevauchant partiellement, les enquêtes par panel pur avec non-réponse (une enquête par panel pur étant une enquête par panel non-complétée d'échantillons supplémentaires) et les enquêtes par panel complétées par des échantillons supplémentaires pour certaines périodes en sont des exemples. Nous présentons des estimateurs par régression pour des enquêtes de ce genre. Nous examinons une application aux études spéciales liées au National Resources Inventory.

      Date de diffusion : 1999-10-22
    Date de modification :