Aide à l'ordre
entrées

Résultats

Tout (29)

Tout (29) (0 à 10 de 29 résultats)

  • Articles et rapports : 81-595-M2003011
    Géographie : Canada
    Description :

    Dans ce rapport, on remet en cause les concepts fondamentaux qui orientent le travail statistique portant sur l'enseignement postsecondaire.

    Date de diffusion : 2003-12-23

  • Articles et rapports : 12-001-X20030016600
    Description :

    La comparabilité internationale des statistiques officielles est importante pour les utilisations intérieures d'un pays. Or, la comparabilité internationale compte aussi pour les utilisations internationales des statistiques, notamment lorsqu'il s'agit d'élaborer des politiques mondiales, d'en assurer le suivi et d'évaluer le développement économique et social dans le monde entier. De plus, les organismes internationaux et les programmes d'assistance technique bilatérale utilisent les statistiques pour suivre l'incidence de l'assistance technique.La première partie de la présente communication décrit comment les Nations Unies et d'autres organismes utilisent les indicateurs statistiques. Nous décrivons le cadre d'utilisation des indicateurs statistiques pour ces fins et nous cernons certains enjeux concernant le choix et la qualité de ces indicateurs.De nombreux travaux de recherche méthodologique ont déjà été consacrés aux statistiques officielles, notamment par les principaux bureaux statistiques nationaux et par certains universitaires. Ces travaux ont permis de définir les méthodologies de base pour l'établissement des statistiques officielles et ont favorisé avec le temps une évolution et une amélioration considérables de la qualité. On a accompli de grands progrès. Dans une certaine mesure, toutefois, on a plutôt mis l'accent sur les utilisations nationales des statistiques officielles. Ces travaux ont évidemment profité aux utilisations internationales, qui ont aussi évolué à certains égards. Il est toutefois nécessaire de promouvoir l'avancement de la méthodologie sur le plan des besoins internationaux. Dans la deuxième partie de la présente communication, un certain nombre d'exemples illustrent cette nécessité.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016601
    Description :

    Dans les estimations régionales, on utilise des données provenant de domaines comparables pour évaluer la moyenne d'une petite région en particulier. Cet emprunt d'information est justifié par la spécification d'un modèle hypothétique reliant les moyennes des petites régions. On propose donc une méthode bayésienne non informative ou objective d'estimation pour les petites régions. Cette méthode permet d'évaluer d'autres paramètres de population que la moyenne et de produire des estimations raisonnables quant à leur précision. Classification AMS 1991 : primaire 62D05; secondaire 62C10.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016602
    Description :

    L'Enquête sur la population active (EPA) du Canada permet de produire des estimations mensuelles directes du taux de chômage aux échelons national et provincial. Le programme de l'EPA diffuse aussi des estimations du chômage pour des régions infraprovinciales, comme les régions métropolitaines de recensement (RMR) et les agglomérations de recensement (AR). Cependant, pour certaines de ces régions infraprovinciales, les estimations directes ne sont pas très fiables, parce que la taille de l'échantillon est assez petite. On utilise donc un modèle transversal et chronologique permettant d'emprunter de l'information recueillie pour diverses régions et périodes de référence afin de produire des estimations du taux de chômage fondées sur un modèle au niveau de la RMR ou de l'AR. Ce modèle est une généralisation d'un modèle transversal d'usage très répandu pour l'estimation régionale qui inclut un modèle de marche aléatoire ou modèle AR (1) pour la composante temporelle aléatoire. On utilise les données mensuelles sur les bénéficiaires de l'assurance-emploi (a.-e.) au niveau de la RMR ou de l'AR comme covariables auxiliaires dans le modèle. On suit une méthode hiérarchique bayésienne (HB) et on utilise l'échantillonneur de Gibbs pour générer des échantillons à partir de la loi conjointe a posteriori. On obtient les estimateurs Rao-Blackwellisés pour les moyennes et les variances a posteriori des taux de chômage au niveau de la RMR/AR. La méthode HB lisse les estimations d'enquête et réduit considérablement les erreurs-types. On étudie aussi l'ajustement du modèle bayésien en nous fondant sur les lois prédictives a posteriori.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016605
    Description :

    Dans ce document, on examine l'effet du choix d'un modèle sur différents types d'estimateurs des totaux des domaines (y compris les petits domaines ou les petites régions), pour une population finie échantillonnée. On compare différents types d'estimateurs pour un même énoncé de modèle sous-jacent. À notre avis, le type d'estimateur (synthétique, de régression généralisée [GREG], composite, du meilleur prédicteur linéaire sans biais empirique, hiérarchique de Bayes, etc.) constitue un aspect important de l'estimation des domaines. Quant au choix d'un modèle, y compris ses paramètres et ses effets, il constitue un deuxième aspect, différent du premier sur le plan conceptuel. Les travaux antérieurs n'ont pas toujours établi cette distinction. Pour un type d'estimateur donné, on peut calculer différents estimateurs, selon le choix du modèle. Un certain nombre de types d'estimateurs ont été proposés dans les articles récents, mais les auteurs qui les comparent de façon impartiale sont relativement peu nombreux. Dans ce document, on aborde trois types d'estimateurs : synthétique, de régression généralisée (GREG) et, dans une moindre mesure, composite. On montre que l'amélioration du modèle (transition d'un modèle faible à un modèle fort) a des effets très différents sur les divers types d'estimateurs. On indique aussi que la différence d'exactitude entre les divers types d'estimateurs dépend du choix du modèle. Pour un modèle bien défini, la différence d'exactitude entre l'estimateur synthétique et l'estimateur de régression généralisée (GREG) est négligeable, mais elle peut être substantielle si le modèle est mal défini. L'estimateur synthétique a alors tendance à être très inexact. L'étude est fondée en partie sur des résultats théoriques (pour l'échantillonnage aléatoire simple seulement) et en partie sur des résultats empiriques. Les résultats empiriques sont ceux de simulations effectuées avec des échantillons répétés tirés de deux populations finies, l'une construite artificiellement et l'autre, construite à partir de données réelles tirées de l'Enquête sur la population active finlandaise.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016607
    Description :

    L'Enquête sur la population économiquement active (EPEA) de la Corée a été menée afin de produire des statistiques sur le chômage pour de grands territoires comme les régions métropolitaines et les provinces. Ces grandes régions sont considérées comme des domaines planifiés dans l'EPEA, et les régions locales autonomes (RLA), comme des domaines non planifiés. Dans cette étude, on propose des méthodes d'estimations régionales pour rajuster les statistiques sur le chômage dans les RLA comprises dans les grandes régions pour lesquelles les valeurs sont évaluées directement d'après les données courantes de l'EPEA. On suggère des estimateurs synthétiques et composites dans les conditions de l'EPEA de la Corée et, pour l'estimateur basé sur un modèle, on propose l'estimateur hiérarchique de Bayes (HB) tiré du modèle multiniveaux général. L'estimateur HB utilisé dans cette étude a été introduit par You et Rao en 2000. On calcule les erreurs quadratiques moyennes des estimations synthétiques et composites à partir des données de l'EPEA par la méthode du jackknife et on les utilise pour déterminer l'exactitude des estimations régionales. On emploie l'échantillonnage de Gibbs pour obtenir les estimations HB et leurs variances a posteriori, lesquelles sont utilisées pour mesurer la précision des estimations régionales. On a évalué le chômage total pour les 10 RLA comprises dans la province de ChoongBuk d'après les données de l'EPEA de décembre 2000 par les méthodes d'estimations régionales proposées dans cette étude. On évalue la fiabilité des estimations régionales au moyen des erreurs-types relatives ou de la racine relative de l'erreur quadratique moyenne de ces estimations. On avance que, sous le système actuel de l'EPEA de la Corée, les estimations composites sont plus fiables que les autres estimations régionales.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016608
    Description :

    La présente étude porte sur les propriétés non conditionnelles et conditionnelles de certains estimateurs de petites régions bien connus, à savoir l'estimateur par extension, l'estimateur par le quotient stratifié a posteriori, l'estimateur synthétique, l'estimateur composite, l'estimateur dépendant de la taille de l'échantillon et le meilleur prédicteur linéaire sans biais empirique. On examine un plan d'échantillonnage à deux degrés, puisque ce genre de plan d'échantillonnage est utilisé couramment pour les enquêtes auprès des ménages réalisées par l'Institut national de statistique d'Italie. On procède à une évaluation par simulation fondée sur des données du recensement de l'Italie de 1991. Les petites régions considérées sont les zones du marché du travail, qui sont des domaines non planifiés qui recoupent les limites des strates du plan d'échantillonnage.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016609
    Description :

    Pour automatiser le processus de vérification des données, il faut résoudre le problème de localisation des erreurs, c'est-à-dire la détermination des zones erronées dans un enregistrement incorrect. En 1976, Fellegi et Holt ont proposé un paradigme pour repérer automatiquement les erreurs. Au fil des ans, ce paradigme a été généralisé pour s'énoncer comme suit : on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier les valeurs des variables dont la somme des poids de fiabilité est la plus faible possible. Par poids de fiabilité d'une variable, nous entendons un nombre non négatif précisant dans quelle mesure la valeur de cette variable est jugée fiable. Étant donné ce paradigme, il faut résoudre le problème mathématique résultant. Nous examinons ici comment les méthodes de génération de sommets peuvent être utilisées pour résoudre ce problème mathématique dans le cas de données mixtes, c'est-à-dire une combinaison de données catégoriques (discrètes) et numériques (continues). Le but principal de l'article n'est pas de présenter de nouveaux résultats, mais plutôt de combiner les idées de plusieurs auteurs afin de donner une description « complète », intégrée, de l'utilisation des méthodes de génération de sommets pour résoudre le problème de localisation des erreurs dans le cas de données mixtes. Nous décrirons surtout dans notre exposé la façon dont on peut adapter aux données mixtes les méthodes élaborées pour des données numériques.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016610
    Description :

    En présence de non-réponse partielle, en pratique, on recourt souvent à des méthodes d'imputation non pondérée, mais celles-ci produisent généralement des estimateurs biaisés sous l'hypothèse d'une réponse uniforme à l'intérieur des classes d'imputation. En nous inspirant de Skinner et Rao (2002), nous proposons un estimateur corrigé pour le biais d'une moyenne de population sous imputation par le ratio non pondérée et sous imputation aléatoire hot-deck, et nous calculons des estimateurs de la variance par linéarisation. Nous réalisons une petite étude en simulation pour évaluer les propriétés de biais et d'erreur quadratique moyenne des estimateurs obtenus. Nous étudions aussi le biais relatif et la stabilité relative des estimateurs de la variance.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016611
    Description :

    On examine des plans d'échantillonnage bayésiens à coûts fixes optimaux et approximativement optimaux pour l'estimation simultanée dans des processus de Poisson homogènes indépendants. On élabore des formules générales de répartition pour un modèle de base Poisson-Gamma et on les compare à des méthodes plus classiques de répartition. On discute aussi des méthodes permettant de trouver des lois a priori gamma représentatives sous des modèles hiérarchiques plus généraux et on montre que, dans plusieurs situations pratiques, ces méthodes donnent des approximations raisonnables de la loi a priori hiérarchique et du risque bayésien. Les méthodes mises au point sont suffisamment générales pour être appliquées à un large éventail de modèles et ne sont pas limitées aux processus de Poisson.

    Date de diffusion : 2003-07-31
Stats en bref (0)

Stats en bref (0) (0 résultat)

Aucun contenu disponible actuellement

Articles et rapports (29)

Articles et rapports (29) (0 à 10 de 29 résultats)

  • Articles et rapports : 81-595-M2003011
    Géographie : Canada
    Description :

    Dans ce rapport, on remet en cause les concepts fondamentaux qui orientent le travail statistique portant sur l'enseignement postsecondaire.

    Date de diffusion : 2003-12-23

  • Articles et rapports : 12-001-X20030016600
    Description :

    La comparabilité internationale des statistiques officielles est importante pour les utilisations intérieures d'un pays. Or, la comparabilité internationale compte aussi pour les utilisations internationales des statistiques, notamment lorsqu'il s'agit d'élaborer des politiques mondiales, d'en assurer le suivi et d'évaluer le développement économique et social dans le monde entier. De plus, les organismes internationaux et les programmes d'assistance technique bilatérale utilisent les statistiques pour suivre l'incidence de l'assistance technique.La première partie de la présente communication décrit comment les Nations Unies et d'autres organismes utilisent les indicateurs statistiques. Nous décrivons le cadre d'utilisation des indicateurs statistiques pour ces fins et nous cernons certains enjeux concernant le choix et la qualité de ces indicateurs.De nombreux travaux de recherche méthodologique ont déjà été consacrés aux statistiques officielles, notamment par les principaux bureaux statistiques nationaux et par certains universitaires. Ces travaux ont permis de définir les méthodologies de base pour l'établissement des statistiques officielles et ont favorisé avec le temps une évolution et une amélioration considérables de la qualité. On a accompli de grands progrès. Dans une certaine mesure, toutefois, on a plutôt mis l'accent sur les utilisations nationales des statistiques officielles. Ces travaux ont évidemment profité aux utilisations internationales, qui ont aussi évolué à certains égards. Il est toutefois nécessaire de promouvoir l'avancement de la méthodologie sur le plan des besoins internationaux. Dans la deuxième partie de la présente communication, un certain nombre d'exemples illustrent cette nécessité.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016601
    Description :

    Dans les estimations régionales, on utilise des données provenant de domaines comparables pour évaluer la moyenne d'une petite région en particulier. Cet emprunt d'information est justifié par la spécification d'un modèle hypothétique reliant les moyennes des petites régions. On propose donc une méthode bayésienne non informative ou objective d'estimation pour les petites régions. Cette méthode permet d'évaluer d'autres paramètres de population que la moyenne et de produire des estimations raisonnables quant à leur précision. Classification AMS 1991 : primaire 62D05; secondaire 62C10.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016602
    Description :

    L'Enquête sur la population active (EPA) du Canada permet de produire des estimations mensuelles directes du taux de chômage aux échelons national et provincial. Le programme de l'EPA diffuse aussi des estimations du chômage pour des régions infraprovinciales, comme les régions métropolitaines de recensement (RMR) et les agglomérations de recensement (AR). Cependant, pour certaines de ces régions infraprovinciales, les estimations directes ne sont pas très fiables, parce que la taille de l'échantillon est assez petite. On utilise donc un modèle transversal et chronologique permettant d'emprunter de l'information recueillie pour diverses régions et périodes de référence afin de produire des estimations du taux de chômage fondées sur un modèle au niveau de la RMR ou de l'AR. Ce modèle est une généralisation d'un modèle transversal d'usage très répandu pour l'estimation régionale qui inclut un modèle de marche aléatoire ou modèle AR (1) pour la composante temporelle aléatoire. On utilise les données mensuelles sur les bénéficiaires de l'assurance-emploi (a.-e.) au niveau de la RMR ou de l'AR comme covariables auxiliaires dans le modèle. On suit une méthode hiérarchique bayésienne (HB) et on utilise l'échantillonneur de Gibbs pour générer des échantillons à partir de la loi conjointe a posteriori. On obtient les estimateurs Rao-Blackwellisés pour les moyennes et les variances a posteriori des taux de chômage au niveau de la RMR/AR. La méthode HB lisse les estimations d'enquête et réduit considérablement les erreurs-types. On étudie aussi l'ajustement du modèle bayésien en nous fondant sur les lois prédictives a posteriori.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016605
    Description :

    Dans ce document, on examine l'effet du choix d'un modèle sur différents types d'estimateurs des totaux des domaines (y compris les petits domaines ou les petites régions), pour une population finie échantillonnée. On compare différents types d'estimateurs pour un même énoncé de modèle sous-jacent. À notre avis, le type d'estimateur (synthétique, de régression généralisée [GREG], composite, du meilleur prédicteur linéaire sans biais empirique, hiérarchique de Bayes, etc.) constitue un aspect important de l'estimation des domaines. Quant au choix d'un modèle, y compris ses paramètres et ses effets, il constitue un deuxième aspect, différent du premier sur le plan conceptuel. Les travaux antérieurs n'ont pas toujours établi cette distinction. Pour un type d'estimateur donné, on peut calculer différents estimateurs, selon le choix du modèle. Un certain nombre de types d'estimateurs ont été proposés dans les articles récents, mais les auteurs qui les comparent de façon impartiale sont relativement peu nombreux. Dans ce document, on aborde trois types d'estimateurs : synthétique, de régression généralisée (GREG) et, dans une moindre mesure, composite. On montre que l'amélioration du modèle (transition d'un modèle faible à un modèle fort) a des effets très différents sur les divers types d'estimateurs. On indique aussi que la différence d'exactitude entre les divers types d'estimateurs dépend du choix du modèle. Pour un modèle bien défini, la différence d'exactitude entre l'estimateur synthétique et l'estimateur de régression généralisée (GREG) est négligeable, mais elle peut être substantielle si le modèle est mal défini. L'estimateur synthétique a alors tendance à être très inexact. L'étude est fondée en partie sur des résultats théoriques (pour l'échantillonnage aléatoire simple seulement) et en partie sur des résultats empiriques. Les résultats empiriques sont ceux de simulations effectuées avec des échantillons répétés tirés de deux populations finies, l'une construite artificiellement et l'autre, construite à partir de données réelles tirées de l'Enquête sur la population active finlandaise.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016607
    Description :

    L'Enquête sur la population économiquement active (EPEA) de la Corée a été menée afin de produire des statistiques sur le chômage pour de grands territoires comme les régions métropolitaines et les provinces. Ces grandes régions sont considérées comme des domaines planifiés dans l'EPEA, et les régions locales autonomes (RLA), comme des domaines non planifiés. Dans cette étude, on propose des méthodes d'estimations régionales pour rajuster les statistiques sur le chômage dans les RLA comprises dans les grandes régions pour lesquelles les valeurs sont évaluées directement d'après les données courantes de l'EPEA. On suggère des estimateurs synthétiques et composites dans les conditions de l'EPEA de la Corée et, pour l'estimateur basé sur un modèle, on propose l'estimateur hiérarchique de Bayes (HB) tiré du modèle multiniveaux général. L'estimateur HB utilisé dans cette étude a été introduit par You et Rao en 2000. On calcule les erreurs quadratiques moyennes des estimations synthétiques et composites à partir des données de l'EPEA par la méthode du jackknife et on les utilise pour déterminer l'exactitude des estimations régionales. On emploie l'échantillonnage de Gibbs pour obtenir les estimations HB et leurs variances a posteriori, lesquelles sont utilisées pour mesurer la précision des estimations régionales. On a évalué le chômage total pour les 10 RLA comprises dans la province de ChoongBuk d'après les données de l'EPEA de décembre 2000 par les méthodes d'estimations régionales proposées dans cette étude. On évalue la fiabilité des estimations régionales au moyen des erreurs-types relatives ou de la racine relative de l'erreur quadratique moyenne de ces estimations. On avance que, sous le système actuel de l'EPEA de la Corée, les estimations composites sont plus fiables que les autres estimations régionales.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016608
    Description :

    La présente étude porte sur les propriétés non conditionnelles et conditionnelles de certains estimateurs de petites régions bien connus, à savoir l'estimateur par extension, l'estimateur par le quotient stratifié a posteriori, l'estimateur synthétique, l'estimateur composite, l'estimateur dépendant de la taille de l'échantillon et le meilleur prédicteur linéaire sans biais empirique. On examine un plan d'échantillonnage à deux degrés, puisque ce genre de plan d'échantillonnage est utilisé couramment pour les enquêtes auprès des ménages réalisées par l'Institut national de statistique d'Italie. On procède à une évaluation par simulation fondée sur des données du recensement de l'Italie de 1991. Les petites régions considérées sont les zones du marché du travail, qui sont des domaines non planifiés qui recoupent les limites des strates du plan d'échantillonnage.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016609
    Description :

    Pour automatiser le processus de vérification des données, il faut résoudre le problème de localisation des erreurs, c'est-à-dire la détermination des zones erronées dans un enregistrement incorrect. En 1976, Fellegi et Holt ont proposé un paradigme pour repérer automatiquement les erreurs. Au fil des ans, ce paradigme a été généralisé pour s'énoncer comme suit : on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier les valeurs des variables dont la somme des poids de fiabilité est la plus faible possible. Par poids de fiabilité d'une variable, nous entendons un nombre non négatif précisant dans quelle mesure la valeur de cette variable est jugée fiable. Étant donné ce paradigme, il faut résoudre le problème mathématique résultant. Nous examinons ici comment les méthodes de génération de sommets peuvent être utilisées pour résoudre ce problème mathématique dans le cas de données mixtes, c'est-à-dire une combinaison de données catégoriques (discrètes) et numériques (continues). Le but principal de l'article n'est pas de présenter de nouveaux résultats, mais plutôt de combiner les idées de plusieurs auteurs afin de donner une description « complète », intégrée, de l'utilisation des méthodes de génération de sommets pour résoudre le problème de localisation des erreurs dans le cas de données mixtes. Nous décrirons surtout dans notre exposé la façon dont on peut adapter aux données mixtes les méthodes élaborées pour des données numériques.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016610
    Description :

    En présence de non-réponse partielle, en pratique, on recourt souvent à des méthodes d'imputation non pondérée, mais celles-ci produisent généralement des estimateurs biaisés sous l'hypothèse d'une réponse uniforme à l'intérieur des classes d'imputation. En nous inspirant de Skinner et Rao (2002), nous proposons un estimateur corrigé pour le biais d'une moyenne de population sous imputation par le ratio non pondérée et sous imputation aléatoire hot-deck, et nous calculons des estimateurs de la variance par linéarisation. Nous réalisons une petite étude en simulation pour évaluer les propriétés de biais et d'erreur quadratique moyenne des estimateurs obtenus. Nous étudions aussi le biais relatif et la stabilité relative des estimateurs de la variance.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 12-001-X20030016611
    Description :

    On examine des plans d'échantillonnage bayésiens à coûts fixes optimaux et approximativement optimaux pour l'estimation simultanée dans des processus de Poisson homogènes indépendants. On élabore des formules générales de répartition pour un modèle de base Poisson-Gamma et on les compare à des méthodes plus classiques de répartition. On discute aussi des méthodes permettant de trouver des lois a priori gamma représentatives sous des modèles hiérarchiques plus généraux et on montre que, dans plusieurs situations pratiques, ces méthodes donnent des approximations raisonnables de la loi a priori hiérarchique et du risque bayésien. Les méthodes mises au point sont suffisamment générales pour être appliquées à un large éventail de modèles et ne sont pas limitées aux processus de Poisson.

    Date de diffusion : 2003-07-31
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :