Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.

Année de publication

8 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (8)

Tout (8) ((8 résultats))

  • Articles et rapports : 18-001-X2017002
    Description :

    Ce document de travail décrit la méthodologie utilisée pour mesurer l’éloignement à l’échelon de la collectivité. La méthode tient compte de résultats de travaux récents sur le sujet et tire avantage de nouvelles possibilités de calcul découlant de l’intégration de statistiques officielles avec des données provenant de sources statistiques non officielles. L’approche adoptée pour le calcul prend en compte de multiples points d’accès aux services. De plus, elle établit un continuum englobant des collectivités dont les infrastructures de transport et le degré d’accès diffèrent, tout en conservant l’information sur les infrastructures de transport des collectivités dans la base de données. Le document présente également une méthode d’ajout de mesures de l’accessibilité à certains services ainsi qu’un exemple du calcul des mesures de l’accessibilité.

    Date de diffusion : 2017-05-09

  • Articles et rapports : 12-001-X201500214238
    Description :

    Félix-Medina et Thompson (2004) ont proposé une variante de l’échantillonnage par dépistage de liens pour échantillonner des populations humaines cachées ou difficiles à joindre, comme les toxicomanes et les travailleurs de l’industrie du sexe. Dans cette variante, on commence par sélectionner un échantillon d’emplacements, puis on demande aux personnes trouvées dans les lieux échantillonnés de nommer d’autres membres de la population à inclure dans l’échantillon. Ces auteurs ont établi des estimateurs du maximum de vraisemblance de la taille de la population sous l’hypothèse que la probabilité qu’une personne soit nommée par une autre dans un lieu échantillonné (probabilité de lien) ne dépend pas de la personne nommée (hypothèse d’homogénéité). Dans le présent travail, nous étendons leur recherche au cas où les probabilités de lien sont hétérogènes et dérivons des estimateurs du maximum de vraisemblance inconditionnel et conditionnel de la taille de la population. Nous proposons aussi des intervalles de confiance par vraisemblance profilée et par bootstrap pour la taille de la population. Les résultats de nos études en simulation montrent qu’en présence de probabilités de lien hétérogènes, les estimateurs proposés donnent d’assez bons résultats à condition que les fractions d’échantillonnage soient relativement grandes, disons supérieures à 0,5, tandis que la performance des estimateurs calculés sous l’hypothèse d’homogénéité n’est pas bonne. Les résultats montrent aussi que les intervalles de confiance proposés ne sont pas très robustes aux écarts par rapport aux modèles supposés.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201200111682
    Description :

    Les questions concernant la répartition de l'échantillon sont étudiées dans le contexte de l'estimation des moyennes de sous-population (strate ou domaine), ainsi que de la moyenne de population agrégée sous-échantillonnage aléatoire simple stratifié. Une méthode de programmation non linéaire est utilisée pour obtenir la répartition « optimale » de l'échantillon entre les strates qui minimise la taille totale d'échantillon sous la contrainte des tolérances spécifiées pour les coefficients de variation des estimateurs des moyennes de strate et de la moyenne de population. La taille totale d'échantillon résultante est alors utilisée pour déterminer les répartitions de l'échantillon par les méthodes de Costa, Satorra et Ventura (2004) s'appuyant sur une répartition intermédiaire ou de compromis et de Longford (2006) fondée sur des « priorités inférencielles » spécifiées. En outre, nous étudions la répartition de l'échantillon entre les strates quand sont également spécifiées des exigences de fiabilité pour des domaines qui recoupent les strates. Les propriétés des trois méthodes sont étudiées au moyen de données provenant de l'Enquête mensuelle sur le commerce de détail (EMCD) menée par Statistique Canada auprès d'établissements uniques.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201100111447
    Description :

    Ce document présente un programme R pour la stratification d'une population d'enquête à l'aide d'une variable unidimensionnelle X et pour le calcul de tailles d'échantillon dans les strates. Nous y employons des méthodes non itératives pour délimiter les strates, comme la méthode de la fonction cumulative de la racine carrée des fréquences et la méthode géométrique. Nous pouvons élaborer des plans optimaux où les bornes de strates minimisent soit le CV de l'estimateur simple par dilatation pour une taille fixe d'échantillon n, soit la valeur n pour un CV fixe. Nous disposons de deux algorithmes itératifs pour le calcul des bornes optimales. Le plan peut comporter des strates à tirage obligatoire qui sont définies par l'utilisateur et dont toutes les unités sont échantillonnées. Il est également possible d'inclure dans le plan stratifié des strates à tirage complet et à tirage nul qui permettent souvent de réduire les tailles d'échantillon. Les calculs de taille d'échantillon sont fondés sur les moments anticipés de la variable d'enquête Y étant donné la variable de stratification X. Le programme traite les distributions conditionnelles de Y étant donné X qui sont soit un modèle linéaire hétéroscédastique soit un modèle loglinéaire. Nous pouvons tenir compte de la non-réponse par strate dans l'élaboration du plan d'échantillonnage et dans les calculs de taille d'échantillon.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 12-001-X201000211385
    Description :

    Dans cette note brève, nous montrons que l'échantillonnage aléatoire sans remise et l'échantillonnage de Bernoulli ont à peu près la même entropie quand la taille de la population est grande. Nous donnons un exemple empirique en guise d'illustration.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X200700210495
    Description :

    Il s'agit d'obtenir des estimations fiables pour des domaines d'étude où les tailles d'échantillon peuvent être des plus modestes et pour lesquels la strate du plan d'échantillonnage ne coïncide pas avec le domaine. On ignore les tailles de population autant pour le domaine d'étude que pour la strate du plan d'échantillonnage. Dans le calcul des estimations paramétriques des domaines d'étude, le choix d'une taille d'échantillon aléatoire s'impose souvent. Nous proposons une nouvelle famille de modèles mixtes linéaires généralisés (MMLG) à effets aléatoires corrélés lorsqu'il y a plus d'un paramètre inconnu. Le modèle que nous proposons estimera tant la taille de population que le paramètre d'intérêt. Pour ce cadre, nous donnons des formules générales pour les distributions conditionnelles intégrales qu'exigent des simulations de Monte Carlo à chaîne de Markov (MCCM). Nous présentons aussi des équations de prévision et d'estimation bayésiennes pour les domaines d'étude. Nous nous servons enfin de l'enquête de 1998 sur la chasse aux dindons dans le Missouri, laquelle stratifie des échantillons en fonction du lieu de résidence du chasseur, et nous voulons obtenir des estimations au niveau du domaine, c'est à-dire du comté où le chasseur de dindons s'adonne effectivement à cette activité.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X20000025531
    Description :

    Les informations tirées de bases de sondage aréolaires et de listes sont combinés de façon à fournir des estimations efficaces de la taille et des chiffres de population. Les auteurs examinent le cas où les probabilités d'inclusion dans les listes sont hétérogènes et modélisées en fonction de covariables. Ils adaptent et modifient la méthode employés par Huggins (1989) et par Albo (1990) pour la modélisation de variables auxiliaires dans des études de type saisir-ressaisir faisant appel à un modèle de régression logistique. Les auteurs présentent les résultats d'une étude de simulation qui permet de comparer divers estimateurs de la taille des bases de sondage et des chiffres de population en ayant recours à la stratégie de régression logistique pour modéliser des probabilités d'inclusion hétérogènes.

    Date de diffusion : 2001-02-28

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (8)

Analyses (8) ((8 résultats))

  • Articles et rapports : 18-001-X2017002
    Description :

    Ce document de travail décrit la méthodologie utilisée pour mesurer l’éloignement à l’échelon de la collectivité. La méthode tient compte de résultats de travaux récents sur le sujet et tire avantage de nouvelles possibilités de calcul découlant de l’intégration de statistiques officielles avec des données provenant de sources statistiques non officielles. L’approche adoptée pour le calcul prend en compte de multiples points d’accès aux services. De plus, elle établit un continuum englobant des collectivités dont les infrastructures de transport et le degré d’accès diffèrent, tout en conservant l’information sur les infrastructures de transport des collectivités dans la base de données. Le document présente également une méthode d’ajout de mesures de l’accessibilité à certains services ainsi qu’un exemple du calcul des mesures de l’accessibilité.

    Date de diffusion : 2017-05-09

  • Articles et rapports : 12-001-X201500214238
    Description :

    Félix-Medina et Thompson (2004) ont proposé une variante de l’échantillonnage par dépistage de liens pour échantillonner des populations humaines cachées ou difficiles à joindre, comme les toxicomanes et les travailleurs de l’industrie du sexe. Dans cette variante, on commence par sélectionner un échantillon d’emplacements, puis on demande aux personnes trouvées dans les lieux échantillonnés de nommer d’autres membres de la population à inclure dans l’échantillon. Ces auteurs ont établi des estimateurs du maximum de vraisemblance de la taille de la population sous l’hypothèse que la probabilité qu’une personne soit nommée par une autre dans un lieu échantillonné (probabilité de lien) ne dépend pas de la personne nommée (hypothèse d’homogénéité). Dans le présent travail, nous étendons leur recherche au cas où les probabilités de lien sont hétérogènes et dérivons des estimateurs du maximum de vraisemblance inconditionnel et conditionnel de la taille de la population. Nous proposons aussi des intervalles de confiance par vraisemblance profilée et par bootstrap pour la taille de la population. Les résultats de nos études en simulation montrent qu’en présence de probabilités de lien hétérogènes, les estimateurs proposés donnent d’assez bons résultats à condition que les fractions d’échantillonnage soient relativement grandes, disons supérieures à 0,5, tandis que la performance des estimateurs calculés sous l’hypothèse d’homogénéité n’est pas bonne. Les résultats montrent aussi que les intervalles de confiance proposés ne sont pas très robustes aux écarts par rapport aux modèles supposés.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201200111682
    Description :

    Les questions concernant la répartition de l'échantillon sont étudiées dans le contexte de l'estimation des moyennes de sous-population (strate ou domaine), ainsi que de la moyenne de population agrégée sous-échantillonnage aléatoire simple stratifié. Une méthode de programmation non linéaire est utilisée pour obtenir la répartition « optimale » de l'échantillon entre les strates qui minimise la taille totale d'échantillon sous la contrainte des tolérances spécifiées pour les coefficients de variation des estimateurs des moyennes de strate et de la moyenne de population. La taille totale d'échantillon résultante est alors utilisée pour déterminer les répartitions de l'échantillon par les méthodes de Costa, Satorra et Ventura (2004) s'appuyant sur une répartition intermédiaire ou de compromis et de Longford (2006) fondée sur des « priorités inférencielles » spécifiées. En outre, nous étudions la répartition de l'échantillon entre les strates quand sont également spécifiées des exigences de fiabilité pour des domaines qui recoupent les strates. Les propriétés des trois méthodes sont étudiées au moyen de données provenant de l'Enquête mensuelle sur le commerce de détail (EMCD) menée par Statistique Canada auprès d'établissements uniques.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201100111447
    Description :

    Ce document présente un programme R pour la stratification d'une population d'enquête à l'aide d'une variable unidimensionnelle X et pour le calcul de tailles d'échantillon dans les strates. Nous y employons des méthodes non itératives pour délimiter les strates, comme la méthode de la fonction cumulative de la racine carrée des fréquences et la méthode géométrique. Nous pouvons élaborer des plans optimaux où les bornes de strates minimisent soit le CV de l'estimateur simple par dilatation pour une taille fixe d'échantillon n, soit la valeur n pour un CV fixe. Nous disposons de deux algorithmes itératifs pour le calcul des bornes optimales. Le plan peut comporter des strates à tirage obligatoire qui sont définies par l'utilisateur et dont toutes les unités sont échantillonnées. Il est également possible d'inclure dans le plan stratifié des strates à tirage complet et à tirage nul qui permettent souvent de réduire les tailles d'échantillon. Les calculs de taille d'échantillon sont fondés sur les moments anticipés de la variable d'enquête Y étant donné la variable de stratification X. Le programme traite les distributions conditionnelles de Y étant donné X qui sont soit un modèle linéaire hétéroscédastique soit un modèle loglinéaire. Nous pouvons tenir compte de la non-réponse par strate dans l'élaboration du plan d'échantillonnage et dans les calculs de taille d'échantillon.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 12-001-X201000211385
    Description :

    Dans cette note brève, nous montrons que l'échantillonnage aléatoire sans remise et l'échantillonnage de Bernoulli ont à peu près la même entropie quand la taille de la population est grande. Nous donnons un exemple empirique en guise d'illustration.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X200700210495
    Description :

    Il s'agit d'obtenir des estimations fiables pour des domaines d'étude où les tailles d'échantillon peuvent être des plus modestes et pour lesquels la strate du plan d'échantillonnage ne coïncide pas avec le domaine. On ignore les tailles de population autant pour le domaine d'étude que pour la strate du plan d'échantillonnage. Dans le calcul des estimations paramétriques des domaines d'étude, le choix d'une taille d'échantillon aléatoire s'impose souvent. Nous proposons une nouvelle famille de modèles mixtes linéaires généralisés (MMLG) à effets aléatoires corrélés lorsqu'il y a plus d'un paramètre inconnu. Le modèle que nous proposons estimera tant la taille de population que le paramètre d'intérêt. Pour ce cadre, nous donnons des formules générales pour les distributions conditionnelles intégrales qu'exigent des simulations de Monte Carlo à chaîne de Markov (MCCM). Nous présentons aussi des équations de prévision et d'estimation bayésiennes pour les domaines d'étude. Nous nous servons enfin de l'enquête de 1998 sur la chasse aux dindons dans le Missouri, laquelle stratifie des échantillons en fonction du lieu de résidence du chasseur, et nous voulons obtenir des estimations au niveau du domaine, c'est à-dire du comté où le chasseur de dindons s'adonne effectivement à cette activité.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 12-001-X20000025531
    Description :

    Les informations tirées de bases de sondage aréolaires et de listes sont combinés de façon à fournir des estimations efficaces de la taille et des chiffres de population. Les auteurs examinent le cas où les probabilités d'inclusion dans les listes sont hétérogènes et modélisées en fonction de covariables. Ils adaptent et modifient la méthode employés par Huggins (1989) et par Albo (1990) pour la modélisation de variables auxiliaires dans des études de type saisir-ressaisir faisant appel à un modèle de régression logistique. Les auteurs présentent les résultats d'une étude de simulation qui permet de comparer divers estimateurs de la taille des bases de sondage et des chiffres de population en ayant recours à la stratégie de régression logistique pour modéliser des probabilités d'inclusion hétérogènes.

    Date de diffusion : 2001-02-28

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :