Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

2 facets displayed. 0 facets selected.

Année de publication

1 facets displayed. 1 facets selected.

Enquête ou programme statistique

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (3)

Tout (3) ((3 résultats))

  • Articles et rapports : 12-001-X20060019262
    Description :

    Les populations humaines cachées, Internet et d'autres structures en réseau conceptualisées mathématiquement sous forme de graphes sont intrinsèquement difficiles à échantillonner par les moyens conventionnels et les plans d'étude les plus efficaces comportent habituellement des procédures de sélection de l'échantillon par suivi adaptatif des liens reliant un n'ode à un autre. Les données d'échantillon obtenues dans le cadre de telles études ne sont généralement pas représentatives au pied de la lettre de la population d'intérêt dans son ensemble. Cependant, un certain nombre de méthodes fondées sur le plan de sondage ou sur un modèle sont maintenant disponibles pour faire des inférences efficaces à partir d'échantillons de ce type. Les méthodes fondées sur le plan de sondage ont l'avantage de ne pas s'appuyer sur un modèle de population hypothétique, mais dépendent, en ce qui concerne leur validité, de la mise en oeuvre du plan de sondage dans des conditions contrôlées et connues, ce qui est parfois difficile, voire impossible, en pratique. Les méthodes fondées sur un modèle offrent plus de souplesse quant au plan de sondage, mais requièrent que la population soit modélisée au moyen de modèles de graphes stochastiques et que le plan de sondage soit ignorable ou de forme connue, afin qu'il puisse être inclus dans les équations de vraisemblance ou d'inférence bayésienne. Aussi bien pour les méthodes basées sur le plan de sondage que celles fondées sur un modèle, le point faible est souvent le manque de contrôle concernant l'obtention de l'échantillon initial, à partir duquel débute le dépistage des liens. Les plans de sondage décrits dans le présent article offrent une troisième méthode, dans laquelle les probabilités de sélection de l'échantillon deviennent pas à pas moins dépendantes de la sélection de l'échantillon initial. Un modèle de « marche aléatoire » markovienne idéalise au moyen d'un graphe, les tendances d'un plan d'échantillonnage naturel d'une séquence de sélections par dépistage de liens à suivre. Le présent article présente des plans de sondage à marche uniforme ou ciblée dans lesquels la marche aléatoire est ajustée à chaque pas afin de produire un plan de sondage ayant les probabilités stationnaires souhaitées. On obtient ainsi un échantillon qui, à d'importants égards, est représentatif au pied de la lettre de la population d'intérêt dans son ensemble, ou qui ne nécessite que de simples facteurs de pondération pour qu'il en soit ainsi.

    Date de diffusion : 2006-07-20

  • Revues et périodiques : 92-134-X
    Description :

    Le présent document est un résumé des résultats des analyses de contenu du Test du recensement de 2004. La première partie explique brièvement dans quel contexte s'inscrivent les analyses de contenu en décrivant la nature de l'échantillon, les limites qui y sont rattachées ainsi que les stratégies déployées pour évaluer la qualité des données. La deuxième partie donne un aperçu global des résultats pour les questions n'ayant pas changé depuis le Recensement de 2001 en décrivant les similarités entre les distributions et les taux de non-réponse de 2001 et de 2004. La troisième partie s'attarde davantage sur les nouvelles questions et les questions qui ont changé substantiellement : les couples de même sexe, les origines ethniques, les niveaux de scolarité, le lieu d'obtention du plus haut niveau d'études, la fréquentation scolaire, la permission d'utiliser les renseignements contenus dans les dossiers administratifs de revenu et la permission d'accéder aux données personnelles 92 ans après le recensement. La dernière partie traite des résultats d'ensemble pour les questions dont le contenu a été codé lors du test de 2004, notamment les variables d'industrie, de profession et de lieu de travail.

    Date de diffusion : 2006-03-21

  • Articles et rapports : 12-001-X20050029041
    Description :

    L'imputation hot deck est une procédure qui consiste à remplacer les réponses manquantes à certaines questions par des valeurs empruntées à d'autres répondants. L'un des modèles sur lesquels elle s'appuie est celui où l'on suppose que les probabilités de réponse sont égales dans les cellules d'imputation. Nous décrivons une version efficace de l'imputation hot deck pour le modèle de réponse dans les cellules et donnons un estimateur de la variance dont le traitement informatique est efficace. Nous détaillons une approximation de la procédure entièrement efficace dans laquelle un petit nombre de valeurs sont imputées pour chaque non répondant. Nous illustrons les procédures d'estimation de la variance dans une étude de Monte Carlo.

    Date de diffusion : 2006-02-17
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (3)

Analyses (3) ((3 résultats))

  • Articles et rapports : 12-001-X20060019262
    Description :

    Les populations humaines cachées, Internet et d'autres structures en réseau conceptualisées mathématiquement sous forme de graphes sont intrinsèquement difficiles à échantillonner par les moyens conventionnels et les plans d'étude les plus efficaces comportent habituellement des procédures de sélection de l'échantillon par suivi adaptatif des liens reliant un n'ode à un autre. Les données d'échantillon obtenues dans le cadre de telles études ne sont généralement pas représentatives au pied de la lettre de la population d'intérêt dans son ensemble. Cependant, un certain nombre de méthodes fondées sur le plan de sondage ou sur un modèle sont maintenant disponibles pour faire des inférences efficaces à partir d'échantillons de ce type. Les méthodes fondées sur le plan de sondage ont l'avantage de ne pas s'appuyer sur un modèle de population hypothétique, mais dépendent, en ce qui concerne leur validité, de la mise en oeuvre du plan de sondage dans des conditions contrôlées et connues, ce qui est parfois difficile, voire impossible, en pratique. Les méthodes fondées sur un modèle offrent plus de souplesse quant au plan de sondage, mais requièrent que la population soit modélisée au moyen de modèles de graphes stochastiques et que le plan de sondage soit ignorable ou de forme connue, afin qu'il puisse être inclus dans les équations de vraisemblance ou d'inférence bayésienne. Aussi bien pour les méthodes basées sur le plan de sondage que celles fondées sur un modèle, le point faible est souvent le manque de contrôle concernant l'obtention de l'échantillon initial, à partir duquel débute le dépistage des liens. Les plans de sondage décrits dans le présent article offrent une troisième méthode, dans laquelle les probabilités de sélection de l'échantillon deviennent pas à pas moins dépendantes de la sélection de l'échantillon initial. Un modèle de « marche aléatoire » markovienne idéalise au moyen d'un graphe, les tendances d'un plan d'échantillonnage naturel d'une séquence de sélections par dépistage de liens à suivre. Le présent article présente des plans de sondage à marche uniforme ou ciblée dans lesquels la marche aléatoire est ajustée à chaque pas afin de produire un plan de sondage ayant les probabilités stationnaires souhaitées. On obtient ainsi un échantillon qui, à d'importants égards, est représentatif au pied de la lettre de la population d'intérêt dans son ensemble, ou qui ne nécessite que de simples facteurs de pondération pour qu'il en soit ainsi.

    Date de diffusion : 2006-07-20

  • Revues et périodiques : 92-134-X
    Description :

    Le présent document est un résumé des résultats des analyses de contenu du Test du recensement de 2004. La première partie explique brièvement dans quel contexte s'inscrivent les analyses de contenu en décrivant la nature de l'échantillon, les limites qui y sont rattachées ainsi que les stratégies déployées pour évaluer la qualité des données. La deuxième partie donne un aperçu global des résultats pour les questions n'ayant pas changé depuis le Recensement de 2001 en décrivant les similarités entre les distributions et les taux de non-réponse de 2001 et de 2004. La troisième partie s'attarde davantage sur les nouvelles questions et les questions qui ont changé substantiellement : les couples de même sexe, les origines ethniques, les niveaux de scolarité, le lieu d'obtention du plus haut niveau d'études, la fréquentation scolaire, la permission d'utiliser les renseignements contenus dans les dossiers administratifs de revenu et la permission d'accéder aux données personnelles 92 ans après le recensement. La dernière partie traite des résultats d'ensemble pour les questions dont le contenu a été codé lors du test de 2004, notamment les variables d'industrie, de profession et de lieu de travail.

    Date de diffusion : 2006-03-21

  • Articles et rapports : 12-001-X20050029041
    Description :

    L'imputation hot deck est une procédure qui consiste à remplacer les réponses manquantes à certaines questions par des valeurs empruntées à d'autres répondants. L'un des modèles sur lesquels elle s'appuie est celui où l'on suppose que les probabilités de réponse sont égales dans les cellules d'imputation. Nous décrivons une version efficace de l'imputation hot deck pour le modèle de réponse dans les cellules et donnons un estimateur de la variance dont le traitement informatique est efficace. Nous détaillons une approximation de la procédure entièrement efficace dans laquelle un petit nombre de valeurs sont imputées pour chaque non répondant. Nous illustrons les procédures d'estimation de la variance dans une étude de Monte Carlo.

    Date de diffusion : 2006-02-17
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :