Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

1 facets displayed. 0 facets selected.

Portail

    Contenu

    1 facets displayed. 0 facets selected.
    Aide à l'ordre
    entrées

    Résultats

    Tout (82)

    Tout (82) (70 à 80 de 82 résultats)

    • Avis et consultations : 92-126-S
      Description :

      Le présent rapport fait état des résultats du processus de consultation sur la géographie en prévision du recensement de 2001. Lors de la conférence fédérale-provinciale tenue en juin 1998 sur le recensement de 2001, la géographie a été décrite comme étant la « pierre angulaire » du recensement. D'après les présentations reçues au cours de la dernière année, de nombreux utilisateurs sont du même avis. Ce sont les régions géographiques normalisées qui déterminent le cadre dans lequel les données seront diffusées. Ce sont par ailleurs les utilisateurs qui, grâce au processus de consultation, influent sur les modifications qu'on recommande aux genres de régions géographiques normalisées pour chaque recensement.

      Date de diffusion : 1999-03-31

    • Articles et rapports : 52-216-X19970004457
      Description :

      Le présent article vise à faire état des résultats des recherches préliminaires sur l'utilisation d'un nouvel indicateur économique éventuel du produit intérieur brut (PIB), soit les changements ferroviaires.

      Date de diffusion : 1999-03-24

    • Avis et consultations : 13F0026M1999001
      Description :

      Les objectifs principaux d'une nouvelle enquête canadienne sur les biens et les dettes des familles et des particuliers seront de mettre à jour les données existantes sur le patrimoine qui remontent à plus de 10 ans; de produire des estimations plus fiables du patrimoine; et, de servir d'outil principal pour l'analyse de nombreux dossiers publics importants ayant trait à la distribution des avoirs et des dettes, aux possibilités de consommation future et à l'épargne, dossiers auxquels s'intéressent les administrations publiques, les entreprises et les collectivités.

      Ce document est la pierre angulaire qui a servi au développement de la nouvelle enquête sur les avoirs et les dettes, renommée depuis l'Enquête sur la sécurité financière. Il examine le cadre conceptuel de l'enquête, y compris l'unité de mesure appropriée (famille, ménage ou particulier) et traite de la question concernant les mesures comme la création d'un cadre comptable pour les avoirs et les dettes. Il fait aussi état des variables susceptibles d'être incluses dans l'enquête. Ce rapport soumet plusieurs questions aux lecteurs et cherche à obtenir des commentaires et de la rétroaction.

      Date de diffusion : 1999-03-23

    • Articles et rapports : 89-553-X19980014021
      Géographie : Canada
      Description :

      Le présent chapitre traite principalement de l'étendue et de la nature de la mobilité intergénérationnelle du revenu, à savoir la mesure dans laquelle le revenu d'un particulier (adulte) est en rapport avec celui de ses parents (au moment de son enfance). À cette fin, notre analyse se rapporte aux écrits économiques sur lesquels se sont penchés, par exemple, Becker et Tomes (1986) et, plus récemment, Björklund et Jäntti (1997). Cela dit, nous abondons dans le sens de Hill et Duncan (1987), car nous estimons qu'en faisant la distinction entre les diverses composantes du revenu familial, il est possible d'intégrer des explications à la fois économiques et sociologiques à un modèle empirique de la mobilité du revenu.

      Date de diffusion : 1998-11-05

    • Articles et rapports : 11F0019M1998117
      Géographie : Canada
      Description :

      Dans le présent, sont examinés les facteurs déterminants des retards en matière d'adoption des technologies de pointe dans le secteur des entreprises. On y utilise des données portant sur les retards d'adoption au niveau des entreprises (c'est-à-dire la période de temps écoulée entre le moment où l'entreprise prend conscience de l'existence d'une technologie donnée et l'adoption de celle-ci), afin de déterminer à quel point le retard d'adoption agit en fonction des avantages et des coûts associés à l'adoption de la technologie, de même que certaines caractéristiques qui font office de substituts à la capacité d'absorber de l'entreprise.

      Selon la théorie de l'économie, que procure la diffusion des technologies de pointe devrait être liée aux avantages que procure l'adoption de nouvelles technologies. D'autres études ont eu à remplacer les avantages par des caractéristiques environnementales, notamment la proximité des marchés, la fertilité des terres et la taille de l'entreprise. Ici, on a recours à des faits plus directs tirés de l'Enquête sur les innovations et les technologies de pointe 1993 en ce qui a trait aux propres évaluations de l'entreprise quant aux avantages et aux coûts liés à l'adoption en question, de même qu'aux mesures de la compétence technologique dans son ensemble. Ces deux facteurs s'avèrent être des facteurs déterminants d'une grande importance quant aux retards d'adoption. La proximité géographique des fournisseurs vient réduire les retards d'adoption. Les variables ayant servi antérieurement de substitus aux avantages liés à l'adoption d'une technologie-des variables telles que les entreprises d'une grande taille, une date de création récente et une plus grande diversification de la part de l'entreprise mère viennent aussi réduire les retards d'adoption-mais elles ont un effet beaucoup moins important que la mesure directe des avantages et la compétence de l'entreprise.

      Date de diffusion : 1998-08-31

    • Enquêtes et programmes statistiques — Documentation : 81-580-X
      Description :

      Le secteur de l'éducation et de la formation des adultes est aussi complexe que dynamique. Afin d'en cerner toutes les facettes, Statistique Canada conduit plusieurs enquêtes auprès de clientèles très variées. Étant donné la diversité des sources de données et leurs différences conceptuelles et méthodologiques, il est parfois très difficile pour les chercheurs ou les décideurs publics de trouver les informations ou données désirées. Ce guide est un outil qui devrait permettre de faciliter ce travail. Il décrit sommairement toutes les enquêtes de Statistique Canada qui touchent l'éducation ou la formation des adultes. Il permet, à partir d'une variable sélectionnée, d'identifier les enquêtes susceptibles de fournir des informations. Il indique également les publications pertinentes et comment obtenir des informations additionnelles.

      Date de diffusion : 1997-03-12

    • Articles et rapports : 12-001-X19960022982
      Description :

      Les travaux sur les enquêtes par échantillonnage exigent souvent qu'on recoure aux estimateurs des composantes de la variance associés à l'échantillonnage, à l'intérieur des unités primaires d'échantillonnage et entre celles-ci. Dans ce genre de travail, il peut s'avérer important d'avoir une idée de la stabilité des estimateurs des composantes de la variance, bref de savoir si ces estimateurs présentent une variance relativement faible. Nous examinerons ici plusieurs façons de mesurer la stabilité des estimateurs des composantes de la variance reposant sur le plan d'échantillonnage et des quantités connexes, d'après les données. Dans le développement, on mettra en relief les méthodes applicables aux enquêtes caractérisées par un nombre moyen ou important de strates et un petit nombre d'unités primaires d'échantillonnage par strate. Nous attirons principalement l'attention sur la variance intrinséque d'un estimateur de la variance intra-UPÉ et sur deux termes connexes se rapportant aux degés de liberté. Une méthode de simulation permet d'établir si la stabilité observée est cohérente avec les hypothèses types sur la stabilité de l'estimateur de la variance. Nous présentons aussi deux séries de mesures de stabilité pour les estimateurs des composantes de la variance inter-UPÉ reposant sur le plan d'échantillonnage et le ratio de la variance globale avec la variance intra-UPÉ. Les méthodes proposées sont appliquées aux données venant des interviews et des examens de la U.S. Third National Health and Nutrition Examination Survey (NHANES III). Les résultats montrent que les propriétés de la stabilité véritable peuvent changer sensiblement d'une variable à l'autre. Par ailleurs, pour certaines variables, les estimateurs de la variance intra-UPÉ semblent considérablement moins stables qu'on aurait pu s'y attendre consécutivement à un simple dénombrement des unités secondaires de chaque strate.

      Date de diffusion : 1997-01-30

    • Enquêtes et programmes statistiques — Documentation : 75F0002M199303B
      Description :

      Dans ce document, on présente des renseignements détaillés sur les diverses variables spécifiques liées aux fichiers de microdonnées de l'Enquête sur la dynamique du travail et du revenu (EDTR).

      Date de diffusion : 1995-12-30

    • Enquêtes et programmes statistiques — Documentation : 75F0002M1994006
      Description :

      Dans ce document, on décrit le travail accompli jusqu'à ce jour concernant l'élaboration de variables dérivées au niveau des ménages et des familles de l'Enquête sur la dynamique du travail et du revenu (EDTR).

      Date de diffusion : 1995-12-30

    • Enquêtes et programmes statistiques — Documentation : 75F0002M1994008
      Description :

      Ce document décrit le contenu de l'enquête qui a été élaboré en vue du questionnaire sur les données liées au revenu de l'Enquête sur la dynamique du travail et du revenu (EDTR). On y examine également les procédures de l'enquête.

      Date de diffusion : 1995-12-30
    Données (0)

    Données (0) (0 résultat)

    Aucun contenu disponible actuellement

    Analyses (52)

    Analyses (52) (20 à 30 de 52 résultats)

    • Articles et rapports : 11-522-X200800010957
      Description :

      Les enquêtes menées auprès d'entreprises diffèrent des enquêtes menées auprès de la population ou des ménages à bien des égards. Deux des plus importantes différences sont : (a) les répondants aux enquêtes-entreprises ne répondent pas à des questions sur des caractéristiques les concernant (leurs expériences, leurs comportements, leurs attitudes et leurs sentiments), mais sur des caractéristiques de leur organisation (taille, revenu, politiques, stratégies, etc.) et (b) les répondants aux questions parlent au nom d'une organisation. Les enquêtes-entreprises théoriques diffèrent pour leur part des autres enquêtes-entreprises, comme celles des bureaux nationaux de la statistique, à bien des égards aussi. Le fait que les enquêtes-entreprises théoriques ne visent habituellement pas la production de statistiques descriptives mais plutôt la réalisation de tests d'hypothèses (relations entre variables) constitue la plus importante différence. Les taux de réponse aux enquêtes-entreprises théoriques sont très faibles, ce qui suppose un risque énorme de biais de non-réponse. Aucune tentative n'est habituellement faite pour évaluer l'importance du biais attribuable à la non-réponse, et les résultats publiés peuvent par conséquent ne pas refléter fidèlement les vraies relations au sein de la population, ce qui augmente par ricochet la probabilité que les résultats des tests soient incorrects.

      Les auteurs de la communication analysent la façon dont le risque de biais dû à la non-réponse est étudié dans les documents de recherche publiés dans les grandes revues de gestion. Ils montrent que ce biais n'est pas suffisamment évalué et que la correction du biais est difficile ou très coûteux dans la pratique, si tant est que des tentatives sont faites en ce sens. Trois façons de traiter ce problème sont examinées :(a) réunir des données par d'autres moyens que des questionnaires;(b) mener des enquêtes auprès de très petites populations;(c) mener des enquêtes avec de très petits échantillons.

      Les auteurs examinent les raisons pour lesquelles ces méthodes constituent des moyens appropriés de mise à l'essai d'hypothèses dans les populations. Les compromis concernant le choix d'une méthode sont aussi examinés.

      Date de diffusion : 2009-12-03

    • Articles et rapports : 11-522-X200800010959
      Description :

      L'Enquête unifiée auprès des entreprises (EUE) réalisée par Statistique Canada est une enquête-entreprise annuelle dont le but est d'uniformiser plus de 60 enquêtes couvrant diverses industries. À l'heure actuelle, deux types de fonctions de score sont utilisés durant la collecte des données de l'EUE pour en faire le suivi. L'objectif est d'employer une fonction de score qui maximise les taux de réponse à l'enquête pondérés par le poids économique en ce qui a trait aux principales variables d'intérêt, sous la contrainte d'un budget de suivi limité. Les deux types de fonctions de score étant fondés sur des méthodologies différentes, leur incidence sur les estimations finales pourrait ne pas être la même.

      La présente étude consiste à comparer, d'une manière générale, les deux types de fonctions de score en s'appuyant sur des données concernant la collecte recueillies au cours des deux dernières années. Aux fins des comparaisons, chaque type de fonction de score est appliqué aux mêmes données et diverses estimations de variables financières et de variables liées aux marchandises (biens et services) pour lesquelles des données sont publiées sont calculées, ainsi que leur écart par rapport à la pseudo valeur réelle et leur écart quadratique moyen, en se fondant sur chaque méthode. Ces estimations de l'écart et de l'écart quadratique moyen calculées selon chaque méthode sont ensuite utilisées pour mesurer l'effet de chaque fonction de score sur les estimations finales des variables financières et des variables liées aux biens et services.

      Date de diffusion : 2009-12-03

    • Articles et rapports : 11-522-X200800010967
      Description :

      Le présent article traite du contexte de l'utilisation du langage XBRL (eXtensible Business Reporting Language) et de la participation de Statistics Netherlands au projet de taxonomie des Pays-Bas. La discussion porte principalement sur le contexte statistique de l'utilisation de XBRL et de la taxonomie des Pays-Bas pour préciser les termes de données aux sociétés.

      Date de diffusion : 2009-12-03

    • Articles et rapports : 11-536-X200900110803
      Description :

      L'estimateur GREG « traditionnel » est utilisé ici pour renvoyer à l'estimateur de régression généralisée qui a fait l'objet de longues discussions, notamment dans le document de Särndal, Swensson et Wretman (1992). Le document résume certaines nouvelles applications de l'estimateur GREG traditionnel dans le cadre de l'estimation des totaux des sous-groupes de population ou des domaines. L'estimation GREG a été mise en pratique pour l'estimation des domaines dans Särndal (1981, 1984), Hidiroglou et Särndal (1985) et Särndal et Hidiroglou (1989); cette application a été examinée de plus près dans l'article de Estevao, Hidiroglou et Särndal (1995). Pour l'estimateur GREG traditionnel, le modèle linéaire à effets fixes sert de modèle sous-jacent de travail ou de soutien, et les totaux auxiliaires au niveau agrégé sont intégrés dans la procédure d'estimation. Dans certains modèles récents, on suppose que l'accès aux données auxiliaires au niveau de l'unité pour l'estimation GREG sur domaines est disponible. De toute évidence, l'accès au registre micro-fusionné et aux données d'enquêtes nécessite une grande souplesse pour l'estimation de domaines. Ce point de vue a été adopté pour l'estimation GREG, notamment dans Lehtonen et Veijanen (1998), Lehtonen, Särndal et Veijanen (2003, 2005), et Lehtonen, Myrskylä, Särndal et Veijanen (2007). Ces nouvelles applications englobent les cas de variables réponses continues et binaires ou polytomiques, l'utilisation de modèles mixtes linéaires généralisés comme modèles de soutien et des plans de sondage probabilistes inégaux. Les mérites relatifs et les défis associés aux divers estimateurs GREG seront soulevés.

      Date de diffusion : 2009-08-11

    • Articles et rapports : 11-536-X200900110807
      Description :

      On a démontré que la calibration à des modèles (Wu et Sitter, JASA 2001) produit des estimations plus efficaces que la calibration classique lorsque les valeurs d'une ou plusieurs variables auxiliaires sont disponibles pour chaque unité de la population et que les relations entre de telles variables et les variables d'intérêt sont plus complexes qu'une relation linéaire. La calibration à un modèle, par contre, fournit un ensemble de poids différents pour chaque variable d'intérêt. Pour surmonter ce problème, un estimateur est proposé: on vise à calibrer simultanément par rapport aux valeurs des variables auxiliaires et par rapport aux valeurs prédites de la variables d'intérêt obtenues par des modèles paramétriques et/ou nonparamétriques. Ceci permet d'obtenir la cohérence entre les estimations et plus d'efficacité si le modèle est bien spécifié. On étudie les propriétés asymptotiques de l'estimateur résultant par rapport au plan de sondage. On traite de la question de la grande variabilité des poids en relâchant des contraintes fermes sur les variables qui sont inclues pour des raisons d'efficacité dans les équations de calibration. On présente aussi une étude par simulations pour mieux comprendre le comportement de l'estimateur proposé dans de petits échantillons.

      Date de diffusion : 2009-08-11

    • Articles et rapports : 11-536-X200900110811
      Description :

      L'imputation composite est souvent utilisée dans le cadre des enquêtes-entreprises. Elle survient lorsque plusieurs méthodes d'imputation sont utilisées pour imputer une seule variable d'intérêt. Le choix d'une méthode plutôt qu'une autre dépend de la disponibilité de certaines variables auxiliaires. Par exemple, l'imputation par la méthode du quotient pourrait être utilisée pour imputer une valeur manquante lorsqu'une valeur auxiliaire existe, sinon l'imputation par la moyenne pourrait être utilisée.

      Bien que l'imputation composite se rencontre fréquemment en pratique, l'estimation de la variance fondée sur l'imputation composite n'a pas été beaucoup documentée. Nous examinons la méthodologie générale proposée par Särndal et coll. (1992), qui nécessite la validité d'un modèle d'imputation, c.-à-d. un modèle pour la variable imputée. À première vue, l'application de cette méthodologie à l'imputation composite semble fort fastidieuse, jusqu'à ce que nous remarquions que la plupart des méthodes d'imputation utilisées en pratique donnent lieu à des estimateurs imputés qui sont linéaires dans les valeurs observées de la variable d'intérêt. Ainsi, il devient considérablement plus simple de dériver un estimateur de la variance, même lorsqu'une seule méthode d'imputation est utilisée. Pour estimer la partie échantillonnage de la variance totale, nous employons une méthodologie légèrement différente de celle que proposent Särndal et coll. (1992). Notre méthodologie s'apparente à l'estimateur de la variance de l'échantillonnage fondé sur l'imputation multiple avec un nombre infini d'imputations.

      Cette méthodologie est l'essence même de la version 2.0 du Système d'estimation de la variance due à la non-réponse et à l'imputation (SEVANI), qui est en cours de développement à Statistique Canada. Au moyen du SEVANI, nous allons illustrer notre méthode par le biais d'un exemple fondé sur des données réelles.

      Date de diffusion : 2009-08-11

    • Articles et rapports : 12-001-X200900110888
      Description :

      Lors de la sélection d'un échantillon, une pratique courante consiste à définir un plan de sondage stratifié sur des sous-populations. La variance de l'estimateur de Horvitz-Thompson est alors réduite par rapport à un tirage direct si les strates sont bien homogènes au regard de la variable d'intérêt. Si des variables auxiliaires sont disponibles pour chaque individu, l'échantillonnage peut être amélioré par tirage équilibré au sein de chaque strate et l'estimateur de Horvitz-Thompson sera plus précis si les variables auxiliaires sont bien corrélées à la variable d'intérêt. Cependant, si la répartition d'échantillon est faible dans certaines strates, l'équilibrage ne sera respecté que de façon très approximative. Nous proposons ici une méthode de tirage permettant de sélectionner un échantillon équilibré sur l'ensemble de la population, en respectant une allocation fixée au sein de chaque strate. Nous montrons que dans le cas particulier important d'un tirage de taille 2 dans chaque strate, la précision de l'estimateur de Horvitz-Thompson est améliorée si la variable d'intérêt est bien expliquée par les variables d'équilibrage sur l'ensemble de la population. Une application au cas d'un échantillonnage rotatif est également proposée.

      Date de diffusion : 2009-06-22

    • Articles et rapports : 12-002-X200900110692
      Description :

      Les chercheurs peuvent examiner l'évolution des tendances dans le temps en procédant à l'examen des réponses aux questions posées à maintes reprises aux mêmes répondants durant plusieurs cycles de données longitudinales. L'utilisation de ces réponses mesurées à maintes reprises peut souvent être difficile. Le présent article examine les tendances dans les activités de bénévolat des jeunes à l'aide des données de l'Enquête longitudinale nationale sur les enfants et les jeunes, afin de faire ressortir plusieurs questions dont les chercheurs devraient tenir compte en utilisant les mesures itératives.

      Date de diffusion : 2009-04-22

    • Articles et rapports : 12-002-X200900110693
      Description :

      Composé au départ pour la recherche de l'auteur sur l'assurance-chômage (AC), cet article résume une série de procédures qui permettent une construction personnalisée de données de durée, à l'aide du logiciel SPSS et de l'Enquête sur la dynamique du travail et du revenu (EDTR). Ces procédures peuvent servir à fusionner, déduire ou faire correspondre plusieurs ensembles de données liés à la durée.

      Date de diffusion : 2009-04-22

    • Articles et rapports : 15-206-X2009023
      Description :

      Le présent document porte sur l'impact des révisions apportées aux estimations de la productivité du travail et aux variables associées incluses dans le cycle de révision des Comptes nationaux de 2004 à 2007 pour le Canada et de 2005 à 2007 pour les États-Unis.

      Date de diffusion : 2009-03-11
    Références (30)

    Références (30) (10 à 20 de 30 résultats)

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015658
      Description :

      Le radon, qui est un gaz dont la présence est observée naturellement dans la plupart des maisons, est un facteur de risque confirmé pour le cancer du poumon chez les humains. Le National Research Council des États-Unis (1999) vient de terminer une évaluation approfondie du risque pour la santé de l'exposition résidentielle au radon, tout en élaborant des modèles de projection du risque de cancer pulmonaire dû au radon pour l'ensemble de la population. Cette analyse indique que le radon joue possiblement un rôle dans l'étiologie de 10-15 % des cas de cancer du poumon aux États-Unis, bien que ces estimations comportent une part appréciable d'incertitude. Les auteurs présentent une analyse partielle de l'incertidude et de la variabilité des estimations du risque de cancer pulmonaire dû à l'exposition résidentielle au radon, aux États-Unis, à l'aide d'un cadre général d'analyse de l'incertitude et de la variabilité établi antérieurement par ces mêmes auteurs. Plus particulièrement, il est question des estimations de l'excès de risque relatif (EFF) par âge et du risque relatif à vie (RRV), qui varient tous deux considérablement d'une personne à l'autre.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015660
      Description :

      Les situations qui nécessitent le couplage des enregistrements d'un ou de plusieurs fichiers sont très diverses. Dans le cas d'un seul fichier, le but du couplage est de repérer les enregistrements en double. Dans le cas de deux fichiers, il consiste à déceler les unités qui sont les mêmes dans les deux fichiers et donc de créer des paires d'enregistrements correspondants. Souvent, les enregistrements qu'il faut coupler ne contiennent aucun identificateur unique. Le couplage hiérarchique des enregistrements, le couplage probabiliste des enregistrements et l'appariement statistique sont trois méthodes applicables dans ces conditions. Nous décrivons les principales différences entre ces méthodes. Puis, nous discutons du choix des variables d'appariement, de la préparation des fichiers en prévision du couplage et de la façon dont les paires sont reconnues. Nous donnons aussi quelques conseils et quelques trucs utilisés pour coupler des fichiers. Enfin, nous présentons deux exemples : le couplage probabiliste d'enregistrements réalisé dans le cadre de la contre-vérification des données du recensement et le couplage hiérarchique des enregistrements du fichier maître des numéros d'entreprise (NE) à ceux du fichier de l'univers statistique (FUS) d'unités déclarantes non constituées en société (T1).

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015664
      Description :

      La litterature sur la statistique comprend de nombreuses études portant sur les méthodes déterministes, on trouve peu d'information sur ces méthodes. En outre, il semble qu'il n'existe pas d'études qui comparent les résultats obtenus avec les deux méthodes. Or, une telle comparaison serait utile lorsque les seuls indicateurs communs dont on dispose, et à partir desquels les bases de données doivent être couplées, sont des indicateurs indistincts, comme le nom, le sexe et la race. La présente étude compare une méthode de couplage déterministe par étapes avec la méthode probabiliste mise en oeuvre dans AUTOMATCH pour de telles situations. La comparaison porte sur un couplage de données médicales des centres régionaux de soins périnataux intensifs et de données relatives à l'éducation du ministère de l'Éducation de la Floride. Les numéros d'assurance sociale qui figurent dans les deux bases de données ont servi à valider les paires d'enregistrements après le couplage. On compare les taux de correspondance et les taux d'erreur obtenus avec les deux méthodes et on présente une discussion sur les similitudes et les différences entre les méthodes, ainsi que sur les points forts et les points faibles de chacune.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015666
      Description :

      L'échantillon de fusion obtenu par un procédé d'appariement statistique peut être considéré comme un échantillon tiré d'une population artificielle. Nous dérivons la distribution de cette population artificielle. Si la corrélation entre des variables spécifiques est le seul point d'intérêt, l'importance de l'indépendance conditionnelle peut être réduite. Dans une étude de simulation, nous examinons les effets de la non-confirmation de certaines hypothèses formulées pour obtenir la distribution de la population artificielle. Enfin, nous présentons des idées au sujet de l'établissement de la supposée indépendance conditionnelle par l'analyse de classes latentes.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015670
      Description :

      Pour atteindre efficacement leur public cible, les publicistes et les planificateurs des médias ont besoin de savoir quel pourcentage de consommateurs de Coke diète regardent Alerte à Malibu, ou combien de clients d'AT&T ont vu une annonce de Sprint au cours de la dernière semaine. Toutes les données pertinentes pourraient en théorie être recueillies auprès de chacun des répondants. Toutefois, la collecte de données précises et détaillées serait très coûteuse. Elle imposerait en outre un fardeau important aux répondants, compte tenu de la technique de collecte utilisée actuellement. Pour le moment, ces donées sont recueillies dans le cadre d'enquêtes distinctes, en Nouvelle-Zélande et dans nombre d'autres pays. Le niveau d'exposition aux principaux médias est mesuré de façon continue, et les études sur l'utilisation des produits sont répandues. Des techniques d'appariement statistique fournissent une façon de combiner ces sources d'information distinctes. La base de données des cotes d'écoute de la télévision en Nouvelle-Zélande a été combinée à une enquête multi-intérêts portant sur le profit des lecteurs d'imprimés et la consommation de produits, grâce à l'appariement statistique. Le service Panorama qui en résulte répond aux besoins d'information des publicistes et des planificateurs des médias. L'expérience a été reprise depuis en Australie. Le présent document porte sur l'élaboration du cadre d'appariement statistique qui a servi à la combinaison de ces bases de données, ainsi que sur les connaissances heuristiques et les techniques qui ont été utilisées. Celles-ci comprenaient notamment une expérience effectuée au moyen d'un plan de contrôle visant à déterminer les variables d'appariement importantes. Le présent document comprend en outre un résumé des études ayant servi à l'évaluation et à la validation des résultats combinés. Trois critères principaux d'évaluation ont été utilisés, à savoir : la précision des résultats combinés, la stabilité de ces résultats et la préservation des résultats des bases de données originales. On aborde aussi la façon dont les conditions préalables à la combinaison de ces bases de données ont été respectées. Les différences entre les techniques d'analyse utilisées dans les deux bases de données d'origine ont constitué l'obstacle le plus important à cette étape. Enfin, des suggestions pour le de'veloppement de systèmes d'appariement statistique similaires ailleurs sont fournis.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015672
      Description :

      La fusion des données qui est examinée ici consiste à créer un ensemble de données provenant de sources différentes sur des variables que l'on n'observe pas conjointement. Supposons par exemple que l'on dispose d'observations pour (X,Z) sur un ensemble de personnes et pour (Y,Z) sur un autre ensemble de personnes. Chacune des variables X, Y et Z peut être vectorielle. L'objectif principal consiste à obtenir des précisions sur la distribution conjointe de (X,Y) en se servant de Z comme ce que l'on conviendra d'appeler variable d'appariement. Toutefois, on s'efforce d'abord d'extraire des ensembles de données distincts autant de renseignements que possible sur la distribution conjointe de (X,Y,Z). On ne peut procéder à ce genre de fusion que moyennant la précision de certaines propriétés distributionnelles pour les données fusionnées, à savoir l'hypothèse d'indépendance conditionnelle étant donné les variables d'appariement. Classiquement, l'examen des variables fusionnées consiste à déterminer dans quelle mesure cette hypothèse sous-jacente est appropriée. Ici, nous examinons le problème sous un angle différent. La question que nous nous posons est celle de savoir comment il est possible d'estimer des distributions dans des situations où l'on ne dispose que d'observations provenant de certaines distributions marginales. Nous pouvons la résoudre en appliquant le critère d'entropie maximale. Nous montrons notamment qu'il est possible d'interpréter les données créés par fusion de données de sources différentes comme un cas spécial de cette situation. Par conséquent, nous dérivons l'hypothèse nécessaire d'indépendance conditionnelle en tant que conséquence du type de données disponibles.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015684
      Description :

      Il arrive souvent qu'on recueille, de façon pratiquement simultaée, la même information sur plusieurs enquêtes différentes. En France, cela est institutionnalisé dans les enquêtes auprès des ménages qui comportent un tronc commun de variables portant sur la situation démographique, l'emploi, le logement et les revenus. Ces variables sont des cofacteurs importants des variables d'intérêt de chacune des enquêtes et leur utilisation judicieuse peut permettre un renforcement des estimations dans chacune d'elle. Les techniques de calage sur information incertaine peuvent s'appliquer de façon naturelle dans ce contexte. Cela revient à rechercher le meilleur estimateur sans biais des variables communes et à caler chacune des enquêtes sur cet estimateur. Il se trouve que l'estimateur ainsi obtenu dans chaque enquête est toujours un estimateur linéaire dont les pondérations sont faciles à expliciter, que la variance s'obtient sans problème nouveau de même que l'estimation de variance. Si on veut compléter la panoplie des estimateurs par régression, on peut aussi voir cette technique comme un estimateur par ridge-regression, ou encore comme une estimation par régression bayésienne.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015688
      Description :

      Des données de sources multiples sont couplées pour examiner les liens géographique et temporel entre la pollution atmosphérique et l'asthme. Ces sources incluent les dossiers administratifs établis par 59 cabinets de médecins généralistes répartis à travers l'Angleterre et le Pays de Galles au sujet d'un demi million de patients venus à la consultation pour cause d'asthme, ainsi que des renseignements socioéconomiques recueillis dans le cadre d'une enquête par interview. Les codes postaux permettent de coupler ces données à celles sur i) la densité routière calculée pour les routes locales, ii) les émissions estimatives de dioxyde de soufre et d'oxydes d'azote, iii) la concentration de fumée noire, de dioxyde de soufre, de dioxyde d'azote et d'autres polluants mesurée ou interpolée aux emplacements des cabinets de médecins. Parallèlement, on analyse des séries chronologiques de Poisson, en tenant compte des variations entre cabinets de médecins, pour examiner les corrélations quotidiennes dans le cas des cabinets situés près des stations de surveillance de la qualité de l'air. Les analyses préliminaires montrent une association faible, en général non significative, entre les taux de consultations et les marqueurs de pollution. On examine les problèmes méthodologiques que posent la combinaison de données de ce genre et l'interprétation des résultats.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015690
      Description :

      La construction de l'échantillon virtuel est réalisé en deux étapes. La première consiste, en partant d'un panel maître, à effectuer une Analyse des Correspondances Multiples (ACM) sur des variables fondamentales pour l'étude. Puis, on génére aléatoirement des individus muets à partir de la distribution de chaque facteur significatif de l'analyse. Enfin, pour chaque individu, on génére une valeur pour chaque variable fondamentale la plus liée à un des facteurs précédents. Cette méthode assure un tirage indépendant d'ensembles de variables. La seconde étape consiste à greffer un certain nombre d'autres bases de données, dont on donnera les propriétés requises. On génére une variable à rajouter à l'aide de sa distribution estimée, avec un modèle linéaire généralisé en fonction des variables communes et celles qui ont déjà été rajoutées. Le même procédé est alors utilisé pour greffer les autres échantillons. Nous avons appliqué cette méthode pour générer un échantillon virtuel à partir de deux enquêtes. L'échantillon virtuel généré a été validé à l'aide de tests de comparaison d'échantillons. Les résultats obtenus sont positifs et montrent la faisabilité de cette méthode.

      Date de diffusion : 2000-03-02

    • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015692
      Description :

      Les tarifs d'électricité qui varient selon la période de la journée, appelés aussi tarifs horaires ou tarifs multiples, sont susceptibles d'accroître considérablement l'efficacité économique du marché de l'énergie. Plusieurs services publics d'électricité ont étudié les effets économiques des programmes de tarification selon la période de consommation offerts à leur clientèle résidentielle. On recourt ici à la méta-analyse pour regrouper les résultats de trente-huit programmes distincts en vue d'étudier l'effet des tarifs multiples sur la demande d'électricité. Quatre constations importantes se dégagent de l'analyse. Premièrement, le rapport entre le tarif de période de pointe et le tarif en période creuse doit être élevé pour que l'effet sur la demande de pointe soit important. Deuxièmement, les tarifs de période de pointe ontune incidence relativement plus importante sur la demande en été qu'en hiver. Troisièmement, les tarifs sont relativement plus efficaces s'ils sont sur une base permanente plutôt qu'expérimentale. Quatrièmement, la perception de frais en fonction de la demande concurrence les tarifs multiples ordinaires sur la demande de pointe.

      Date de diffusion : 2000-03-02
    Date de modification :