Analyses

Aller au contenu principal
Aller au pied de page

Sélection de la langue

English

Recherche et menus

Recherche et menus

Rechercher

Passer au filtres. Voir les résultats.

Quoi de neuf sur notre site

Centre de confiance de Statistique Canada

Résultats

Tout (43)

Tout (43) (0 à 10 de 43 résultats)

1. Emploi rémunéré, travail autonome et travail à la demande selon les données administratives et les données d’enquêtes
Articles et rapports : 11F0019M2023003
Description : La présente étude combine des données d’enquête avec des données administratives, en vue d’examiner la correspondance entre les activités d’un emploi rémunéré et celles d’un travail autonome, déclarées dans chacune de ces sources de données par les mêmes particuliers. L’étude permet également d’examiner le rôle que joue le travail autonome en tant que source de revenu complémentaire pour les particuliers dont la principale activité autodéclarée sur le marché du travail est l’emploi salarié.
Date de diffusion : 2023-06-06
2. Programme de statistiques sur la qualité de vie de Statistique Canada : avril 2021 à mars 2023
Articles et rapports : 75F0002M2023001
Description : Le présent document de travail décrit les travaux réalisés et entrepris par Statistique Canada, en partenariat avec le Secrétariat du Conseil du Trésor du Canada, le ministère des Finances du Canada et le Bureau du Conseil privé, en vue de l'élaboration du Cadre de référence sur la de qualité de vie pour le Canada et des produits connexes, y compris un carrefour en ligne. Le présent document est le premier d'une série qui fera le point sur l'avancement des travaux relatifs au Cadre.
Date de diffusion : 2023-04-19
3. Un algorithme du recuit simulé pour la stratification et la répartition simultanée de l’échantillon
Articles et rapports : 12-001-X202200100010
Description :
La présente étude combine le recuit simulé avec l’évaluation delta pour résoudre le problème de stratification et de répartition simultanée de l’échantillon. Dans ce problème particulier, les strates atomiques sont divisées en strates mutuellement exclusives et collectivement exhaustives. Chaque partition de strates atomiques est une solution possible au problème de stratification, dont la qualité est mesurée par son coût. Le nombre de Bell de solutions possibles est énorme, même pour un nombre modéré de strates atomiques, et une couche supplémentaire de complexité s’ajoute avec le temps d’évaluation de chaque solution. De nombreux problèmes d’optimisation combinatoire à grande échelle ne peuvent être résolus de manière optimale, car la recherche d’une solution optimale exige un temps de calcul prohibitif. Un certain nombre d’algorithmes heuristiques de recherche locale ont été conçus pour résoudre problème, mais ils peuvent rester coincés dans des minima locaux, ce qui empêche toute amélioration ultérieure. Nous ajoutons, à la suite existante d’algorithmes de recherche locale, un algorithme du recuit simulé qui permet de s’échapper des minima locaux et s’appuie sur l’évaluation delta pour exploiter la similarité entre des solutions consécutives, et ainsi réduire le temps d’évaluation. Nous avons comparé l’algorithme du recuit simulé avec deux algorithmes récents. Dans les deux cas, l’algorithme du recuit simulé a permis d’obtenir une solution de qualité comparable en beaucoup moins de temps de calcul.

Date de diffusion : 2022-06-21
4. Estimation de la variance par répliques après calage fondé sur l’échantillon
Articles et rapports : 12-001-X202100200006
Description :
Le calage fondé sur l’échantillon se produit quand les poids d’une enquête sont calés pour contrôler les totaux aléatoires, au lieu de représenter les totaux fixes au niveau de la population. Les totaux de contrôle peuvent être estimés à partir de différentes phases de la même enquête ou d’une autre enquête. En cas de calage fondé sur l’échantillon, pour que l’estimation de la variance soit valide, il est nécessaire de tenir compte de la contribution de l’erreur due à l’estimation des totaux de contrôle. Nous proposons une nouvelle méthode d’estimation de la variance qui utilise directement les poids de rééchantillonnage de deux enquêtes, dont une sert à fournir des totaux de contrôle pour le calage des autres poids d’enquête. Aucune restriction n’est établie quant à la nature des deux méthodes de rééchantillonnage et il n’est pas nécessaire de calculer d’estimation de la variance-covariance, ce qui simplifie la mise en œuvre pratique de la méthode proposée. Nous fournissons la description générale de la méthode utilisée pour les enquêtes comportant deux méthodes de rééchantillonnage arbitraire avec un nombre de répliques différent. Il est démontré que l’estimateur de la variance obtenu est convergent pour la variance asymptotique de l’estimateur calé, quand le calage est effectué au moyen de l’estimation par la régression ou la méthode itérative du quotient (raking). La méthode est illustrée dans une application réelle, dans laquelle il faut harmoniser la composition démographique de deux enquêtes pour améliorer la comparabilité des estimations de l’enquête.
Date de diffusion : 2022-01-06
5. Le bureau central de la statistique des Pays-Bas et l’intelligence artificielle Archivé
Articles et rapports : 11-522-X202100100011
Description : Les façons dont l’IA peut influer sur le monde des statistiques officielles sont multiples et le bureau central de la statistique des Pays-Bas (CBS) explore activement la façon dont il peut utiliser l’IA afin de remplir sa fonction sociétale. L’article décrit plusieurs domaines de l’IA sur lesquels CBS travaille actuellement : à savoir l’utilisation de l’IA aux fins de sa production de statistiques et de sa recherche et développement en statistique, la mise au point d’un outil national de surveillance de l’IA, le soutien d’autres organismes gouvernementaux ayant de l’expertise sur les données équitables et les algorithmes équitables, le partage de données dans des conditions sûres et sécurisées, et la participation à des collaborations liées à l’IA.
Mots-clés : intelligence artificielle; statistiques officielles; partage de données; algorithmes équitables; surveillance de l’IA; collaboration.
Date de diffusion : 2021-11-05
6. Besoin de vitesse : Utilisation de fastText (apprentissage automatique) afin de coder l'Enquête sur la population active Archivé
Articles et rapports : 11-522-X202100100013
Description : L’Enquête sur la population active (EPA) de Statistique Canada joue un rôle fondamental dans le mandat de Statistique Canada. L’information sur le marché du travail fournie par l’EPA est l’une des mesures les plus actuelles et les plus importantes du rendement global de l’économie canadienne. Le codage de l'industrie du répondant selon le Système de classification des industries de l'Amérique du Nord (SCIAN), de la profession selon le Système de classification nationale des professions (CNP) et de la principale catégorie de travailleurs (PCDT) fait partie intégrante du traitement mensuel des données de l'EPA. Chaque mois, jusqu'à 20 000 enregistrements sont codés manuellement. En 2020, Statistique Canada a travaillé au développement de modèles d'apprentissage automatique utilisant fastText afin de coder les réponses au questionnaire de l'EPA selon les trois classifications mentionnées précédemment. Le présent article donnera un aperçu de la méthodologie développée et des résultats obtenus à partir d'une application potentielle de l'utilisation de fastText dans le processus de codage de l’EPA.
Mots clés : apprentissage automatique; Enquête sur la population active; classification de texte; fastText.

Date de diffusion : 2021-11-05
7. Échantillonnage d’ensembles ordonnés avec probabilité proportionnelle à la taille dans des populations stratifiées
Articles et rapports : 12-001-X202000200001
Description :
Le présent article construit un échantillon d’ensembles ordonnés avec probabilité proportionnelle à la taille (PPT) à partir d’une population stratifiée. Un échantillon d’ensembles ordonnés PPT partitionne les unités d’un échantillon PPT en groupes d’observations semblables. La construction de groupes semblables repose sur des positions relatives (rangs) d’unités dans de petits ensembles de comparaison. Ainsi, les rangs induisent plus de structure (stratification) dans l’échantillon en plus de la structure de données créée par des probabilités de sélection inégales dans un échantillon PPT. La structure de données ajoutée rend l’échantillon d’ensembles ordonnés PPT plus informatif qu’un échantillon PPT. On construit l’échantillon d’ensembles ordonnés PPT stratifié en sélectionnant un échantillon d’ensembles ordonnés PPT à partir de chaque strate de la population. L’article construit des estimateurs sans biais pour la moyenne de la population, le total de la population et leurs variances. On applique le nouveau plan d’échantillonnage à des données sur la production de pommes pour estimer la production totale de pommes en Turquie.
Date de diffusion : 2020-12-15
8. Estimation et inférence des moyennes de domaine soumises à des contraintes qualitatives
Articles et rapports : 12-001-X202000200002
Description :
Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.
Date de diffusion : 2020-12-15
9. Évaluation des propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents dans un échantillon d'enfants et d'adolescents canadiens âgés de 6 à 17 ans représentatif à l'échelle nationale
Articles et rapports : 82-003-X202000800002
Description :
La présente étude avait pour but d'examiner les propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents au moyen d'un échantillon d'enfants et d'adolescents canadiens représentatif à l'échelle nationale.

Date de diffusion : 2020-08-19
10. Algorithme génétique de regroupement pour la stratification et la répartition simultanée de l’échantillon dans les plans de sondage
Articles et rapports : 12-001-X201900300007
Description :
Lorsque la base de sondage est importante, il est difficile d’optimiser la stratification et la taille de l’échantillon dans un plan de sondage univarié ou multivarié. Il existe diverses façons de modéliser et de résoudre ce problème. Un des moyens les plus naturels est l’algorithme génétique (AG) combiné à l’algorithme d’évaluation de Bethel-Chromy. Un AG recherche itérativement la taille minimale d’échantillon permettant de respecter les contraintes de précision lorsqu’il s’agit de partitionner les strates atomiques formées par le produit cartésien de variables auxiliaires. Nous signalons un inconvénient avec les AG classiques appliqués à un problème de regroupement et proposons un nouvel algorithme génétique de « regroupement » avec des opérateurs génétiques au lieu des opérateurs classiques. Des expériences indiquent qu’on se trouve ainsi à améliorer nettement la qualité de solution pour un même effort de calcul.
Date de diffusion : 2019-12-17

Stats en bref (0)

Stats en bref (0) (0 résultat)

Aucun contenu disponible actuellement

Articles et rapports (43)

Articles et rapports (43) (0 à 10 de 43 résultats)

1. Emploi rémunéré, travail autonome et travail à la demande selon les données administratives et les données d’enquêtes
Articles et rapports : 11F0019M2023003
Description : La présente étude combine des données d’enquête avec des données administratives, en vue d’examiner la correspondance entre les activités d’un emploi rémunéré et celles d’un travail autonome, déclarées dans chacune de ces sources de données par les mêmes particuliers. L’étude permet également d’examiner le rôle que joue le travail autonome en tant que source de revenu complémentaire pour les particuliers dont la principale activité autodéclarée sur le marché du travail est l’emploi salarié.
Date de diffusion : 2023-06-06
2. Programme de statistiques sur la qualité de vie de Statistique Canada : avril 2021 à mars 2023
Articles et rapports : 75F0002M2023001
Description : Le présent document de travail décrit les travaux réalisés et entrepris par Statistique Canada, en partenariat avec le Secrétariat du Conseil du Trésor du Canada, le ministère des Finances du Canada et le Bureau du Conseil privé, en vue de l'élaboration du Cadre de référence sur la de qualité de vie pour le Canada et des produits connexes, y compris un carrefour en ligne. Le présent document est le premier d'une série qui fera le point sur l'avancement des travaux relatifs au Cadre.
Date de diffusion : 2023-04-19
3. Un algorithme du recuit simulé pour la stratification et la répartition simultanée de l’échantillon
Articles et rapports : 12-001-X202200100010
Description :
La présente étude combine le recuit simulé avec l’évaluation delta pour résoudre le problème de stratification et de répartition simultanée de l’échantillon. Dans ce problème particulier, les strates atomiques sont divisées en strates mutuellement exclusives et collectivement exhaustives. Chaque partition de strates atomiques est une solution possible au problème de stratification, dont la qualité est mesurée par son coût. Le nombre de Bell de solutions possibles est énorme, même pour un nombre modéré de strates atomiques, et une couche supplémentaire de complexité s’ajoute avec le temps d’évaluation de chaque solution. De nombreux problèmes d’optimisation combinatoire à grande échelle ne peuvent être résolus de manière optimale, car la recherche d’une solution optimale exige un temps de calcul prohibitif. Un certain nombre d’algorithmes heuristiques de recherche locale ont été conçus pour résoudre problème, mais ils peuvent rester coincés dans des minima locaux, ce qui empêche toute amélioration ultérieure. Nous ajoutons, à la suite existante d’algorithmes de recherche locale, un algorithme du recuit simulé qui permet de s’échapper des minima locaux et s’appuie sur l’évaluation delta pour exploiter la similarité entre des solutions consécutives, et ainsi réduire le temps d’évaluation. Nous avons comparé l’algorithme du recuit simulé avec deux algorithmes récents. Dans les deux cas, l’algorithme du recuit simulé a permis d’obtenir une solution de qualité comparable en beaucoup moins de temps de calcul.

Date de diffusion : 2022-06-21
4. Estimation de la variance par répliques après calage fondé sur l’échantillon
Articles et rapports : 12-001-X202100200006
Description :
Le calage fondé sur l’échantillon se produit quand les poids d’une enquête sont calés pour contrôler les totaux aléatoires, au lieu de représenter les totaux fixes au niveau de la population. Les totaux de contrôle peuvent être estimés à partir de différentes phases de la même enquête ou d’une autre enquête. En cas de calage fondé sur l’échantillon, pour que l’estimation de la variance soit valide, il est nécessaire de tenir compte de la contribution de l’erreur due à l’estimation des totaux de contrôle. Nous proposons une nouvelle méthode d’estimation de la variance qui utilise directement les poids de rééchantillonnage de deux enquêtes, dont une sert à fournir des totaux de contrôle pour le calage des autres poids d’enquête. Aucune restriction n’est établie quant à la nature des deux méthodes de rééchantillonnage et il n’est pas nécessaire de calculer d’estimation de la variance-covariance, ce qui simplifie la mise en œuvre pratique de la méthode proposée. Nous fournissons la description générale de la méthode utilisée pour les enquêtes comportant deux méthodes de rééchantillonnage arbitraire avec un nombre de répliques différent. Il est démontré que l’estimateur de la variance obtenu est convergent pour la variance asymptotique de l’estimateur calé, quand le calage est effectué au moyen de l’estimation par la régression ou la méthode itérative du quotient (raking). La méthode est illustrée dans une application réelle, dans laquelle il faut harmoniser la composition démographique de deux enquêtes pour améliorer la comparabilité des estimations de l’enquête.
Date de diffusion : 2022-01-06
5. Le bureau central de la statistique des Pays-Bas et l’intelligence artificielle Archivé
Articles et rapports : 11-522-X202100100011
Description : Les façons dont l’IA peut influer sur le monde des statistiques officielles sont multiples et le bureau central de la statistique des Pays-Bas (CBS) explore activement la façon dont il peut utiliser l’IA afin de remplir sa fonction sociétale. L’article décrit plusieurs domaines de l’IA sur lesquels CBS travaille actuellement : à savoir l’utilisation de l’IA aux fins de sa production de statistiques et de sa recherche et développement en statistique, la mise au point d’un outil national de surveillance de l’IA, le soutien d’autres organismes gouvernementaux ayant de l’expertise sur les données équitables et les algorithmes équitables, le partage de données dans des conditions sûres et sécurisées, et la participation à des collaborations liées à l’IA.
Mots-clés : intelligence artificielle; statistiques officielles; partage de données; algorithmes équitables; surveillance de l’IA; collaboration.
Date de diffusion : 2021-11-05
6. Besoin de vitesse : Utilisation de fastText (apprentissage automatique) afin de coder l'Enquête sur la population active Archivé
Articles et rapports : 11-522-X202100100013
Description : L’Enquête sur la population active (EPA) de Statistique Canada joue un rôle fondamental dans le mandat de Statistique Canada. L’information sur le marché du travail fournie par l’EPA est l’une des mesures les plus actuelles et les plus importantes du rendement global de l’économie canadienne. Le codage de l'industrie du répondant selon le Système de classification des industries de l'Amérique du Nord (SCIAN), de la profession selon le Système de classification nationale des professions (CNP) et de la principale catégorie de travailleurs (PCDT) fait partie intégrante du traitement mensuel des données de l'EPA. Chaque mois, jusqu'à 20 000 enregistrements sont codés manuellement. En 2020, Statistique Canada a travaillé au développement de modèles d'apprentissage automatique utilisant fastText afin de coder les réponses au questionnaire de l'EPA selon les trois classifications mentionnées précédemment. Le présent article donnera un aperçu de la méthodologie développée et des résultats obtenus à partir d'une application potentielle de l'utilisation de fastText dans le processus de codage de l’EPA.
Mots clés : apprentissage automatique; Enquête sur la population active; classification de texte; fastText.

Date de diffusion : 2021-11-05
7. Échantillonnage d’ensembles ordonnés avec probabilité proportionnelle à la taille dans des populations stratifiées
Articles et rapports : 12-001-X202000200001
Description :
Le présent article construit un échantillon d’ensembles ordonnés avec probabilité proportionnelle à la taille (PPT) à partir d’une population stratifiée. Un échantillon d’ensembles ordonnés PPT partitionne les unités d’un échantillon PPT en groupes d’observations semblables. La construction de groupes semblables repose sur des positions relatives (rangs) d’unités dans de petits ensembles de comparaison. Ainsi, les rangs induisent plus de structure (stratification) dans l’échantillon en plus de la structure de données créée par des probabilités de sélection inégales dans un échantillon PPT. La structure de données ajoutée rend l’échantillon d’ensembles ordonnés PPT plus informatif qu’un échantillon PPT. On construit l’échantillon d’ensembles ordonnés PPT stratifié en sélectionnant un échantillon d’ensembles ordonnés PPT à partir de chaque strate de la population. L’article construit des estimateurs sans biais pour la moyenne de la population, le total de la population et leurs variances. On applique le nouveau plan d’échantillonnage à des données sur la production de pommes pour estimer la production totale de pommes en Turquie.
Date de diffusion : 2020-12-15
8. Estimation et inférence des moyennes de domaine soumises à des contraintes qualitatives
Articles et rapports : 12-001-X202000200002
Description :
Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.
Date de diffusion : 2020-12-15
9. Évaluation des propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents dans un échantillon d'enfants et d'adolescents canadiens âgés de 6 à 17 ans représentatif à l'échelle nationale
Articles et rapports : 82-003-X202000800002
Description :
La présente étude avait pour but d'examiner les propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents au moyen d'un échantillon d'enfants et d'adolescents canadiens représentatif à l'échelle nationale.

Date de diffusion : 2020-08-19
10. Algorithme génétique de regroupement pour la stratification et la répartition simultanée de l’échantillon dans les plans de sondage
Articles et rapports : 12-001-X201900300007
Description :
Lorsque la base de sondage est importante, il est difficile d’optimiser la stratification et la taille de l’échantillon dans un plan de sondage univarié ou multivarié. Il existe diverses façons de modéliser et de résoudre ce problème. Un des moyens les plus naturels est l’algorithme génétique (AG) combiné à l’algorithme d’évaluation de Bethel-Chromy. Un AG recherche itérativement la taille minimale d’échantillon permettant de respecter les contraintes de précision lorsqu’il s’agit de partitionner les strates atomiques formées par le produit cartésien de variables auxiliaires. Nous signalons un inconvénient avec les AG classiques appliqués à un problème de regroupement et proposons un nouvel algorithme génétique de « regroupement » avec des opérateurs génétiques au lieu des opérateurs classiques. Des expériences indiquent qu’on se trouve ainsi à améliorer nettement la qualité de solution pour un même effort de calcul.
Date de diffusion : 2019-12-17

Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Signaler un problème ou une erreur sur cette page

Date de modification :: 2024-06-13

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.