Décomposition des inégalités salariales selon le sexe par calage : application à l’Enquête suisse sur la structure des salaires
Section 6. Application à l’Enquête suisse sur la structure des salaires

6.1  Description des données

L’ensemble de données utilisé contient des renseignements recueillis en 2008 par l’Office fédéral de la statistique suisse au moyen d’une enquête appelée Enquête suisse sur la structure des salaires. Un questionnaire a été envoyé à des organisations publiques et privées des secteurs secondaire et tertiaire afin de recueillir des renseignements sur des aspects particuliers. Ces aspects comprennent la taille de l’organisation, les types de contrats d’emploi et la rémunération des employés au sein de l’organisation. Le questionnaire a été rempli par un membre autorisé de l’organisation et non par des employés. Cela améliore la fiabilité des données et les rend moins susceptibles aux approximations. Les analyses qui suivent ont été limitées au secteur privé. Les observations valides incluses dans les analyses correspondaient aux individus sans valeurs manquantes, qui avaient travaillé plus d’une heure par semaine et pour lesquels la différence entre l’âge et les années d’expérience de travail était égale ou supérieure à 15 (d’après les lois suisses sur l’emploi, cela représente l’âge minimum légal pour pouvoir travailler). Donc, 29 048 cas ont été exclus de l’ensemble de données original. L’ensemble de données final comptait 647 139 hommes et 435 507 femmes. L’ensemble de données fourni par l’Office fédéral de la statistique contenait aussi les poids de sondage, de sorte qu’aucun traitement ni calcul de ces poids n’a été effectué dans la présente application.

Dans les tableaux qui suivent, les valeurs exprimées en francs suisses sont données entre parenthèses. Cependant, les chiffres sont représentés graphiquement en utilisant les logarithmes des salaires. Les valeurs sont obtenues en tenant compte des poids de sondage.

Le tableau 6.1 contient la médiane et la moyenne salariale pour l’échantillon complet, ainsi que pour les femmes et pour les hommes.

Tableau 6.1
Moyenne et médiane des salaires calculées pour l’ensemble de données complet, les femmes et les hommes, en francs suisses
Sommaire du tableau
Le tableau montre les résultats de Moyenne et médiane des salaires calculées pour l’ensemble de données complet Moyenne et Médiane(figurant comme en-tête de colonne).
Moyenne Médiane
Ensemble de données complet 6 977 5 905
Femmes 5 843 5 220
Hommes 7 725 6 346

Les valeurs de la moyenne ainsi que de la médiane des salaires des hommes sont supérieures aux valeurs pour l’ensemble de données complet, tandis que les valeurs pour les femmes sont inférieures. Le tableau 6.2 montre la répartition des hommes et des femmes dans les emplois faiblement et fortement rémunérés. Les quantiles pondérés des salaires pour l’ensemble de données complet sont calculés à la première ligne. Les deux lignes suivantes montrent les proportions cumulées de femmes et d’hommes qui gagnent moins que la valeur du quantile.

Tableau 6.2
Quantiles pondérés du logarithme du salaire et proportions de femmes et d’hommes qui gagnent moins que la valeur qui représente un quantile particulier du salaire calculé pour l’ensemble de données complet (les valeurs en francs suisses sont données entre parenthèses)
Sommaire du tableau
Le tableau montre les résultats de Quantiles pondérés du logarithme du salaire et proportions de femmes et d’hommes qui gagnent moins que la valeur qui représente un quantile particulier du salaire calculé pour l’ensemble de données complet (les valeurs en francs suisses sont données entre parenthèses) Quantile(figurant comme en-tête de colonne).
Quantile
1 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 99 %
Logarithme du salaire 7,89 8,27 8,39 8,50 8,59 8,68 8,78 8,89 9,03 9,27 10,09
(2 683) (3 897) (4 412) (4 905) (5 400) (5 905) (6 488) (7 233) (8 380) (10 667) (24 202)
Proportion cumulée de femmes 0,02 0,17 0,32 0,43 0,53 0,63 0,72 0,81 0,89 0,96 1
Proportion cumulée d’hommes 0,006 0,06 0,12 0,21 0,31 0,42 0,52 0,63 0,74 0,86 0,99

Alors que 43 % de femmes ont un salaire inférieur à 4 905 CHF (comparativement à seulement 21 % d’hommes), seulement 11 % de femmes ont un salaire compris entre 8 380 CHF et 24 202 CHF (comparativement à 25 % d’hommes). En outre, 63 % de femmes gagnent moins que la valeur médiane des salaires pour l’ensemble complet de données, comparativement à seulement 42 % d’hommes. Les mécanismes possibles à l’origine de cette répartition doivent être étudiés. Néanmoins, ce n’est pas l’objet du présent article. Afin de mieux comprendre la distribution des salaires dans chaque échantillon, le tableau 6.3 montre les quantiles pondérés des logarithmes des salaires des femmes et des hommes, ainsi que l’écart entre eux. Une valeur surprenante de l’écart entre les salaires s’observe au quantile d’ordre 1 %. En principe, ces emplois sont d’un type qui ne requiert ni de grandes qualifications ni un niveau d’études élevé. Alors que seulement 0,6 % d’hommes occupent ce genre d’emplois (voir le tableau 6.3), ils gagnent plus que les 2 % de femmes ayant des emplois comparables. La figure 6.1 montre les données du tableau 6.3 qui suit sous forme graphique.

Tableau 6.3
Salaires des femmes et des hommes et écart entre les salaires des hommes et des femmes, exprimés en logarithmes (les valeurs en francs suisses sont données entre parenthèses)
Sommaire du tableau
Le tableau montre les résultats de Salaires des femmes et des hommes et écart entre les salaires des hommes et des femmes Quantile(figurant comme en-tête de colonne).
Quantile
1 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 99 %
Femmes 7,80 8,19 8,30 8,38 8,47 8,56 8,66 8,76 8,88 9,06 9,67
(2 432) (3 602) (4 005) (4 344) (4 756) (5 220) (5 743) (6 353) (7 154) (8 577) (15 761)
Hommes 8,01 8,36 8,49 8,58 8,67 8,76 8,86 8,98 9,14 9,38 10,26
(3 000) (4 259) (4 850) (5 344) (5 820) (6 346) (7 012) (7 908) (9 291) (11 905) (28 571)
Écart 0,21 0,17 0,19 0,21 0,20 0,20 0,20 0,22 0,26 0,33 0,59
(568) (657) (845) (1 000) (1 064) (1 126) (1 269) (1 555) (2 137) (3 328) (12 810)

La distance entre les deux ensembles de points augmente vers les quantiles de niveau plus élevé, ce qui signifie que l’écart entre les salaires devient plus important. Il reste à établir quelle part de ces écarts n’est pas attribuable à des différences de caractéristiques entre les hommes et les femmes. En guise de preuve graphique finale des inégalités salariales, la figure 6.2 montre les distributions des logarithmes des salaires des femmes et des hommes.

Figure 6.1 Quantiles pondérés du logarithme des salaires des femmes et des hommes

Description de la figure 6.1

Figure présentant les quantiles pondérés du logarithme des salaires des femmes et des hommes. Les quantiles sont sur l'axe horizontal. Le logarithme du salaire est sur l'axe vertical. Les données sont dans le tableau suivant :

Tableau de données pour la Figure 6.1
Sommaire du tableau
Le tableau montre les résultats de Tableau de données pour la Figure 6.1. Les données sont présentées selon Quantiles (titres de rangée) et Salaire des femmes (Logarithme) et Salaire des hommes (Logarithme)(figurant comme en-tête de colonne).
Quantiles Salaire des femmes (Logarithme) Salaire des hommes (Logarithme)
1 % 7,80 8,01
10 % 8,19 8,36
20 % 8,30 8,49
30 % 8,38 8,58
40 % 8,47 8,67
50 % 8,56 8,76
60 % 8,66 8,86
70 % 8,76 8,98
80 % 8,88 9,14
90 % 9,06 9,38
99 % 9,67 10,26

Figure 6.2 Densités estimées des logarithmes des salaires des hommes et des femmes

Description de la figure 6.2

Figure présentant les courbes de densités estimées des logarithmes des salaires des hommes et des femmes. La densité est sur l'axe des y, allant de 0,0 à 1,2. L'axe des x va de 7 à 12. Les deux densités se chevauchent partiellement, la densité associée aux salaires des femmes atteignant sont sommet pour une valeur de x inférieure à celle des hommes. La courbe du salaire des hommes est légèrement décalée sur la droite.

6.2  Le modèle

Le modèle de régression contient huit variables explicatives :

Le modèle a été choisi parmi un certain nombre de modèles contenant plusieurs variables en utilisant le critère AIC minimal. La variable dépendante est le logarithme du salaire standardisé. Par salaire standardisé d’une personne, nous entendons le salaire calculé pour cette personne si elle travaillait à temps plein. Cette variable est fournie par l’Office fédéral de la statistique suisse dans l’ensemble de données, de sorte qu’aucun calcul n’a été effectué par les auteurs.

6.3  Poids et distributions contrefactuelles

La présente section comprend uniquement les résultats exprimés en logarithmes. Lorsqu’on utilise la méthode BO, l’écart entre les salaires moyens des hommes et des femmes est de 0,23, dont 0,09 seulement représentent la part expliquée et 0,14 représentent la part inexpliquée. Nous comparons les résultats obtenus par les méthodes présentées plus haut. La méthode de calage au moyen de la pseudo-distance du khi carré est appelée « linéaire », le calage au moyen de la divergence de Kullback-Leibler est appelé « raking ratio » et la méthode proposée par DiNardo et coll. (1996), ajustée pour tenir compte des poids de sondage est appelée « DFL ». Premièrement, le tableau 6.4 montre les valeurs minimale et maximale des poids, ainsi que les écarts-types, obtenus en utilisant le calage linéaire, le calage par raking ratio et la méthode DFL pondérée.

Tableau 6.4
Poids minimal et maximal et écart-type
Sommaire du tableau
Le tableau montre les résultats de Poids minimal et maximal et écart-type. Les données sont présentées selon Méthode (titres de rangée) et Minimal, Maximal et Écart-type(figurant comme en-tête de colonne).
Méthode Minimal Maximal Écart-type
Linéaire -39,06 319,8 4,97
Raking ratio 0,0011 904,7 6,79
DFL pondérée 0,0022 804,4 6,16

Le cas linéaire donne les mêmes résultats que la méthode BO pondérée. Cependant, comme le montre le tableau 6.4, ce cas particulier produit des poids négatifs. Le nombre de ces poids négatifs était de 69 553 (14,59 %). L’option du raking ratio donne toujours des poids positifs, mais l’écart-type des poids est plus grand. Le facteur DFL pondéré possède un plus petit écart-type que les poids obtenus par la méthode de calage par raking ratio. Il existe 1 319 cas où la probabilité conditionnelle d’être un homme est plus grande que 0,98. Initialement, le facteur DFL est multiplié par le ratio entre la somme des poids de sondage des femmes et la somme des poids de sondage des hommes. Puisque a ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFr0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peuj0dYddrpe0db9Wqpepic9qr=xfr=xfr=xmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWGHbGbaKaaaaa@32B5@ est plus petit que 1, le facteur de repondération diminuera. Si, d’autre part, a ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFr0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peuj0dYddrpe0db9Wqpepic9qr=xfr=xfr=xmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWGHbGbaKaaaaa@32B5@ est plus grand que 1 (par exemple, pour les secteurs tels que le secteur public), le facteur de repondération pourrait être plus grand. Le tableau 6.5 montre l’effet de structure estimé aux niveaux moyens des salaires. Les deux approches de calage donnent des effets de structure et de composition égaux. L’utilisation du facteur de repondération DFL résulte en un effet de structure légèrement plus faible et un effet de composition plus grand que les deux autres méthodes.

Tableau 6.5
Effets de composition et de structure estimés dans la différence entre les moyennes
Sommaire du tableau
Le tableau montre les résultats de Effets de composition et de structure estimés dans la différence entre les moyennes. Les données sont présentées selon Méthode (titres de rangée) et Effet de composition, Effet de structure et Total(figurant comme en-tête de colonne).
Méthode Effet de composition Effet de structure Total
Linéaire 0,09 0,14 0,23
Raking ratio 0,09 0,14 0,23
DFL pondérée 0,10 0,13 0,23

Étant donné que des poids négatifs sont obtenus dans le premier cas de calage, la densité estimée correspondante ne peut pas être représentée graphiquement. Seules les distributions contrefactuelles des salaires des femmes obtenues en utilisant le raking ratio et le facteur de repondération DFL sont construites. Elles sont présentées à la figure 6.3.

Figure 6.3 Densités estimées du logarithme du salaire des femmes et des hommes et distributions contrefactuelles du logarithme du salaire des femmes construites en utilisant le raking ratio et le facteur DFL repondéré, respectivement

Description de la figure 6.3

Figure présentant quatre courbes, soient les densités estimées du logarithme du salaire des femmes et des hommes et les distributions contrefactuelles du logarithme du salaire des femmes construites en utilisant le raking ratio et le facteur DFL repondéré. La densité est sur l'axe des y, allant de 0,0 à 1,2. L'axe des x va de 7 à 11. Les quatre courbes se chevauchent partiellement. Les deux distributions contrefactuelles des salaires sont très proches l’une de l’autre autour des queues, mais diffèrent au milieu. Leurs sommets sont moins élevés et sont situés entre ceux des densités des salaires des femmes et des hommes.

La figure 6.3 montre que les deux distributions contrefactuelles des salaires sont très proches l’une de l’autre autour des queues. Cependant, vers le milieu, les deux méthodes ne donnent pas les mêmes résultats. Comme nous l’avons mentionné plus haut, l’utilisation des méthodes de repondération DFL et de calage permet d’estimer les effets de composition et de structure non seulement aux niveaux moyens, mais aussi tout le long de la distribution. Le tableau 6.6 donne les effets de structure et de composition estimés des écarts salariaux entre les hommes et les femmes calculés en utilisant les trois méthodes pour certains quantiles.

Tableau 6.6
Effets de composition et de structure estimés des écarts salariaux pour certains quantiles
Sommaire du tableau
Le tableau montre les résultats de Effets de composition et de structure estimés des écarts salariaux pour certains quantiles. Les données sont présentées selon Quantile (titres de rangée) et Méthode, Effet de composition, Effet de structure et Total(figurant comme en-tête de colonne).
Quantile Méthode Effet de composition Effet de structure Total
(%)
1 % Linéaire 0,01 0,20 0,21
(3 %) (97 %)
Raking -0,01 0,22 0,21
(-3,5 %) (103,5 %)
DFL pondérée -0,01 0,22 0,21
(-3,4 %) (103,4 %)
10 % Linéaire 0,05 0,12 0,17
(28,8 %) (71,2 %)
Raking 0,04 0,13 0,17
(22,4 %) (77,6 %)
DFL pondérée 0,03 0,14 0,17
(19,4 %) (80,6 %)
20 % Linéaire 0,07 0,13 0,20
(34,2 %) (65,8 %)
Raking 0,06 0,13 0,19
(29,7 %) (70,3 %)
DFL pondérée 0,05 0,14 0,19
(28,2 %) (71,8 %)
50 % Linéaire 0,09 0,10 0,19
(46,3 %) (53,7 %)
Raking 0,09 0,11 0,20
(44,7 %) (55,3 %)
DFL pondérée 0,09 0,11 0,20
(45,7 %) (54,3 %)
80 % Linéaire 0,11 0,15 0,26
(43,9 %) (56,1 %)
Raking 0,12 0,14 0,26
(46,5 %) (53,5 %)
DFL pondérée 0,13 0,13 0,26
(50,8 %) (49,2 %)
90 % Linéaire 0,15 0,18 0,33
(46,0 %) (54,0 %)
Raking 0,17 0,16 0,33
(51,6 %) (48,4 %)
DFL pondérée 0,19 0,14 0,33
(58,0 %) (42,0 %)
99 % Linéaire 0,24 0,36 0,60
(40,0 %) (60,0 %)
Raking 0,27 0,33 0,60
(45,3 %) (54,7 %)
DFL pondérée 0,29 0,30 0,59
(49,4 %) (50,6 %)

La proportion de l’effet de structure dans l’écart salarial entier entre les hommes et les femmes diminue à mesure qu’augmente l’ordre du quantile. Cela signifie qu’une plus grande part de l’écart salarial peut être expliquée par des différences de caractéristiques des groupes pour les emplois à salaires élevés que pour les emplois à faibles salaires. Le raking ratio et le facteur de repondération DFL donnent des résultats similaires jusqu’au quantile d’ordre 90 %. Au premier percentile, l’effet de composition estimé est négatif, ce qui signifie qu’à ce point, les différences de salaires sont dues uniquement à la discrimination.

La figure 6.4 montre les quantiles pondérés des logarithmes du salaire des hommes et du salaire des femmes, et contraste les distributions contrefactuelles obtenues au moyen du calage par raking ratio et du facteur de repondération DFL. Comme le calage linéaire donnait des poids négatifs, le graphique correspondant n’est pas présenté.

Figure 6.4 Quantiles pondérés des logarithmes des salaires des femmes et des hommes, et quantiles pondérés des distributions contrefactuelles du logarithme du salaire des femmes construites en utilisant le calage par raking ratio et le facteur DFL pondéré.

Description de la figure 6.4

Figure présentant quatre courbes, soient les quantiles pondérés des logarithmes des salaires des femmes et des hommes, et ceux des distributions contrefactuelles du logarithme du salaire des femmes construites en utilisant le calage par raking ratio et le facteur DFL pondéré. Le logarithme du salaire est sur l'axe des y, allant de 7,5 à 10,5. Les quantiles sont sur l'axe des x, allant de 0,01 à 0,99. La courbe associée au salaire des hommes est supérieure aux trois autres. Les trois courbes associées aux salaires des femmes ont le même point de départ, mais dès le quantile 0,1, le logarithme du salaire des femmes est inférieur à ceux des deux distributions contrefactuelles. Le raking ratio et le facteur de repondération DFL donnent des résultats similaires jusqu’au quantile d’ordre 90 %, où la dernière devient légèrement supérieure.

6.4  Décomposition plus poussée de l’effet de structure

Un modèle logistique de la probabilité d’être un homme donne des valeurs estimées comprises entre 0,002 et 0,99. C’est pour les variables « années d’occupation du poste courant », « âge » et « carré de l’âge » que les écarts entre les valeurs moyennes des hommes et les valeurs repondérées des femmes, calculées en utilisant le facteur de repondération, sont les plus grands. Dans l’équation (4.8), l’effet de structure est composé de l’effet pur et l’effet résiduel. En utilisant le facteur de repondération DFL, l’effet résiduel vaut -0,00474. Par contre, en utilisant l’une ou l’autre des techniques de calage, cet effet est nul dans les deux cas. En outre, l’approche de calage permet de contourner le calcul des coefficients de régression contrefactuels, parce que la technique assure l’égalité entre les moyennes X ¯ ^ M MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFr0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peuj0dYddrpe0db9Wqpepic9qr=xfr=xfr=xmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWHybGbaeHbaKaadaWgaaWcbaGaam ytaaqabaaaaa@33C5@ et X ¯ ^ F | M . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFr0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peuj0dYddrpe0db9Wqpepic9qr=xfr=xfr=xmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWHybGbaeHbaKaadaWgaaWcbaWaaq GaaeaacaWGgbGaaGjcVdGaayjcSdGaaGjcVlaad2eaaeqaaOGaaiOl aaaa@3A04@ Donc, le calage représente une généralisation de la méthode du facteur de repondération DFL, car il permet une estimation plus précise de l’effet de structure, vu que la valeur résultante n’inclut que l’effet pur.


Date de modification :