4. Résultat pour les données de l’EPA et du PA appariées
Dimitris Pavlopoulos et Jeroen K. Vermunt
En tout, nous avons estimé neuf modèles qui sont présentés au tableau 4.1. Tous ces modèles sont des modèles de Markov cachés d’ordre 1 avec deux variables indicatrices pour le type de contrat comme il est décrit à la section 3. Les probabilités d’erreur sont homogènes dans le temps. Les probabilités de transition (latentes) sont supposées être hétérogènes dans le temps; autrement dit, les logit des transitions peuvent dépendre du temps et du carré du temps. Ces modèles sont aussi des modèles de mélange finis qui comprennent trois classes latentes pour tenir compte de l’effet de l’hétérogénéité non observée dans l’état latent initial et dans les probabilités de transition latentes. Ce nombre de classes latentes a été choisi en comparant des variantes des modèles B” et C comprenant différents nombres de classes latentes (les résultats de ces tests sont disponibles sur demande).
Les modèles A’, A” et A spécifient des erreurs de classification indépendantes (ECI) pour l’enquête, le registre et les deux ensembles de données, respectivement. Le modèle B’ spécifie l’erreur dans l’enquête de façon qu’elle dépende des covariables d’âge et d’interview par personne interposée, le modèle B” spécifie des erreurs autocorrélées dans le registre, tandis que le modèle B combine ces deux spécifications. Les modèles C’ et C” étendent le modèle B” en introduisant les prédicteurs (sexe, âge, niveau de scolarité et pays d’origine) pour les transitions, d’une part, et pour l’état initial ainsi que les transitions, d’autre part. Le modèle C étend le modèle B en introduisant les mêmes prédicteurs.
Le tableau 4.1 donne les valeurs de la log-vraisemblance, du critère d’information bayésien (BIC) et du critère d’information d’Akaike (AIC), ainsi que le nombre de paramètres pour neuf des modèles qui ont été estimés en utilisant les données de l’EPA et du PA appariées. Dans tous les modèles, les probabilités de transition (latentes) sont supposées être hétérogènes dans le temps; autrement dit, les logit des transitions peuvent dépendre du temps et du carré du temps.
Le modèle A spécifie que les données de l’enquête ainsi que les données du registre contiennent des erreurs de classification (indépendantes). Comme la qualité de l’ajustement de ce modèle aux données est meilleure que celle des modèles A’ et A” restreints, qui supposent que seule l’enquête (Modèle A’) ou seul le registre (Modèle A”) contient des erreurs, nous concluons qu’il s’agit d’une preuve que les sources contiennent toutes deux des erreurs de classification.
Dans les modèles B’, B” et B, l’hypothèse ECI est relâchée pour l’enquête, pour le registre, ainsi que pour l’enquête et le registre, respectivement. Plus précisément, l’erreur de mesure dans les données d’enquête peut dépendre de l’âge de l’enquêté et du fait que l’information a été obtenue ou non par personne interposée, et l’erreur de mesure dans les données du registre peut dépendre du type de contrat latent et observé décalé. Cette dernière condition est obtenue en estimant un jeu distinct de probabilités d’erreur pour la répétition de la même erreur sur les diverses éditions de l’enquête ou du registre. Les versions restreintes du modèle B sont estimées également pour examiner si la violation de l’hypothèse ECI s’applique à l’erreur de mesure des données d’enquête seulement (modèle B’) ou des données du registre seulement (modèle B”). Le fait que le modèle B” soit mieux ajusté que les modèles A et B’ indique que l’hypothèse ECI doit être relâchée pour l’indicateur de données du registre. Le modèle B améliore légèrement l’ajustement comparativement au modèle B”, ce qui indique que l’hypothèse ECI pour la variable indicatrice d’enquête doit aussi être relâchée dans un modèle sans prédicteurs pour les transitions et pour l’état initial.
| Modèle | Log-vraisem-blance | BIC (LV) | AIC (LV) | Paramètres | dl | Valeur p | |
|---|---|---|---|---|---|---|---|
| A’: Enquête ECI | -286 814 | 574 118 | 573 716 | 44 | 240 543,4 | 69 327 | 1,6e-18 454 |
| A”: Registre ECI | -454 196 | 908 882 | 908 480 | 44 | 575 307,7 | 69 327 | 8,5e-78 021 |
| A: Les deux ECI | -284 413 | 569 384 | 568 926 | 50 | 235 742,1 | 69 321 | 4,8e-17 717 |
| B’: A + enquête non-ECI | -283 573 | 567 748 | 567 254 | 54 | 426 966,7 | 69 317 | 6,6e-50 302 |
| B”: A + registre non-ECI | -246 054 | 492 732 | 492 220 | 56 | 435 025,8 | 69 315 | 2,9e-51 771 |
| B: A + les deux non-ECI | -246 000 | 492 669 | 492 120 | 60 | 477 741,8 | 69 311 | 7,6e-59 639 |
| C’: B” + prédicteurs des transitions | -245 282 | 491 590 | 490 748 | 92 | 486 186,8 | 69 279 | 1,8e-61 222 |
| C”: B” + prédicteurs état initial et transitions | -241 990 | 485 140 | 484 189 | 104 | 479 603,4 | 69 267 | 4,9e-60 003 |
| C: B + prédicteurs état initial et transitions | -242 006 | 485 217 | 484 229 | 108 | 479 635,2 | 69 263 | 1,2e-60 010 |
| Nota : Les modèles A’, A” et A spécifient des erreurs de classification indépendantes (ECI) pour l’enquête, le registre et les deux ensembles de données, respectivement. Le modèle B’ spécifie une erreur dans l’enquête qui dépend de l’âge et de l’interview par personne interposée, le modèle B” spécifie des erreurs autocorrélées dans le registre, tandis que le modèle B combine ces deux spécifications. Les modèles C’ et C” étendent le modèle B” en introduisant le sexe, l’âge, le niveau de scolarité et le pays d’origine comme prédicteurs des transitions, ainsi que de l’état initial et des transitions, respectivement. Le modèle C étend le modèle B en introduisant les mêmes prédicteurs. Tous les modèles sont des modèles de mélange finis comportant trois classes latentes pour corriger l’hétérogénéité non observée dans l’état latent initial et dans les probabilités de transition latentes. En outre, tous les modèles supposent que les probabilités de transition latentes sont hétérogènes dans le temps. En particulier, nous conditionnons les probabilités de transition latentes sur une tendance linéaire pour le mois de l’observation ainsi que sur son carré. | |||||||
Enfin, nous étendons les modèles B” et B en incluant des covariables (sexe, âge, niveau de scolarité et pays d’origine) dans les modèles pour les probabilités de transition latentes et d’état initial latent (modèle C” et C, respectivement). Le modèle C’ est une version restreinte du modèle C”. Les variables explicatives ne peuvent avoir une incidence que sur les probabilités de transition latentes. Le fait que la qualité de l’ajustement du modèle C” soit meilleure que celles du modèle B” et du modèle C’ indique que les covariables ont un effet significatif à la fois sur les transitions et sur les états initiaux. Le fait, d’après deux des trois mesures, que la qualité de l’ajustement du modèle C est moins bonne que celle du modèle C” signifie que l’hypothèse d’ECI dans les données d’enquête devrait être gardée dans le modèle comprenant des variables explicatives pour les transitions et pour l’état initial (comme le montrent les résultats du modèle C, la taille de l’erreur de mesure dans les données d’enquête ne varie que légèrement avec l’âge et l’interview par personne interposée. Il s’agit d’une preuve supplémentaire en faveur du maintien de l’hypothèse d’ECI pour l’indicateur d’enquête. En fait, les estimations de la taille de l’erreur de mesure dans les données d’enquête ainsi que dans les données de registre et les estimations des probabilités de transition latentes sont très semblables pour les modèles C, C’ et C”. Cela montre que les résultats de notre modèle sont robustes aux petites erreurs de spécification du modèle). Dans la suite de l’exposé, nous présentons les estimations calculées d’après le modèle C” (les estimations calculées d’après les modèles C et C’ sont disponibles sur demande).
Nous avons examiné diverses options de modèle non-ECI. En particulier, nous avons cherché à déterminer si l’erreur de mesure dans les données d’enquête diffère pour des secteurs où la mobilité de contrat et d’emploi est grande, comme le secteur de la santé, mais cela ne s’est pas avéré être le cas. Pour les données de registre, nous avons examiné des spécifications restreintes de rechange pour les erreurs corrélées, mais celles-ci ont donné des modèles dont la qualité de l’ajustement était pire que celle des modèles du tableau 4.1.
Examinons maintenant la quantité d’erreur de classification dans les deux sources de données. Selon l’équation 3.2, pour les données d’enquête et de registre, elle est représentée par les probabilités et respectivement. Les estimations d’après le modèle C” sont présentées aux tableaux 4.2 et 4.3. En particulier, le tableau 4.2 montre que l’état de contrat permanent et l’état « autre » sont mesurés de façon très précise dans l’EPA, car presque toutes les personnes dans ces états sont classées correctement. Ce fait est indiqué par les grandes probabilités sur la diagonale principale du tableau. Une certaine erreur est observée pour les personnes qui possèdent en réalité un contrat d’emploi temporaire. 12,5 % de ces personnes déclarent qu’elles ont un contrat d’emploi temporaire, tandis que 4,2 % déclarent être dans une autre situation.
| Contrat latent en | Contrat observé à la période | ||
|---|---|---|---|
| Permanent | Temporaire | Autre | |
| Permanent | 0,998 | 0,001 | 0,002 |
| Temporaire | 0,125 | 0,832 | 0,042 |
| Autre | 0,004 | 0,005 | 0,991 |
| Nota : Les erreurs-types sont toujours inférieures à 0,0001. | |||
Le tableau 4.3 donne les probabilités estimées d’erreur de mesure pour les données de registre, qui, selon l’équation 3.2, dépendent des états observé et latent décalés. En raison des restrictions imposées (voir la section 3), nous avons estimé des paramètres (logit) d’erreur distincts pour la répétition de la même erreur entre les mois et Ces situations correspondent aux cellules en gras dans le tableau 4.3. Comme le montre le tableau, les erreurs de mesure sont fortement autocorrélées; autrement dit, si une erreur a été commise au mois et qu’il était possible de répéter la même erreur (si la personne était restée dans le même état latent), l’erreur persistait presque certainement au mois Par exemple, si une personne possédant un contrat d’emploi permanent au mois était enregistrée par erreur comme ayant un contrat d’emploi temporaire et qu’elle possédait encore un contrat d’emploi permanent au mois elle avait une probabilité de 0,968 d’être de nouveau enregistrée incorrectement comme ayant un contrat d’emploi temporaire au temps Pour les cinq autres erreurs possible, la probabilité d’une erreur de mesure persistante est un peu plus faible, mais n’est jamais inférieure à 0,84.
Un tableau différent se dégage lorsqu’aucune erreur n’est commise au temps ou quand une personne change d’état latent entre et et que, par conséquent, aucune répétition de l’erreur n’est possible. Dans ces cas, les données de registre sont presque exemptes d’erreur. Par exemple, quand une personne a été enregistrée correctement comme ayant un contrat d’emploi permanent au temps et qu’elle possède un contrat d’emploi temporaire au temps le type de contrat est enregistré correctement comme étant temporaire au temps avec une probabilité de 0,930. En pratique, cela signifie que l’enregistrement initial du type de contrat est crucial pour le registre PA. Si cet enregistrement est correct, on peut avoir pleinement confiance dans le type de contrat enregistré pour la personne jusqu’à ce qu’un changement réel de situation sur le marché du travail ait eu lieu. En revanche, si le type de contrat de la personne est enregistré incorrectement au départ, cette erreur persistera presque certainement jusqu’à ce que le type de contrat de la personne change.
| Contrat observé en / Contrat latent en / Contrat latent en | Contrat observé en | ||
|---|---|---|---|
| Permanent | Temporaire | Autre | |
| Permanent / Permanent / Permanent | 0,986 | 0,009 | 0,004 |
| Permanent / Permanent / Temporaire | 0,986 | 0,009 | 0,004 |
| Permanent / Permanent / Autre | 0,986 | 0,009 | 0,004 |
| Permanent / Temporaire / Permanent | 0,045 | 0,930 | 0,025 |
| Permanent / Temporaire / Temporaire | 0,968 | 0,032 | 0,001 |
| Permanent / Temporaire / Autre | 0,045 | 0,930 | 0,025 |
| Permanent / Autre / Permanent | 0,005 | 0,005 | 0,990 |
| Permanent / Autre / Temporaire | 0,005 | 0,005 | 0,990 |
| Permanent / Autre / Autre | 0,913 | 0,000 | 0,087 |
| Temporaire / Permanent / Permanent | 0,027 | 0,973 | 0,000 |
| Temporaire / Permanent / Temporaire | 0,986 | 0,009 | 0,004 |
| Temporaire / Permanent / Autre | 0,986 | 0,009 | 0,004 |
| Temporaire / Temporaire / Permanent | 0,045 | 0,930 | 0,025 |
| Temporaire / Temporaire / Temporaire | 0,045 | 0,930 | 0,025 |
| Temporaire / Temporaire / Autre | 0,045 | 0,930 | 0,025 |
| Temporaire / Autre / Permanent | 0,005 | 0,005 | 0,990 |
| Temporaire / Autre / Temporaire | 0,005 | 0,005 | 0,990 |
| Temporaire / Autre / Autre | 0,001 | 0,842 | 0,157 |
| Autre / Permanent / Permanent | 0,039 | 0,000 | 0,961 |
| Autre / Permanent / Temporaire | 0,986 | 0,009 | 0,004 |
| Autre / Permanent / Autre | 0,986 | 0,009 | 0,004 |
| Autre / Temporaire / Permanent | 0,045 | 0,930 | 0,025 |
| Autre / Temporaire / Temporaire | 0,005 | 0,099 | 0,896 |
| Autre / Temporaire / Autre | 0,045 | 0,930 | 0,025 |
| Autre / Autre / Permanent | 0,005 | 0,005 | 0,990 |
| Autre / Autre / Temporaire | 0,005 | 0,005 | 0,990 |
| Autre / Autre / Autre | 0,005 | 0,005 | 0,990 |
| Nota : Les erreurs-types sont systématiquement inférieures à 0,0001. | |||
Afin d’estimer la quantité globale d’erreurs dans les données de registre, nous utilisons la probabilité a posteriori de posséder un type particulier de contrat latent à chaque point dans le temps. Cette probabilité est estimée pour toutes les personnes comprises dans notre échantillon au moyen du modèle de Markov caché. Ces estimations sont assez exactes, car l’erreur de classification n’est que de 0,016. Les moyennes de ces probabilités sur l’ensemble des personnes et des points dans le temps sont présentées au tableau 4.4. En comparant les probabilités sur les diagonales principales des tableaux 4.1 et 4.4, nous voyons que l’erreur est plus grande dans l’indicateur de registre que dans l’indicateur d’enquête. En particulier, les personnes qui travaillent réellement aux termes d’un contrat temporaire ont une probabilité de 0,237 d’être enregistrées comme ayant un contrat permanent (0,125 dans les données d’enquête) et une probabilité de 0,079 d’être enregistrées comme se trouvant dans l’état « autre » dans le PA (0,042 dans les données d’enquête). Il existe également une erreur de classification pour les personnes qui possèdent réellement un contrat d’emploi permanent, car elles ont une probabilité de 0,081 d’être enregistrées comme des travailleurs temporaires et une probabilité de 0,031 d’être enregistrées comme étant dans une autre situation.
| Contrat latent en | Contrat observé en | ||
|---|---|---|---|
| Permanent | Temporaire | Autre | |
| Permanent | 0,888 | 0,081 | 0,031 |
| Temporaire | 0,237 | 0,684 | 0,079 |
| Autre | 0,032 | 0,017 | 0,951 |
| Nota : Ces probabilités sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016. | |||
Nous nous intéressons non seulement à l’erreur de mesure proprement dite, mais aussi à la grandeur de son effet sur l’estimation de la taille de l’emploi temporaire. En utilisant de nouveau la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent, nous estimons la taille de l’emploi temporaire aux Pays-Bas. Au tableau 4.5, nous comparons la taille de l’emploi temporaire estimée au moyen du modèle de Markov caché avec les distributions observées du type de contrat selon l’EPA et selon le PA. La probabilité a posteriori moyenne d’avoir un contrat temporaire est de 10,9 % et est comprise entre les valeurs obtenues d’après l’EPA et d’après le PA.
| Observée | Latente | ||
|---|---|---|---|
| Enquête | Registre | ||
| Permanent | 0,667 | 0,597 | 0,634 |
| Temporaire | 0,087 | 0,130 | 0,109 |
| Autre | 0,246 | 0,273 | 0,257 |
| Cas | 48 297 | 174 480 | 174 480 |
| Nota : Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016. | |||
Le tableau 4.6 donne l’évolution de la taille de l’emploi temporaire d’après les deux sources de données et d’après le modèle de Markov caché. Ce tableau confirme la constatation selon laquelle la taille de l’emploi temporaire calculée d’après notre modèle est comprise entre celles obtenues d’après les données du registre et d’après les données de l’enquête. On voit aussi que, durant la période de référence, la proportion d’employés temporaires a augmenté. La faible baisse observée dans les données de registre en janvier 2008 (mois 13) comparativement à décembre 2007 (mois 12) s’explique par le fait que de nombreux contrats temporaires se terminent le 31 décembre et que, de surcroît, certains de ces contrats sont convertis en contrats d’emploi permanent. La fluctuation un peu plus importante de la taille de l’emploi temporaire selon les données d’enquête est due au fait que les participants à l’EPA sont interviewés tous les trois mois et que les diverses estimations mensuelles proviennent donc partiellement de différents participants à l’enquête.
Il est important d’examiner non seulement la variation agrégée, mais aussi la variation au niveau individuel, c’est-à-dire la probabilité d’une transition d’un emploi temporaire à un emploi permanent et inversement. Ces probabilités de transition sont présentées au tableau 4.7. En particulier, ce tableau donne les probabilités de transition latentes (moyennes) obtenues d’après le modèle C”. Les probabilités de transition ont trait à une période de trois mois et une moyenne est calculée sur les 12 périodes de trois mois dans nos données. Si nous comparons les résultats du tableau 4.7 à ceux du tableau 2.4, nous voyons que les probabilités de transition latentes sont beaucoup plus faibles que celles découlant des données de registre et des données d’enquête. D’après les probabilités de transition latentes, 3,2 % des personnes ayant un contrat d’emploi temporaire possédaient un contrat d’emploi permanent trois mois plus tard, mais selon les données d’enquête et de registre, ces pourcentages étaient de 5,7 % et 8,5 %, respectivement. Cela montre que l’erreur de mesure donne lieu à une inflation de la taille des probabilités de transition. Une telle inflation serait clairement attendue quand les erreurs sont indépendantes dans le temps (Hagenaars 1990, 1994). Si les erreurs ne sont pas indépendantes dans le temps, comme dans notre cas, l’attente est moins claire, car les erreurs pourraient soit accroître soit réduire les probabilités de transition, selon la nature et la taille de l’association. La même tendance à la sous-estimation de la stabilité peut être observée pour l’état de contrat permanent : 98,1 % et 96,7 % de personnes sont restées dans cet état selon les données de l’enquête et les données du registre, respectivement, alors que la stabilité réelle était de 98,7 %.
| Mois | Source | Latente | |
|---|---|---|---|
| Enquête | Registre | ||
| 1 | 0,080 | 0,123 | 0,102 |
| 2 | 0,082 | 0,124 | 0,103 |
| 3 | 0,085 | 0,123 | 0,102 |
| 4 | 0,084 | 0,128 | 0,103 |
| 5 | 0,084 | 0,129 | 0,103 |
| 6 | 0,090 | 0,129 | 0,104 |
| 7 | 0,089 | 0,130 | 0,105 |
| 8 | 0,087 | 0,131 | 0,106 |
| 9 | 0,091 | 0,135 | 0,110 |
| 10 | 0,087 | 0,134 | 0,112 |
| 11 | 0,088 | 0,135 | 0,114 |
| 12 | 0,091 | 0,135 | 0,114 |
| 13 | 0,090 | 0,131 | 0,116 |
| 14 | 0,089 | 0,131 | 0,118 |
| 15 | 0,096 | 0,132 | 0,121 |
| Nota : Les données d’enquête comprennent des observations trimensuelles par personne, tandis que les données de registre comprennent des observations mensuelles par personne. Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016. | |||
| Transitions latentes | Permanent | Temporaire | Autre |
|---|---|---|---|
| Contrat en | |||
| Permanent | 0,987 | 0,006 | 0,007 |
| Temporaire | 0,032 | 0,931 | 0,037 |
| Autre | 0,009 | 0,030 | 0,961 |
| Total | 0,634 | 0,110 | 0,256 |
| Nota: Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016. | |||
- Date de modification :