Recherche par

4. Résultat pour les données de l’EPA et du PA appariées

Dimitris Pavlopoulos et Jeroen K. Vermunt

En tout, nous avons estimé neuf modèles qui sont présentés au tableau 4.1. Tous ces modèles sont des modèles de Markov cachés d’ordre 1 avec deux variables indicatrices pour le type de contrat comme il est décrit à la section 3. Les probabilités d’erreur sont homogènes dans le temps. Les probabilités de transition (latentes) sont supposées être hétérogènes dans le temps; autrement dit, les logit des transitions peuvent dépendre du temps et du carré du temps. Ces modèles sont aussi des modèles de mélange finis qui comprennent trois classes latentes pour tenir compte de l’effet de l’hétérogénéité non observée dans l’état latent initial et dans les probabilités de transition latentes. Ce nombre de classes latentes a été choisi en comparant des variantes des modèles B” et C comprenant différents nombres de classes latentes (les résultats de ces tests sont disponibles sur demande).

Les modèles A’, A” et A spécifient des erreurs de classification indépendantes (ECI) pour l’enquête, le registre et les deux ensembles de données, respectivement. Le modèle B’ spécifie l’erreur dans l’enquête de façon qu’elle dépende des covariables $V_{i t}$ d’âge et d’interview par personne interposée, le modèle B” spécifie des erreurs autocorrélées dans le registre, tandis que le modèle B combine ces deux spécifications. Les modèles C’ et C” étendent le modèle B” en introduisant les prédicteurs $Z_{i t}$ (sexe, âge, niveau de scolarité et pays d’origine) pour les transitions, d’une part, et pour l’état initial ainsi que les transitions, d’autre part. Le modèle C étend le modèle B en introduisant les mêmes prédicteurs.

Le tableau 4.1 donne les valeurs de la log-vraisemblance, du critère d’information bayésien (BIC) et du critère d’information d’Akaike (AIC), ainsi que le nombre de paramètres pour neuf des modèles qui ont été estimés en utilisant les données de l’EPA et du PA appariées. Dans tous les modèles, les probabilités de transition (latentes) sont supposées être hétérogènes dans le temps; autrement dit, les logit des transitions peuvent dépendre du temps et du carré du temps.

Le modèle A spécifie que les données de l’enquête ainsi que les données du registre contiennent des erreurs de classification (indépendantes). Comme la qualité de l’ajustement de ce modèle aux données est meilleure que celle des modèles A’ et A” restreints, qui supposent que seule l’enquête (Modèle A’) ou seul le registre (Modèle A”) contient des erreurs, nous concluons qu’il s’agit d’une preuve que les sources contiennent toutes deux des erreurs de classification.

Dans les modèles B’, B” et B, l’hypothèse ECI est relâchée pour l’enquête, pour le registre, ainsi que pour l’enquête et le registre, respectivement. Plus précisément, l’erreur de mesure dans les données d’enquête peut dépendre de l’âge de l’enquêté et du fait que l’information a été obtenue ou non par personne interposée, et l’erreur de mesure dans les données du registre peut dépendre du type de contrat latent et observé décalé. Cette dernière condition est obtenue en estimant un jeu distinct de probabilités d’erreur pour la répétition de la même erreur sur les diverses éditions de l’enquête ou du registre. Les versions restreintes du modèle B sont estimées également pour examiner si la violation de l’hypothèse ECI s’applique à l’erreur de mesure des données d’enquête seulement (modèle B’) ou des données du registre seulement (modèle B”). Le fait que le modèle B” soit mieux ajusté que les modèles A et B’ indique que l’hypothèse ECI doit être relâchée pour l’indicateur de données du registre. Le modèle B améliore légèrement l’ajustement comparativement au modèle B”, ce qui indique que l’hypothèse ECI pour la variable indicatrice d’enquête doit aussi être relâchée dans un modèle sans prédicteurs pour les transitions et pour l’état initial.

Tableau 4.1
Mesures de l’ajustement pour huit modèles estimés au moyen de données de l’EPA et du PA appariées
Sommaire du tableau
Le tableau montre les résul tats de Mesures de l’ajustement pour huit modèles estimés au moyen de données de l’EPA et du PA appariées. Les données sont présentées selon Modèle (titres de rangée) et Log-vraisem-blance, BIC (LV), AIC (LV), Paramètres, $L^{2}$ , dl et Valeur p(figurant comme en-tête de colonne).
Modèle	Log-vraisem-blance	BIC (LV)	AIC (LV)	Paramètres	$L^{2}$	dl	Valeur p
A’: Enquête ECI	-286 814	574 118	573 716	44	240 543,4	69 327	1,6e-18 454
A”: Registre ECI	-454 196	908 882	908 480	44	575 307,7	69 327	8,5e-78 021
A: Les deux ECI	-284 413	569 384	568 926	50	235 742,1	69 321	4,8e-17 717
B’: A + enquête non-ECI	-283 573	567 748	567 254	54	426 966,7	69 317	6,6e-50 302
B”: A + registre non-ECI	-246 054	492 732	492 220	56	435 025,8	69 315	2,9e-51 771
B: A + les deux non-ECI	-246 000	492 669	492 120	60	477 741,8	69 311	7,6e-59 639
C’: B” + prédicteurs des transitions	-245 282	491 590	490 748	92	486 186,8	69 279	1,8e-61 222
C”: B” + prédicteurs état initial et transitions	-241 990	485 140	484 189	104	479 603,4	69 267	4,9e-60 003
C: B + prédicteurs état initial et transitions	-242 006	485 217	484 229	108	479 635,2	69 263	1,2e-60 010
Nota : Les modèles A’, A” et A spécifient des erreurs de classification indépendantes (ECI) pour l’enquête, le registre et les deux ensembles de données, respectivement. Le modèle B’ spécifie une erreur dans l’enquête qui dépend de l’âge et de l’interview par personne interposée, le modèle B” spécifie des erreurs autocorrélées dans le registre, tandis que le modèle B combine ces deux spécifications. Les modèles C’ et C” étendent le modèle B” en introduisant le sexe, l’âge, le niveau de scolarité et le pays d’origine comme prédicteurs des transitions, ainsi que de l’état initial et des transitions, respectivement. Le modèle C étend le modèle B en introduisant les mêmes prédicteurs. Tous les modèles sont des modèles de mélange finis comportant trois classes latentes pour corriger l’hétérogénéité non observée dans l’état latent initial et dans les probabilités de transition latentes. En outre, tous les modèles supposent que les probabilités de transition latentes sont hétérogènes dans le temps. En particulier, nous conditionnons les probabilités de transition latentes sur une tendance linéaire pour le mois de l’observation ainsi que sur son carré.

Enfin, nous étendons les modèles B” et B en incluant des covariables (sexe, âge, niveau de scolarité et pays d’origine) dans les modèles pour les probabilités de transition latentes et d’état initial latent (modèle C” et C, respectivement). Le modèle C’ est une version restreinte du modèle C”. Les variables explicatives ne peuvent avoir une incidence que sur les probabilités de transition latentes. Le fait que la qualité de l’ajustement du modèle C” soit meilleure que celles du modèle B” et du modèle C’ indique que les covariables ont un effet significatif à la fois sur les transitions et sur les états initiaux. Le fait, d’après deux des trois mesures, que la qualité de l’ajustement du modèle C est moins bonne que celle du modèle C” signifie que l’hypothèse d’ECI dans les données d’enquête devrait être gardée dans le modèle comprenant des variables explicatives pour les transitions et pour l’état initial (comme le montrent les résultats du modèle C, la taille de l’erreur de mesure dans les données d’enquête ne varie que légèrement avec l’âge et l’interview par personne interposée. Il s’agit d’une preuve supplémentaire en faveur du maintien de l’hypothèse d’ECI pour l’indicateur d’enquête. En fait, les estimations de la taille de l’erreur de mesure dans les données d’enquête ainsi que dans les données de registre et les estimations des probabilités de transition latentes sont très semblables pour les modèles C, C’ et C”. Cela montre que les résultats de notre modèle sont robustes aux petites erreurs de spécification du modèle). Dans la suite de l’exposé, nous présentons les estimations calculées d’après le modèle C” (les estimations calculées d’après les modèles C et C’ sont disponibles sur demande).

Nous avons examiné diverses options de modèle non-ECI. En particulier, nous avons cherché à déterminer si l’erreur de mesure dans les données d’enquête diffère pour des secteurs où la mobilité de contrat et d’emploi est grande, comme le secteur de la santé, mais cela ne s’est pas avéré être le cas. Pour les données de registre, nous avons examiné des spécifications restreintes de rechange pour les erreurs corrélées, mais celles-ci ont donné des modèles dont la qualité de l’ajustement était pire que celle des modèles du tableau 4.1.

Examinons maintenant la quantité d’erreur de classification dans les deux sources de données. Selon l’équation 3.2, pour les données d’enquête et de registre, elle est représentée par les probabilités $P (E_{i t} = e_{i t} | X_{i t} = x_{t})$ et $P (C_{i t} = c_{i t} | X_{i t} = x_{t}, X_{i (t - 1)} = x_{t - 1}, C_{i (t - 1)} = c_{t - 1}),$ respectivement. Les estimations d’après le modèle C” sont présentées aux tableaux 4.2 et 4.3. En particulier, le tableau 4.2 montre que l’état de contrat permanent et l’état « autre » sont mesurés de façon très précise dans l’EPA, car presque toutes les personnes dans ces états sont classées correctement. Ce fait est indiqué par les grandes probabilités sur la diagonale principale du tableau. Une certaine erreur est observée pour les personnes qui possèdent en réalité un contrat d’emploi temporaire. 12,5 % de ces personnes déclarent qu’elles ont un contrat d’emploi temporaire, tandis que 4,2 % déclarent être dans une autre situation.

Tableau 4.2
Taille de l’erreur de mesure dans les données d’enquête selon le modèle C”
Sommaire du tableau
Le tableau montre les résultats de Taille de l’erreur de mesure dans les données d’enquête selon le modèle C”. Les données sont présentées selon Contrat latent en $t$ (titres de rangée) et Contrat observé à la période $t$ (figurant comme en-tête de colonne).
Contrat latent en $t$	Contrat observé à la période $t$
Contrat latent en $t$	Permanent	Temporaire	Autre
Permanent	0,998	0,001	0,002
Temporaire	0,125	0,832	0,042
Autre	0,004	0,005	0,991
Nota : Les erreurs-types sont toujours inférieures à 0,0001.

Le tableau 4.3 donne les probabilités estimées d’erreur de mesure pour les données de registre, qui, selon l’équation 3.2, dépendent des états observé et latent décalés. En raison des restrictions imposées (voir la section 3), nous avons estimé des paramètres (logit) d’erreur distincts pour la répétition de la même erreur entre les mois $t - 1$ et $t .$ Ces situations correspondent aux cellules en gras dans le tableau 4.3. Comme le montre le tableau, les erreurs de mesure sont fortement autocorrélées; autrement dit, si une erreur a été commise au mois $t - 1$ et qu’il était possible de répéter la même erreur (si la personne était restée dans le même état latent), l’erreur persistait presque certainement au mois $t .$ Par exemple, si une personne possédant un contrat d’emploi permanent au mois $t - 1$ était enregistrée par erreur comme ayant un contrat d’emploi temporaire et qu’elle possédait encore un contrat d’emploi permanent au mois $t,$ elle avait une probabilité de 0,968 d’être de nouveau enregistrée incorrectement comme ayant un contrat d’emploi temporaire au temps $t .$ Pour les cinq autres erreurs possible, la probabilité d’une erreur de mesure persistante est un peu plus faible, mais n’est jamais inférieure à 0,84.

Un tableau différent se dégage lorsqu’aucune erreur n’est commise au temps $t - 1$ ou quand une personne change d’état latent entre $t - 1$ et $t,$ et que, par conséquent, aucune répétition de l’erreur n’est possible. Dans ces cas, les données de registre sont presque exemptes d’erreur. Par exemple, quand une personne a été enregistrée correctement comme ayant un contrat d’emploi permanent au temps $t - 1$ et qu’elle possède un contrat d’emploi temporaire au temps $t,$ le type de contrat est enregistré correctement comme étant temporaire au temps $t$ avec une probabilité de 0,930. En pratique, cela signifie que l’enregistrement initial du type de contrat est crucial pour le registre PA. Si cet enregistrement est correct, on peut avoir pleinement confiance dans le type de contrat enregistré pour la personne jusqu’à ce qu’un changement réel de situation sur le marché du travail ait eu lieu. En revanche, si le type de contrat de la personne est enregistré incorrectement au départ, cette erreur persistera presque certainement jusqu’à ce que le type de contrat de la personne change.

Tableau 4.3
Probabilités conditionnelles d’erreur de mesure dans les données du registre selon le modèle C”
Sommaire du tableau
Le tableau montre les résultats de Probabilités conditionnelles d’erreur de mesure dans les données du registre selon le modèle C”. Les données sont présentées selon Contrat observé en $t - 1$ / Contrat latent en $t$ / Contrat latent en (t-1) (titres de rangée) et et Contrat observé en $t$ , calculées selon / et / unités de mesure (figurant comme en-tête de colonne).
Contrat observé en $t - 1$ / Contrat latent en $t$ / Contrat latent en $t - 1$	Contrat observé en $t$
	Permanent	Temporaire	Autre
Permanent / Permanent / Permanent	0,986	0,009	0,004
Permanent / Permanent / Temporaire	0,986	0,009	0,004
Permanent / Permanent / Autre	0,986	0,009	0,004
Permanent / Temporaire / Permanent	0,045	0,930	0,025
Permanent / Temporaire / Temporaire	0,968	0,032	0,001
Permanent / Temporaire / Autre	0,045	0,930	0,025
Permanent / Autre / Permanent	0,005	0,005	0,990
Permanent / Autre / Temporaire	0,005	0,005	0,990
Permanent / Autre / Autre	0,913	0,000	0,087
Temporaire / Permanent / Permanent	0,027	0,973	0,000
Temporaire / Permanent / Temporaire	0,986	0,009	0,004
Temporaire / Permanent / Autre	0,986	0,009	0,004
Temporaire / Temporaire / Permanent	0,045	0,930	0,025
Temporaire / Temporaire / Temporaire	0,045	0,930	0,025
Temporaire / Temporaire / Autre	0,045	0,930	0,025
Temporaire / Autre / Permanent	0,005	0,005	0,990
Temporaire / Autre / Temporaire	0,005	0,005	0,990
Temporaire / Autre / Autre	0,001	0,842	0,157
Autre / Permanent / Permanent	0,039	0,000	0,961
Autre / Permanent / Temporaire	0,986	0,009	0,004
Autre / Permanent / Autre	0,986	0,009	0,004
Autre / Temporaire / Permanent	0,045	0,930	0,025
Autre / Temporaire / Temporaire	0,005	0,099	0,896
Autre / Temporaire / Autre	0,045	0,930	0,025
Autre / Autre / Permanent	0,005	0,005	0,990
Autre / Autre / Temporaire	0,005	0,005	0,990
Autre / Autre / Autre	0,005	0,005	0,990
Nota : Les erreurs-types sont systématiquement inférieures à 0,0001.

Afin d’estimer la quantité globale d’erreurs dans les données de registre, nous utilisons la probabilité a posteriori de posséder un type particulier de contrat latent à chaque point dans le temps. Cette probabilité est estimée pour toutes les personnes comprises dans notre échantillon au moyen du modèle de Markov caché. Ces estimations sont assez exactes, car l’erreur de classification n’est que de 0,016. Les moyennes de ces probabilités sur l’ensemble des personnes et des points dans le temps sont présentées au tableau 4.4. En comparant les probabilités sur les diagonales principales des tableaux 4.1 et 4.4, nous voyons que l’erreur est plus grande dans l’indicateur de registre que dans l’indicateur d’enquête. En particulier, les personnes qui travaillent réellement aux termes d’un contrat temporaire ont une probabilité de 0,237 d’être enregistrées comme ayant un contrat permanent (0,125 dans les données d’enquête) et une probabilité de 0,079 d’être enregistrées comme se trouvant dans l’état « autre » dans le PA (0,042 dans les données d’enquête). Il existe également une erreur de classification pour les personnes qui possèdent réellement un contrat d’emploi permanent, car elles ont une probabilité de 0,081 d’être enregistrées comme des travailleurs temporaires et une probabilité de 0,031 d’être enregistrées comme étant dans une autre situation.

Tableau 4.4
Taille de l’erreur de mesure dans les données de registre selon le modèle C”
Sommaire du tableau
Le tableau montre les résultats de Taille de l’erreur de mesure dans les données de registre selon le modèle C”. Les données sont présentées selon Contrat latent en $t$ (titres de rangée) et Contrat observé en $t$ (figurant comme en-tête de colonne).
Contrat latent en $t$	Contrat observé en $t$
Contrat latent en $t$	Permanent	Temporaire	Autre
Permanent	0,888	0,081	0,031
Temporaire	0,237	0,684	0,079
Autre	0,032	0,017	0,951
Nota : Ces probabilités sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016.

Nous nous intéressons non seulement à l’erreur de mesure proprement dite, mais aussi à la grandeur de son effet sur l’estimation de la taille de l’emploi temporaire. En utilisant de nouveau la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent, nous estimons la taille de l’emploi temporaire aux Pays-Bas. Au tableau 4.5, nous comparons la taille de l’emploi temporaire estimée au moyen du modèle de Markov caché avec les distributions observées du type de contrat selon l’EPA et selon le PA. La probabilité a posteriori moyenne d’avoir un contrat temporaire est de 10,9 % et est comprise entre les valeurs obtenues d’après l’EPA et d’après le PA.

Tableau 4.5
Taille moyenne de l’emploi temporaire selon le modèle C”
Sommaire du tableau
Le tableau montre les résultats de Taille moyenne de l’emploi temporaire selon le modèle C”. Les données sont présentées selon (titres de rangée) et Observée et Latente(figurant comme en-tête de colonne).
	Enquête	Registre	Latente
	Observée		Latente
Permanent	0,667	0,597	0,634
Temporaire	0,087	0,130	0,109
Autre	0,246	0,273	0,257
Cas	48 297	174 480	174 480
Nota : Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016.

Le tableau 4.6 donne l’évolution de la taille de l’emploi temporaire d’après les deux sources de données et d’après le modèle de Markov caché. Ce tableau confirme la constatation selon laquelle la taille de l’emploi temporaire calculée d’après notre modèle est comprise entre celles obtenues d’après les données du registre et d’après les données de l’enquête. On voit aussi que, durant la période de référence, la proportion d’employés temporaires a augmenté. La faible baisse observée dans les données de registre en janvier 2008 (mois 13) comparativement à décembre 2007 (mois 12) s’explique par le fait que de nombreux contrats temporaires se terminent le 31 décembre et que, de surcroît, certains de ces contrats sont convertis en contrats d’emploi permanent. La fluctuation un peu plus importante de la taille de l’emploi temporaire selon les données d’enquête est due au fait que les participants à l’EPA sont interviewés tous les trois mois et que les diverses estimations mensuelles proviennent donc partiellement de différents participants à l’enquête.

Il est important d’examiner non seulement la variation agrégée, mais aussi la variation au niveau individuel, c’est-à-dire la probabilité d’une transition d’un emploi temporaire à un emploi permanent et inversement. Ces probabilités de transition sont présentées au tableau 4.7. En particulier, ce tableau donne les probabilités de transition latentes (moyennes) obtenues d’après le modèle C”. Les probabilités de transition ont trait à une période de trois mois et une moyenne est calculée sur les 12 périodes de trois mois dans nos données. Si nous comparons les résultats du tableau 4.7 à ceux du tableau 2.4, nous voyons que les probabilités de transition latentes sont beaucoup plus faibles que celles découlant des données de registre et des données d’enquête. D’après les probabilités de transition latentes, 3,2 % des personnes ayant un contrat d’emploi temporaire possédaient un contrat d’emploi permanent trois mois plus tard, mais selon les données d’enquête et de registre, ces pourcentages étaient de 5,7 % et 8,5 %, respectivement. Cela montre que l’erreur de mesure donne lieu à une inflation de la taille des probabilités de transition. Une telle inflation serait clairement attendue quand les erreurs sont indépendantes dans le temps (Hagenaars 1990, 1994). Si les erreurs ne sont pas indépendantes dans le temps, comme dans notre cas, l’attente est moins claire, car les erreurs pourraient soit accroître soit réduire les probabilités de transition, selon la nature et la taille de l’association. La même tendance à la sous-estimation de la stabilité peut être observée pour l’état de contrat permanent : 98,1 % et 96,7 % de personnes sont restées dans cet état selon les données de l’enquête et les données du registre, respectivement, alors que la stabilité réelle était de 98,7 %.

Tableau 4.6
Évolution de la proportion d’employés temporaires durant la période de janvier 2007 à mars 2008
Sommaire du tableau
Le tableau montre les résultats de Évolution de la proportion d’employés temporaires durant la période de janvier 2007 à mars 2008. Les données sont présentées selon Mois (titres de rangée) et Source et Latente(figurant comme en-tête de colonne).
Mois	Source		Latente
Mois	Enquête	Registre	Latente
1	0,080	0,123	0,102
2	0,082	0,124	0,103
3	0,085	0,123	0,102
4	0,084	0,128	0,103
5	0,084	0,129	0,103
6	0,090	0,129	0,104
7	0,089	0,130	0,105
8	0,087	0,131	0,106
9	0,091	0,135	0,110
10	0,087	0,134	0,112
11	0,088	0,135	0,114
12	0,091	0,135	0,114
13	0,090	0,131	0,116
14	0,089	0,131	0,118
15	0,096	0,132	0,121
Nota : Les données d’enquête comprennent des observations trimensuelles par personne, tandis que les données de registre comprennent des observations mensuelles par personne. Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016.

Tableau 4.7
Transitions observées sur 3 mois dans l’EPA et le PA et transitions latentes selon le modèle C
Sommaire du tableau
Le tableau montre les résultats de Transitions observées sur 3 mois dans l’EPA et le PA et transitions latentes selon le modèle C. Les données sont présentées selon Transitions latentes (titres de rangée) et Permanent , Temporaire et Autre (figurant comme en-tête de colonne).
Transitions latentes	Permanent	Temporaire	Autre
Contrat en $t - 3$
Permanent	0,987	0,006	0,007
Temporaire	0,032	0,931	0,037
Autre	0,009	0,030	0,961
Total	0,634	0,110	0,256
Nota: Les probabilités latentes sont égales à la moyenne des probabilités a posteriori d’avoir un type particulier de contrat latent telles qu’elles sont estimées au moyen du modèle C” avec une erreur de classification de 0,016.

Précédent | Suivant

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

4. Résultat pour les données de l’EPA et du PA appariées