Incidence de la littératie sur les gains

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Un simple cadre théorique
Résultats d'estimation

Un simple cadre théorique

Nous examinerons maintenant l'importance utilitaire de la littératie sur les gains. Nous avons vu à la section précédente que la littératie est principalement déterminée par la scolarisation. On peut d'emblée penser que la rétribution couramment estimée de la scolarisation correspond en réalité à la rétribution de la littératie. Tant pour représenter cet aspect que pour dresser un cadre d'interprétation des régressions de rémunération qui suivent, nous commençons par présenter un simple modèle hédoniste de la formation des gains. L'examen qui suit est fondé sur Green et Riddell (2003).

Posons que chaque travailleur peut posséder une diversité de compétences, chacune à un degré variable (y compris dans une mesure nulle). Pour simplifier notre exposé, nous pourrions parler de trois compétences. Les gains individuels sont fonction des compétences que possède et exploite l'individu :

Formule 1

où Ei est les gains de l'individu i dans l'année de l'échantillon, Gik la quantité de compétence k que i vend sur le marché et εi un terme de perturbation indépendant de ces compétences. Ce terme se trouverait à appréhender, pensons-nous, soit des caractéristiques individuelles indépendantes des niveaux de compétence, soit une erreur de mesure des gains. Nous interprétons la fonction f(.) comme une fonction de formation de rémunération qui vient en définitive d'une fonction générale de production décomposable en apports autres que celui des compétences. En caractérisant la fonction f(.), nous pouvons voir l'importance des diverses compétences en question et de leur interaction en production. Pour bien focaliser les idées, nous pouvons considérer que G1 correspond aux compétences cognitives que mesurent les examens en littératie, G2 aux autres compétences cognitives (peut-être manuelles) qui, non appréhendées dans de tels examens, peuvent s'acquérir par l'expérience professionnelle et G3 des caractéristiques non cognitives comme la persévérance qui peut en partie s'acquérir par la scolarisation.

En nous fondant sur 1), nous pouvons élaborer un jeu de fonctions des prix des compétences donné par

Formule 2

À noter que les prix peuvent varier selon la gamme complète de caractéristiques que vend l'individu. Notre but est de caractériser ce jeu de fonctions des prix des compétences. Cela fait, nous connaîtrons l'importance relative des diverses compétences en production et saurons aussi si elles sont alors en complémentarité ou en substituabilité.

Il serait relativement simple de caractériser 1) ou 2) si nous pouvions observer les compétences Gik. Bien sûr, cela est normalement impossible. Ce que nous observons, c'est certains des apports à la formation des compétences. Pour voir comment ces apports s'inscrivent dans notre cadre, considérons un jeu de fonctions de production pour la formation des compétences :

Formule 3

où h désigne la nature des caractéristiques et où yrs correspond aux années de scolarité officielle, exp aux années d'activité sur le marché du travail et θ à un vecteur de capacités innées. À noter que nous distinguons les capacités (qui sont innées) des compétences (qui peuvent s'acquérir et trouvent directement leur utilité en production). Le vecteur des capacités θ peut comprendre des éléments cognitifs ou non. Des capacités non cognitives comme la persévérance pourraient servir à la formation des compétences, cognitives ou non.

Si nous n'observons pas directement les Gik, nous pouvons obtenir une équation d'estimation en substituant dans 1) les équations données par 3), ce qui mène à une spécification de forme quasi réduite pour les gains annuels sous la forme

Formule 4

Ainsi, nous considérons un modèle hiérarchisé où des covariables qui entrent normalement dans les régressions salariales sont des apports à la formation des compétences et où ces compétences (avec un terme d'erreur indépendant) déterminent complètement le salaire.

Examinons maintenant les dérivées partielles des gains pour chacun des apports de compétences à la production (scolarisation, expérience professionnelle, éléments du vecteur des capacités, etc.). La dérivée partielle liée à un apport x peut ainsi s'exprimer :

Formule 5

où nous supprimons le i en exposant pour simplifier. Si x correspond aux années de scolarité yrs par exemple, l'équation 5) nous dit que l'effet observé d'une année supplémentaire de scolarité correspond à l'effet d'une année de scolarité de plus sur la formation de chaque caractéristique en multiplication par le prix que commande cette caractéristique. Il ressort de l'équation 5 que, avec une seule mesure des gains et des apports observables à la formation des compétences, nous ne pouvons rien dire de cette formation ni de la combinaison des compétences en production sauf en indiquant qu'une combinaison critique des dérivées du côté droit de 5) est nulle (et donc δE/δx = 0) ou que certaines ne le sont pas. Si nous disposons d'observations individuelles sur une compétence, disons une compétence G1, il est cependant possible de dire beaucoup plus.

Si G1 est observé, la fonction des gains en forme quasi réduite devient :

Formule 6

La dérivée de cette fonction par rapport à G1 correspond à la fonction des prix des compétences r1, mais nous devons maintenant exprimer le prix visé en fonction de yrsi, expi et θi :

Formule 7

Avec la fonction des prix donnée en 7), il est impossible d'entièrement spécifier les interactions de G1, G2 et G3 en production, mais nous pouvons en apprendre davantage à leur sujet. En particulier, la dérivée de r1 en fonction de l'apport x à la formation des compétences est égale à ce qui suit (là encore, nous supprimons le i en exposant) :

Formule 8

Nous pouvons aussi considérer la dérivée de g* dans l'équation 6) par rapport à x :

Formule 9

Avec les valeurs observées des dérivées δr1/δx et δg*/δx, nous pouvons imposer des restrictions à la fonction f. Ainsi, que δh2/δx et δh3/δx figurent dans toutes ces fonctions donne la possibilité d'imposer des restrictions aux fonctions de production pour les compétences non observées en se fondant sur le signe et la signification des valeurs observées. Avec ces restrictions, nous pouvons peut-être aussi mettre des restrictions aux termes δr1/δGk. Dans notre cadre, ces derniers termes reflètent les interactions en production des compétences non observées avec G1.

Par les différences entre les dérivées en 5) et 9), nous pouvons aussi en apprendre sur la formation de G1. Les dérivées en question (dérivée des gains, par exemple, par rapport à la scolarisation d'abord sans conditionnement et ensuite en conditionnement par G1) diffèrent par le terme δf/δG1 * δh1/δx. Ainsi, la différence entre ces dérivées observées indique dans quelle mesure le coefficient pour la scolarisation, par exemple, dans une régression type des gains correspond à l'enchaînement des hausses de la scolarisation, de la rémunération et de la formation de compétences cognitives. Comme nous observons G1 directement, nous pouvons aller plus loin et mieux voir quelle est la formation de G1 (selon les termes δh1/δx) par une estimation directe. C'est essentiellement ce que nous avons fait à la section précédente où notre grande conclusion était que la littératie se forme principalement par la scolarisation et se détériore au fil des ans après les études. Ce dernier effet pourrait être compensé dans une certaine mesure (quoique sans doute d'une manière relativement secondaire) par l'exercice d'un emploi où on exploite ses compétences en littératie.

Il convient de noter que, comme l'exprime l'équation 7), le prix d'une compétence pour l'individu sera fonction du vecteur des capacités qi. Pour notre cadre, cela implique que les effets des éléments du vecteur qi sur r1 peuvent s'exprimer comme dans l'équation 8), x étant remplacé par l'élément correspondant de θi. En d'autres termes, si nous pouvions observer qi, nous en apprendrions davantage sur les interactions des diverses compétences en production. Dans une application purement empirique, le fait que r1 = δE/δG1 puisse varier avec des inobservables nous suggère d'employer des régressions par quantiles avec la possibilité d'observer les dérivées des gains par rapport aux variables observables aux différentes valeurs des inobservables qui produisent les divers quantiles conditionnels. De plus, si qi était un scalaire au lieu d'un vecteur, que les fonctions h() étaient monotones en θi et que la fonction f accroissait en mode monotone les compétences alors les quantiles de la distribution des gains, yrs et exp seraient liés à des valeurs croissantes de qi en conditionnement par G1 et nous pourrions établir le signe de δr1/δq en nous fondant sur la façon dont δE/δG1 varie au gré de la progression des quantiles conditionnels de gains.

Résultats d'estimation

Nous présentons les résultats d'estimation des régressions en moyenne à l'aide du logarithme de la rémunération hebdomadaire au tableau 7. Nous opérons les régressions sur un échantillon restreint qui comprend seulement les gens dont les gains hebdomadaires sont de plus de 50 $ ou de moins de 20 000 $, le but étant d'éliminer quelques valeurs extrêmes. Nous pouvons aussi écarter les travailleurs indépendants, leur rémunération ne pouvant s'adapter à un tel modèle sans qu'il soit aussi tenu compte de la rétribution du capital. La colonne MCO 1 livre les résultats d'une régression type avec une variable fictive du sexe féminin, les années de scolarité, l'expérience et l'expérience au carré comme covariables. Les résultats sont extrêmement normaux dans leur ordre de grandeur et leur signe (voir dans Card (1999) une recension des études très abondantes dans ce domaine). À la colonne MCO 2, nous ajoutons notre variable de la littératie moyenne. C'est la simple moyenne des résultats des quatre domaines de littératie. Si nous agissons ainsi, c'est que notre analyse factorielle des résultats nous le suggère. Elle nous dit en effet que, pour l'essentiel, les résultats sont hautement en collinéarité. Nous avons estimé les spécifications où les quatre grands résultats sont inclus séparément. Dans ces estimations, la maîtrise des textes schématiques est statistiquement significative avec un coefficient de 0,0021; la numératie l'est aussi avec un coefficient de 0,0011. Pour la résolution de problèmes et la maîtrise des textes suivis, les coefficients sont moindres, non statistiquement significatifs et en compensation. À noter que ces effets significatifs séparés s'additionnent essentiellement pour donner le coefficient estimé du tableau 7 pour la littératie moyenne. On peut donc penser que la numératie produit des effets distincts de ceux des trois autres domaines et que ceux-ci sont inférieurs à tout ce qu'appréhendent (principalement) les résultats relatifs aux textes schématiques.

Tableau 7 Régressions des gains. Une nouvelle fenêtre s'ouvrira

Tableau 7
Régressions des gains

En ajoutant la variable de la littératie moyenne à notre régression type des gains, nous réduisons la dérivée du logarithme des gains par rapport à la scolarisation de 0,087 à 0,069. C'est une baisse d'environ 20 %, ce qui indique à la fois que les compétences en littératie tiennent une grande place dans la rétribution de la scolarisation et que cette dernière a une incidence appréciable sur la rémunération par-delà les effets liés à la formation de ces compétences. L'effet est cependant perceptiblement moindre que ce qui est observé dans l'enquête EIAA 1994 (Green et Riddell, 2003). Il se pourrait que la mesure des gains soit plus lacunaire dans ce premier ensemble de données.

Contrairement au coefficient de la scolarisation, le coefficient des variables de l'expérience professionnelle demeure inchangé lorsque nous introduisons la variable de la littératie. L'explication directe en est que l'acquisition de compétences en littératie n'est liée ni à l'âge ni à l'expérience dans les données transversales. Dans le cadre que nous avons décrit, l'expérience n'entre pas dans la fonction de formation de ces compétences et le premier terme du côté droit de l'équation 5 est nul par conséquent. L'implication est que la dérivée de l'expérience est la même, qu'on fasse intervenir ou non la variable de la littératie. Il reste que nous avons vu que l'âge entre bel et bien – de manière négative – dans la fonction de formation des compétences en littératie, mais que son effet est compensé par des effets de cohorte en décroissance dans la succession des générations récentes. Si l'EIAA 1994 comportait une mesure comparable des gains et que nous pouvions estimer une régression par cohortes regroupées comme nous l'avons fait pour la littératie à la section précédente, nous constaterions que la littératie a sûrement une incidence sur ces coefficients estimés. Disons que la constatation type d'un accroissement des gains avec l'âge pour une cohorte déterminée dans une estimation où la variable de la littératie est absente pourrait, avec la présence de cette variable, comporter une pente encore plus raide1. L'implication est que tout accroissement de la rémunération avec l'âge pourrait être dû à la progression encore plus appréciable de la rétribution des compétences hors littératie qui sont acquises par le travail, les compétences en littératie étant, elles, en décroissance.

Signalons enfin que l'incidence directe sur les gains des compétences en littératie est importante. Une majoration de 25 points du résultat moyen (ce qui équivaut à la moitié environ d'un écart-type dans la distribution) est d'une incidence qui équivaut à une année de scolarité de plus.

Comme nous l'avons mentionné dans notre traitement théorique, l'estimation peut subir l'influence des valeurs types de biais de variables omises. Il se peut en particulier que le terme d'erreur de la régression contient divers types de capacités en corrélation avec les variables incluses. Nous supposons normalement que les capacités influent sur les choix de scolarisation et les gains, d'où des biais d'estimation. Dans le modèle que nous spécifions, si nous posons que des capacités cognitives inobservées influent seulement sur la formation des compétences cognitives et que les autres capacités non cognitives n'ont pas une telle incidence, la littératie sera sans corrélation avec le terme d'erreur, et il n'y aura pas de problème d'endogénéité à proprement parler. Il reste à résoudre le problème de l'endogénéité possible de la scolarisation. Nous le faisons en nous reportant à la province de résidence au moment de la scolarisation et en tenant compte de ses éléments d'interaction avec l'âge comme variable instrumentale comme nous l'avons fait dans l'estimation de la littératie. Comme dans ce cas, nous tenons aussi compte de la province actuelle de résidence. En fait, toutes les spécifications comprennent des variables de contrôle de la province de résidence actuelle dont nous ne présentons pas les effets au tableau par souci de concision.

Les résultats avec variable instrumentale pour la scolarisation lorsque la variable de la littératie est exclut figurent à la colonne IV 1 du tableau 7. L'introduction de la variable instrumentale diminue un peu le coefficient de la scolarisation, ce qui ferait voir des problèmes d'endogénéité avec l'estimation simple MCO. Nous reprenons l'exercice à la colonne IV 2, mais en incluant aussi l'effet de la littératie moyenne. Nous obtenons un coefficient quelque peu moindre pour la scolarisation que dans l'estimation simple MCO à la colonne MCO 2. Comme dans cette estimation, l'introduction de la variable de la littératie moyenne réduit le coefficient de la scolarisation d'environ 20 %. Le coefficient même de la variable de la littératie s'élève quelque peu, mais il demeure en gros du même ordre de grandeur qu'à la colonne 2. Ainsi, nos principales conclusions ne sont pas du tout touchées par le recours à une variable instrumentale.

Comme nous l'avons indiqué, notre cadre théorique fait voir les avantages de l'application d'un cadre de régression par quantiles. Nous présentons les résultats d'une telle estimation de régression pour les 10e, 25e, 50e, 75e et 90e quantiles au tableau 8. Voici les grandes implications de cette estimation. Disons d'abord que la rétribution tant de la scolarisation que de l'expérience professionnelle est en décroissance selon les quantiles. Le constat d'hétérogénéité de la rétribution de la scolarisation à l'échelle des gains a déjà été dressé par d'autres auteurs. Buchinsky (1997) constate que la rétribution de la scolarisation s'élève le long des quantiles pour tous les groupes d'expérience professionnelle. Arias et coll. (2001) estiment des régressions semblables par quantiles à l'aide de données de description de jumeaux aux États-Unis et de méthodes permettant de résoudre les problèmes d'endogénéité. Dans une estimation sans variable instrumentale, ils constatent que le coefficient de la scolarisation monte du 10e au 50e percentile, mais ne varie pas dans la partie supérieure de la distribution. Lorsqu'ils emploient des variables instrumentales pour l'erreur de mesure et l'« état de jumeau » en correction du biais des capacités, les coefficients qu'ils estiment pour la scolarisation paraissent relativement homogènes dans toute la distribution, mais ne font pas l'objet d'une estimation précise aux extrémités.

Tableau 8 Régressions des gains par quantiles. Une nouvelle fenêtre s'ouvrira

Tableau 8
Régressions des gains par quantiles

Peut-être le résultat le plus intéressant au tableau 8 est-il l'absence de variation du coefficient de la variable de la littératie le long des quantiles. Si le coefficient du 10e quantile semble bien moindre que ceux des autres, il n'a rien de statistiquement significatif. Toutefois, avec des régressions aux quantiles immédiatement voisins du 10e (5e et 15e quantiles), nous obtenons des effets estimés de la littératie qui correspondent presque parfaitement à ceux des quantiles supérieurs. Le 10e ressemble un peu à une valeur statistique aberrante. Dans le cadre de notre modèle théorique, cela implique que les compétences cognitives n'entrent pas en interaction avec les autres caractéristiques dans la formation de la rémunération. Ainsi, d'autres caractéristiques comme la beauté (Hamermesh et Biddle, 1994) et les qualités de leadership (Kuhn et Weinberger, 2005) peuvent contribuer à la rémunération individuelle, mais le rapport ne s'améliore pas par l'augmentation des compétences en littératie, lesquelles n'ont rien d'une panacée tant pour les gains que pour la rétribution des autres caractéristiques. En d'autres termes, dans la mesure où les qualités de leadership concourent à la rémunération et peut-être à la productivité, ces résultats ne suggèrent pas aux entreprises de cibler la formation en leadership selon les niveaux de compétences cognitives, puisque des travailleurs aux compétences cognitives différentes recevront les mêmes avantages de cette formation.

Il faut enfin dire que les estimations que nous présentons des effets de la littératie sont identiques à nos constatations avec les données de l'EIAA 1994 (Green et Riddell, 2003). Dans les deux cas et avec les spécifications types, le coefficient est de 0,0029 pour la littératie moyenne dans une régression des gains en médiane. Nous y voyons un effet du hasard dans une certaine mesure, puisque les mesures des gains ne sont pas les mêmes dans les deux études et que, pour d'autres variables, on y estime des effets différents. Les grandes tendances estimées avec les données de l'EIAA 1994 subsistent néanmoins, dont la taille de l'effet de la littératie et son absence de variabilité selon les quantiles. Comme dans cette étude, nous concluons que la littératie est un grand facteur déterminant de la rémunération, mais qu'une grande partie de la variation des gains est à mettre au compte d'autres facteurs.


Note

  1. Nous ne pouvons démontrer ce résultat, mais il s'impose lorsque nous regardons la relation entre l'alphabétisation et l'âge en combinaison avec les valeurs types de biais de variables omises.