La vraisemblance pénalisée de Firth pour les régressions à risques proportionnels en cas d’enquêtes complexes
Section 1. Introduction

Le modèle de régression à risques proportionnels de Cox (Cox, 1972) est couramment utilisé dans l’analyse des données de survie. Il s’agit d’un modèle semi-paramétrique qui explique l’effet des variables explicatives sur les taux de risque. Le modèle suppose que l’effet des variables explicatives a une forme linéaire, mais il permet que la fonction de survie sous-jacente ait une forme non spécifiée. On estime les paramètres du modèle en maximisant une vraisemblance partielle (Cox, 1972, 1975).

Pour estimer les paramètres canoniques dans les distributions de la famille exponentielle, Firth (1993) a proposé de multiplier la vraisemblance par la loi a priori de Jeffreys afin d’obtenir une estimation par le maximum de vraisemblance qui soit du premier ordre sans biais. La vraisemblance pénalisée prend la forme

L p ( β ) = L ( β ) | I ( β ) | 0,5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGmbWaaSbaaSqaaiaadchaaeqaaO WaaeWabeaacaWHYoaacaGLOaGaayzkaaGaaGjbVlaaykW7caaI9aGa aGjbVlaaykW7caWGmbWaaeWabeaacaWHYoaacaGLOaGaayzkaaGaaG PaVpaaemqabaGaaGjcVlaadMeadaqadeqaaiaahk7aaiaawIcacaGL PaaacaaMi8oacaGLhWUaayjcSdWaaWbaaSqabeaacaqGWaGaaeilai aabwdaaaaaaa@4E1D@

L ( β ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGmbWaaeWabeaacaWHYoaacaGLOa Gaayzkaaaaaa@34B5@ est la vraisemblance non pénalisée, I MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGjbaaaa@31EA@ est la matrice d’information et β MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoaaaa@325A@ est un vecteur des paramètres de régression. La vraisemblance pénalisée de Firth est une technique très utile en pratique, non seulement aux fins de réduction du biais, mais aussi de correction des vraisemblances monotones.

Souvent, les modèles de régression à risques proportionnels souffrent de vraisemblances monotones, dans lesquelles la vraisemblance converge vers une valeur finie, mais un paramètre au moins diverge (Heinze, 1999). La vraisemblance pénalisée de Firth sert également à corriger les vraisemblances monotones et à obtenir des estimations de paramètres qui convergent (Heinze, 1999; Heinze et Schemper, 2001; Heinzel, Rüdiger et Schilling, 2002).

Bien que la vraisemblance pénalisée de Firth soit utile aux fins de réduction des biais et d’obtention d’estimations à partir de vraisemblances monotones, elle n’a pas été étudiée sur des enquêtes complexes comportant des poids inégaux. Il est raisonnable d’utiliser une vraisemblance pondérée pour les enquêtes complexes afin de compenser la pondération inégale (Fuller, 1975; Binder et Patak, 1994). Les ensembles de données d’enquête comprennent couramment des poids de sondage ou des poids d’analyse pour lesquels la somme des poids est un estimateur de la taille de la population. Toutefois, ces pondérations non mises à l’échelle ne mettent pas adéquatement à l’échelle la matrice d’information utilisée dans le terme de pénalité. Il est souhaitable que les paramètres d’une régression à risques proportionnels pour données d’enquête aient les deux propriétés suivantes.

Dans l’article, nous montrons d’abord que si l’on n’utilise pas la correction de Firth, alors l’invariance et la précision sont satisfaites, mais que si la correction de Firth est utilisée avec les poids non mis à l’échelle, alors les estimations ponctuelles et les erreurs-types ne sont pas invariantes par rapport à l’échelle des poids. Autrement dit, si les poids sont multipliés par une constante et que la correction de Firth est utilisée, les estimations ponctuelles et les erreurs-types seront différentes. Nous proposons ensuite une méthode de mise à l’échelle des poids de sens commun pour démontrer que la correction de Firth utilisant des poids mis à l’échelle possède les deux propriétés souhaitables. La seule différence entre les poids mis à l’échelle et ceux non mis à l’échelle est que la somme des poids mis à l’échelle est égale à la taille de l’échantillon, alors que la somme des poids non mis à l’échelle est un estimateur de la taille de la population.

1.1  Exemple d’utilisation de poids non mis à l’échelle

Nous avons utilisé un ensemble de données tiré d’une étude portant sur 65 patients atteints de myélome qui ont été traités au moyen d’agents alkylants (Lee, Wei et Amato, 1992) pour démontrer les propriétés de la vraisemblance pénalisée de Firth utilisant des poids non mis à l’échelle. Les durées de survie en mois ont été enregistrées pour chaque patient. Les patients qui étaient vivants après la période de l’étude étaient considérés comme des données censurées. Nous disposions des variables suivantes pour chaque patient :

Pour créer une vraisemblance monotone, nous avons ajouté une nouvelle variable explicative, Contrived [Artificielle], telle que sa valeur à tout moment de l’événement est la plus grande de toutes les valeurs de l’ensemble de risques (voir l’exemple « Correction de Firth pour vraisemblance monotone » dans « The PHREG Procedure » [La procédure PHREG] dans SAS Institute Inc. (2018)). La variable Contrived [Artificielle] a la valeur 1 si la durée de survie observée est inférieure ou égale à 65; sinon, elle a la valeur 0.

Pour démontrer l’effet des poids dans la vraisemblance pénalisée de Firth, nous avons créé trois variables de poids, w 1 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bGaaGymaiaacYcaaaa@3383@ w 3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bGaaG4maaaa@32D5@ et w 5 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bGaaGynaiaacYcaaaa@3387@ avec respectivement des valeurs de 1, 1 000 et 100 000 pour chaque observation. On estime les paramètres de régression à risques proportionnels en maximisant une vraisemblance pondérée comme cela est décrit dans la section 1.2. Parce que w 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bGaaGymaaaa@32D3@ a la valeur 1 pour toutes les observations, l’utilisation de w 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bGaaGymaaaa@32D3@ dans l’analyse équivaut à l’exécution de l’analyse non pondérée.

Nous avons ajusté les deux modèles à risques proportionnels suivants à l’aide de la procédure PHREG dans SAS/STATMD (voir « The PHREG Procedure » dans SAS Institute Inc. (2018) :

λ ( t , Z ) = λ 0 ( t ) exp ( β 1 LogBUN + β 2 HGB ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaqadeqaaiaadshacaaISa GaaGjbVlaahQfaaiaawIcacaGLPaaacaaMe8UaaGPaVlaai2dacaaM e8UaaGPaVlabeU7aSnaaBaaaleaacaaIWaaabeaakmaabmqabaGaaG jcVlaadshacaaMi8oacaGLOaGaayzkaaGaciyzaiaacIhacaGGWbWa aeWabeaacqaHYoGydaWgaaWcbaGaaGymaaqabaGccaqGmbGaae4Bai aabEgacaqGcbGaaeyvaiaab6eacaaMe8UaaGPaVlabgUcaRiaaysW7 caaMc8UaeqOSdi2aaSbaaSqaaiaaikdaaeqaaOGaaeisaiaabEeaca qGcbaacaGLOaGaayzkaaaaaa@5FC7@

λ ( t , Z ) = λ 0 ( t ) exp ( β 1 LogBUN + β 2 HGB + β 3 Contrived ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaqadeqaaiaadshacaaISa GaaGjbVlaahQfaaiaawIcacaGLPaaacaaMe8UaaGPaVlaai2dacaaM c8UaaGjbVlabeU7aSnaaBaaaleaacaaIWaaabeaakmaabmqabaGaaG jcVlaadshacaaMi8oacaGLOaGaayzkaaGaciyzaiaacIhacaGGWbWa aeWabeaacqaHYoGydaWgaaWcbaGaaGymaaqabaGccaqGmbGaae4Bai aabEgacaqGcbGaaeyvaiaab6eacaaMe8UaaGPaVlabgUcaRiaaysW7 caaMc8UaeqOSdi2aaSbaaSqaaiaaikdaaeqaaOGaaeisaiaabEeaca qGcbGaaGjbVlaaykW7cqGHRaWkcaaMe8UaaGPaVlabek7aInaaBaaa leaacaaIZaaabeaakiaaboeacaqGVbGaaeOBaiaabshacaqGYbGaae yAaiaabAhacaqGLbGaaeizaaGaayjkaiaawMcaaaaa@71B6@

λ ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaqadeqaaiaayIW7caWG0b GaaGjcVdGaayjkaiaawMcaaaaa@3875@ et λ 0 ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaWgaaWcbaGaaGimaaqaba GcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaaaa@3965@ sont respectivement la fonction de risque et la fonction de risque de référence. La vraisemblance pénalisée de Firth n’est pas requise pour l’ajustement du premier modèle sans la variable Contrived (la probabilité converge en trois étapes d’itération), mais le deuxième modèle contenant la variable Contrived ne converge pas sans la pénalité de Firth dans la vraisemblance. Le tableau 1.1 présente la valeur de la vraisemblance et les trois coefficients de régression pour 14 itérations. Bien que la fonction objective et les coefficients de LogBUN et HGB convergent vers une valeur finie après la quatrième itération, ceux de Contrived divergent. Il s’agit d’un exemple de vraisemblance monotone pour la variable Contrived. En raison de cette monotonie, il faut utiliser la vraisemblance pénalisée de Firth pour ajuster le deuxième modèle contenant Contrived.


Tableau 1.1
Historique de l’itération du maximum de vraisemblance montrant une vraisemblance monotone pour la variable Contrived
Sommaire du tableau
Le tableau montre les résultats de Historique de l’itération du maximum de vraisemblance montrant une vraisemblance monotone pour la variable Contrived. Les données sont présentées selon Nombre d’itérations (titres de rangée) et Valeur de la vraisemblance, LogBUN, HGB et Contrived(figurant comme en-tête de colonne).
Nombre d’itérations Valeur de la vraisemblance LogBUN HGB Contrived
1 -140,693405 1,994882 -0,084319 1,466331
2 -137,784163 1,679468 -0,109068 2,778361
3 -136,971190 1,714061 -0,111564 3,938095
4 -136,707893 1,718174 -0,112273 5,003054
5 -136,616426 1,718755 -0,112370 6,027436
6 -136,583520 1,718829 -0,112382 7,036445
7 -136,571515 1,718839 -0,112384 8,039764
8 -136,567113 1,718841 -0,112384 9,040985
9 -136,565495 1,718841 -0,112384 10,041434
10 -136,564900 1,718841 -0,112384 11,041600
11 -136,564681 1,718841 -0,112384 12,041660
12 -136,564601 1,718841 -0,112384 13,041683
13 -136,564571 1,718841 -0,112384 14,041691
14 -136,564560 1,718841 -0,112384 15,041694

Si Contrived n’est pas utilisée comme variable explicative, les trois ensembles de poids produisent des estimations ponctuelles et des estimations de variance linéarisées de Taylor identiques (tableau 1.2). Les estimations de la variance du jackknife avec suppression d’une UPE sont également identiques pour les trois ensembles de poids. Ainsi, les estimations ponctuelles et les erreurs-types sont invariantes par rapport à l’échelle des poids quand la correction de Firth n’est pas utilisée.


Tableau 1.2
Estimations des paramètres et erreurs-types sans correction de Firth pour les trois ensembles de poids
Sommaire du tableau
Le tableau montre les résultats de Estimations des paramètres et erreurs-types sans correction de Firth pour les trois ensembles de poids. Les données sont présentées selon (titres de rangée) et Estimation et Erreur type(figurant comme en-tête de colonne).
Estimation Erreur type
LogBUN 1,674 0,583
HGB -0,119 0,060

En revanche, si l’on utilise des poids non mis à l’échelle, les estimations ponctuelles pour Contrived ne sont pas invariantes par rapport à l’échelle des poids. Le tableau 1.3 présente les estimations des paramètres pour trois ensembles de poids quand Contrived est utilisée comme variable explicative (et que la vraisemblance pénalisée de Firth est appliquée). Parce que la vraisemblance n’est pas monotone (tableau 1.1) pour LogBUN et HGB, les estimations ponctuelles pour ces deux coefficients ne sont pas affectées par l’échelle des poids.


Tableau 1.3
Estimations des paramètres avec correction de Firth et poids non mis à l’échelle
Sommaire du tableau
Le tableau montre les résultats de Estimations des paramètres avec correction de Firth et poids non mis à l’échelle. Les données sont présentées selon (titres de rangée) et Poids w1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@ , w3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@ , w5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@ (figurant comme en-tête de colonne).
Poids w1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@ Poids w3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@ Poids w5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacPqpw0le9 v8qqaqFD0xXdHaVhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeqabeqadiWa ceGabeqabeGabeqadeaakeaacaWG3bGaaGymaaaa@3500@
Estimation Erreur type Estimation Erreur type Estimation Erreur type
LogBUN 1,722 0,584 1,719 1,85E-2 1,719 1,85E-3
HGB -0,112 0,061 -0,112 1,93E-3 -0,112 1,93E-4
Contrived 3,815 1,558 10,629 1,38 14,633 1,02

Si Contrived n’est pas utilisée comme variable explicative, le rapport entre les erreurs-types du jackknife et les erreurs-types de la linéarisation de Taylor est de 1,13 et 1,10 pour les trois ensembles de poids des variables LogBUN et HGB, respectivement. Ainsi, le rapport entre la variance par la méthode du jackknife et la variance linéarisée de Taylor pour la vraisemblance non pénalisée est invariant par rapport à l’échelle des poids, et il est raisonnable de penser que le rapport est invariant quand on utilise la vraisemblance pénalisée.

1.2  Bref examen des estimations ponctuelles et des estimations de variance pour les paramètres de régression de populations finies

Avant de discuter de la méthode de mise à l’échelle des poids, nous examinerons brièvement les estimations ponctuelles et les estimations de variance pour les paramètres de régression dans une régression à risques proportionnels sur des enquêtes complexes comportant des poids inégaux. Lin et Wei (1989), Binder (1990, 1992), Lin (2000) et Boudreau et Lawless (2006) ont traité de l’estimation par la méthode du pseudo-maximum de vraisemblance des paramètres de régression à risques proportionnels pour les données d’enquête. On trouve une description plus générale de l’estimation des paramètres de régression pour les enquêtes complexes dans Kish et Frankel (1974); Godambe et Thompson (1986); Pfeffermann (1993), Korn et Graubard (1999, chapitre 3), Chambers et Skinner (2003, chapitre 2) et Fuller (2009, section 6.5). Wolter (2007) a décrit plusieurs techniques d’estimation de la variance pour les données d’enquête.

Soit U N = { 1, 2, , N } MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFvbqvdaWgaaWcbaGaamOtaaqabaGccaaMe8Ua aGPaVlaai2dacaaMe8UaaGPaVpaacmqabaGaaGymaiaaiYcacaaMe8 UaaGOmaiaaiYcacaaMe8UaeSOjGSKaaGilaiaaysW7caWGobaacaGL 7bGaayzFaaaaaa@5025@ l’ensemble des indices et F N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFgbGrdaWgaaWcbaGaamOtaaqabaaaaa@3C9F@ l’ensemble des valeurs pour une population finie de taille N . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGobGaaiOlaaaa@32A1@ On suppose que la durée de survie de chaque membre de la population finie suit sa propre fonction de risque, λ i ( t ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaWgaaWcbaGaamyAaaqaba GcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaiaacYca aaa@3A49@ exprimée comme suit :

λ i ( t ) = λ ( t ; Z i ( t ) ) = λ 0 ( t ) exp ( Z i ( t ) β ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaWgaaWcbaGaamyAaaqaba GcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaiaaysW7 caaMc8UaaGypaiaaysW7caaMc8Uaeq4UdW2aaeWabeaacaWG0bGaaG 4oaiaaysW7caWHAbWaaSbaaSqaaiaadMgaaeqaaOWaaeWabeaacaaM i8UaamiDaiaayIW7aiaawIcacaGLPaaaaiaawIcacaGLPaaacaaMe8 UaaGPaVlaai2dacaaMe8UaaGPaVlabeU7aSnaaBaaaleaacaaIWaaa beaakmaabmqabaGaaGjcVlaadshacaaMi8oacaGLOaGaayzkaaGaaG jbVlGacwgacaGG4bGaaiiCamaabmqabaGaaCOwamaaDaaaleaacaWG PbaabaaccaqcLbwacqWFYaIOaaGcdaqadeqaaiaayIW7caWG0bGaaG jcVdGaayjkaiaawMcaaiaayIW7caaMe8UaaCOSdaGaayjkaiaawMca aaaa@7251@

λ 0 ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaWgaaWcbaGaaGimaaqaba GcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaaaa@3965@ est une fonction de risque de référence arbitraire et non spécifiée, Z i ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHAbWaaSbaaSqaaiaadMgaaeqaaO WaaeWabeaacaaMi8UaamiDaiaayIW7aiaawIcacaGLPaaaaaa@38C8@ est un vecteur de taille P MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGqbaaaa@31F1@ des variables explicatives de l’unité i e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbWaaWbaaSqabeaacaqGLbaaaa aa@331F@ au temps t , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG0bGaaiilaaaa@32C5@ et β MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoaaaa@325A@ est un vecteur de paramètres de régression inconnus.

La fonction de vraisemblance partielle introduite par Cox (1972, 1975) élimine le risque de référence inconnu λ 0 ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaH7oaBdaWgaaWcbaGaaGimaaqaba GcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaaaa@3965@ et tient compte des durées de survie censurées. Si toute la population est observée, cette fonction de vraisemblance partielle peut servir à estimer β . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoGaaiOlaaaa@330C@ Soit β N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoWaaSbaaSqaaiaad6eaaeqaaa aa@3359@ l’estimateur souhaité.

En supposant un modèle de travail avec des réponses non corrélées, on obtient β N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoWaaSbaaSqaaiaad6eaaeqaaa aa@3359@ en maximisant la log-vraisemblance partielle,

l N ( β ) = i U N log { L ( β ; Z i ( t ) , t i ) } MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGSbWaaSbaaSqaaiaad6eaaeqaaO WaaeWabeaacaWHYoaacaGLOaGaayzkaaGaaGjbVlaaykW7caaI9aGa aGjbVlaaykW7daaeqbqabSqaaiaadMgacqGHiiIZtCvAUfKttLeary at1nwAKfgidfgBSL2zYfgCOLhaiqGacqWFvbqvdaWgaaadbaGaamOt aaqabaaaleqaniabggHiLdGcciGGSbGaai4BaiaacEgadaGadeqaai aabYeadaqadeqaaiaahk7acaaI7aGaaGjbVlaahQfadaWgaaWcbaGa amyAaaqabaGcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawM caaiaaiYcacaaMe8UaamiDamaaBaaaleaacaWGPbaabeaaaOGaayjk aiaawMcaaaGaay5Eaiaaw2haaaaa@6418@

par rapport à β , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoGaaiilaaaa@330A@ L ( β ; Z i ( t ) , t i ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaqGmbWaaeWabeaacaWHYoGaaG4oai aaysW7caWHAbWaaSbaaSqaaiaadMgaaeqaaOWaaeWabeaacaaMi8Ua amiDaiaayIW7aiaawIcacaGLPaaacaaISaGaaGjbVlaadshadaWgaa WcbaGaamyAaaqabaaakiaawIcacaGLPaaaaaa@4311@ est la fonction de vraisemblance partielle de Cox.

Supposons qu’un échantillon probabiliste A N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGbbWaaSbaaSqaaiaad6eaaeqaaa aa@32E1@ est sélectionné dans la population finie U N . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFvbqvdaWgaaWcbaGaamOtaaqabaGccaGGUaaa aa@3D79@ Soit π i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaHapaCdaWgaaWcbaGaamyAaaqaba aaaa@33F3@ la probabilité de sélection et w i ( = π i 1 ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bWaaSbaaSqaaiaadMgaaeqaaO WaaeWabeaacqGH9aqpcqaHapaCdaqhaaWcbaGaamyAaaqaaiabgkHi TiaaigdaaaaakiaawIcacaGLPaaaaaa@3A56@ le poids d’échantillonnage pour l’unité i . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbGaaiOlaaaa@32BC@ Supposons ensuite que les variables explicatives Z i ( t ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHAbWaaSbaaSqaaiaadMgaaeqaaO WaaeWabeaacaaMi8UaamiDaiaayIW7aiaawIcacaGLPaaaaaa@38C8@ et la durée de survie t i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG0bWaaSbaaSqaaiaadMgaaeqaaa aa@332F@ sont disponibles pour chaque unité de l’échantillon A N . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGbbWaaSbaaSqaaiaad6eaaeqaaO GaaiOlaaaa@339D@ Un estimateur sans biais par rapport au plan pour la log-vraisemblance de la population finie est

l ( β ) = i A N π i 1 log { L ( β ; Z i ( t ) , t i ) } = i A N w i log { L ( β ; Z i ( t ) , t i ) } . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGSbWaaeWabeaacaWHYoaacaGLOa GaayzkaaGaaGjbVlaaykW7caaI9aGaaGjbVlaaykW7daaeqbqabSqa aiaadMgacqGHiiIZcaWGbbWaaSbaaWqaaiaad6eaaeqaaaWcbeqdcq GHris5aOGaaGPaVlabec8aWnaaDaaaleaacaWGPbaabaGaeyOeI0Ia aGymaaaakiGacYgacaGGVbGaai4zamaacmqabaGaaeitamaabmqaba GaaCOSdiaaiUdacaaMi8UaaGjbVlaahQfadaWgaaWcbaGaamyAaaqa baGcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaayjkaiaawMcaaiaaiY cacaaMe8UaamiDamaaBaaaleaacaWGPbaabeaaaOGaayjkaiaawMca aaGaay5Eaiaaw2haaiaaysW7caaMc8UaaGypaiaaysW7caaMc8+aaa buaeqaleaacaWGPbGaeyicI4SaamyqamaaBaaameaacaWGobaabeaa aSqab0GaeyyeIuoakiaaykW7caWG3bWaaSbaaSqaaiaadMgaaeqaaO GaciiBaiaac+gacaGGNbWaaiWabeaacaqGmbWaaeWabeaacaWHYoGa aG4oaiaayIW7caaMe8UaaCOwamaaBaaaleaacaWGPbaabeaakmaabm qabaGaaGjcVlaadshacaaMi8oacaGLOaGaayzkaaGaaGilaiaaysW7 caWG0bWaaSbaaSqaaiaadMgaaeqaaaGccaGLOaGaayzkaaaacaGL7b GaayzFaaGaaiOlaaaa@8B26@

On peut obtenir un estimateur basé sur un échantillon β ^ N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaadaWgaaWcbaGaamOtaa qabaaaaa@3369@ pour la quantité finie de population β N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoWaaSbaaSqaaiaad6eaaeqaaa aa@3359@ en maximisant la pseudo-log-vraisemblance partielle l ( β ; Z i ( t ) , t i ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGSbWaaeWabeaacaWHYoGaaG4oai aaysW7caWHAbWaaSbaaSqaaiaadMgaaeqaaOWaaeWabeaacaaMi8Ua amiDaiaayIW7aiaawIcacaGLPaaacaaISaGaaGjbVlaadshadaWgaa WcbaGaamyAaaqabaaakiaawIcacaGLPaaaaaa@4333@ par rapport à β . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoGaaiOlaaaa@330C@ On obtient la variance fondée sur le plan pour β ^ N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaadaWgaaWcbaGaamOtaa qabaaaaa@3369@ en supposant que l’ensemble de valeurs de la population finie F N MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFgbGrdaWgaaWcbaGaamOtaaqabaaaaa@3C9F@ est fixe.

La vraisemblance de Breslow pondérée peut être exprimée comme suit :

L ( β ) = k = 1 K exp ( β D k w i Z i ( t ) ) { R k w i exp ( β Z i ( t ) ) } D k w i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGmbWaaeWabeaacaWHYoaacaGLOa GaayzkaaGaaGjbVlaaykW7caaI9aGaaGjbVlaaykW7daqeWbqabSqa aiaadUgacaaI9aGaaGymaaqaaiaadUeaa0Gaey4dIunakiaaysW7ca aMc8+aaSaaaeaaciGGLbGaaiiEaiaacchadaqadaqaaiqahk7agaqb amaaqababaGaam4DamaaBaaaleaacaWGPbaabeaaaeaatCvAUfKttL earyat1nwAKfgidfgBSL2zYfgCOLhaiqGacqWFebardaWgaaadbaGa am4AaaqabaaaleqaniabggHiLdGccaWHAbWaaSbaaSqaaiaadMgaae qaaOWaaeWabeaacaaMi8UaamiDaiaayIW7aiaawIcacaGLPaaaaiaa wIcacaGLPaaaaeaadaGadaqaamaaqababaGaam4DamaaBaaaleaaca WGPbaabeaaaeaacqWFsbGudaWgaaadbaGaam4Aaaqabaaaleqaniab ggHiLdGcciGGLbGaaiiEaiaacchadaqadeqaaiqahk7agaqbaiaahQ fadaWgaaWcbaGaamyAaaqabaGcdaqadeqaaiaayIW7caWG0bGaaGjc VdGaayjkaiaawMcaaaGaayjkaiaawMcaaaGaay5Eaiaaw2haamaaCa aaleqabaWaaabeaeaacaWG3bWaaSbaaWqaaiaadMgaaeqaaaqaaiab =reaenaaBaaabaGaam4AaaqabaaabeGdcqGHris5aaaaaaaaaa@7D5B@

R k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFsbGudaWgaaWcbaGaam4Aaaqabaaaaa@3CD4@ est l’ensemble de risques juste avant le k e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGRbWaaWbaaSqabeaacaqGLbaaaa aa@3321@ temps d’événement ordonné t ( k ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG0bWaaSbaaSqaamaabmqabaGaaG jcVlaadUgacaaMi8oacaGLOaGaayzkaaaabeaakiaacYcaaaa@3897@ D k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFebardaWgaaWcbaGaam4Aaaqabaaaaa@3CB8@ est l’ensemble des personnes qui fait défaillance au temps t ( k ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG0bWaaSbaaSqaamaabmqabaGaaG jcVlaadUgacaaMi8oacaGLOaGaayzkaaaabeaakiaacYcaaaa@3897@ et K MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGlbaaaa@31EC@ est le nombre de temps d’événements distincts.

On obtient les estimations ponctuelles pour β MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHYoaaaa@325A@ en maximisant l ( β ) = log [ L ( β ) ] . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGSbWaaeWabeaacaWHYoaacaGLOa GaayzkaaGaaGjbVlaaykW7caaI9aGaaGjbVlaaykW7ciGGSbGaai4B aiaacEgadaWadeqaaiaadYeadaqadeqaaiaahk7aaiaawIcacaGLPa aaaiaawUfacaGLDbaacaGGUaaaaa@44DA@

Bien que les poids suffisent aux fins d’estimation des coefficients de régression pour la population finie, on doit aussi utiliser les données de stratification et de corrélation intra-grappe pour estimer la variabilité d’échantillonnage. Afin d’estimer la variabilité d’échantillonnage, on peut utiliser la méthode de linéarisation en séries de Taylor ou une méthode de rééchantillonnage.

1.2.1  Estimateur de la variance analytique par la méthode de linéarisation en séries de Taylor

La méthode de linéarisation en séries de Taylor utilise la somme des carrés des scores résiduels pondérés pour estimer la variabilité d’échantillonnage.

Définissons Z ¯ ( β , t ) = S ( 1 ) ( β , t ) S ( 0 ) ( β , t ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaaMi8UabCOwayaaraWaaeWabeaaca WHYoGaaGilaiaaysW7caWG0baacaGLOaGaayzkaaGaaGjbVlaaykW7 caaI9aGaaGjbVlaaykW7daWcbaWcbaGaaC4uamaaCaaameqabaWaae WabeaacaaMi8UaaGymaiaayIW7aiaawIcacaGLPaaaaaWcdaqadeqa aiaahk7acaaISaGaaGjbVlaadshaaiaawIcacaGLPaaaaeaacaWGtb WaaWbaaWqabeaadaqadeqaaiaayIW7caaIWaGaaGjcVdGaayjkaiaa wMcaaaaalmaabmqabaGaaCOSdiaaiYcacaaMe8UaamiDaaGaayjkai aawMcaaaaakiaacYcaaaa@5A74@

S ( 0 ) ( β , t ) = A N w i I ( t i t ) exp ( β Z i ( t ) ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGtbWaaWbaaSqabeaadaqadeqaai aayIW7caaIWaGaaGjcVdGaayjkaiaawMcaaaaakmaabmqabaGaaCOS diaacYcacaaMe8UaamiDaaGaayjkaiaawMcaaiaaysW7caaMc8UaaG ypaiaaysW7caaMc8+aaabuaeqaleaacaWGbbWaaSbaaWqaaiaad6ea aeqaaaWcbeqdcqGHris5aOGaaGPaVlaadEhadaWgaaWcbaGaamyAaa qabaGccaWGjbWaaeWabeaacaWG0bWaaSbaaSqaaiaadMgaaeqaaOGa aGjbVlaaykW7cqGHLjYScaaMe8UaaGPaVlaadshaaiaawIcacaGLPa aaciGGLbGaaiiEaiaacchadaqadeqaaiqahk7agaqbaiaahQfadaWg aaWcbaGaamyAaaqabaGcdaqadeqaaiaayIW7caWG0bGaaGjcVdGaay jkaiaawMcaaaGaayjkaiaawMcaaaaa@66EE@

et

S ( 1 ) ( β , t ) = A N w i I ( t i t ) exp ( β Z i ( t ) ) Z i ( t ) . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaaMi8UaaC4uamaaCaaaleqabaWaae WabeaacaaMi8UaaGymaiaayIW7aiaawIcacaGLPaaaaaGcdaqadeqa aiaahk7acaGGSaGaaGjbVlaadshaaiaawIcacaGLPaaacaaMe8UaaG PaVlaai2dacaaMe8UaaGPaVpaaqafabeWcbaGaamyqamaaBaaameaa caWGobaabeaaaSqab0GaeyyeIuoakiaaykW7caWG3bWaaSbaaSqaai aadMgaaeqaaOGaamysamaabmqabaGaamiDamaaBaaaleaacaWGPbaa beaakiaaysW7cqGHLjYScaaMe8UaamiDaaGaayjkaiaawMcaaiGacw gacaGG4bGaaiiCamaabmqabaGabCOSdyaafaGaaCOwamaaBaaaleaa caWGPbaabeaakiaaiIcacaWG0bGaaGykaaGaayjkaiaawMcaaiaahQ fadaWgaaWcbaGaamyAaaqabaGcdaqadeqaaiaayIW7caWG0bGaaGjc VdGaayjkaiaawMcaaiaac6caaaa@6A85@

Le score résiduel pour le i e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbWaaWbaaSqabeaacaqGLbaaaa aa@331F@ sujet est

u i ( β ) = Δ i { Z i ( t i ) Z ¯ ( β , t i ) } j A N [ Δ j w j I ( t i t j ) exp ( β Z i ( t j ) ) S ( 0 ) ( β , t j ) { Z i ( t j ) Z ¯ ( β , t j ) } ] MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaafaqaaeGacaaabaGaaCyDamaaBaaale aacaWGPbaabeaakmaabmqabaGaaCOSdaGaayjkaiaawMcaaiaai2da aeaacqqHuoardaWgaaWcbaGaamyAaaqabaGcdaGadeqaaiaahQfada WgaaWcbaGaamyAaaqabaGcdaqadeqaaiaayIW7caWG0bWaaSbaaSqa aiaadMgaaeqaaaGccaGLOaGaayzkaaGaaGjbVlabgkHiTiaaysW7ce WHAbGbaebadaqadeqaaiaahk7acaGGSaGaaGjbVlaadshadaWgaaWc baGaamyAaaqabaaakiaawIcacaGLPaaaaiaawUhacaGL9baaaeaaae aacqGHsisldaaeqbqabSqaaiaadQgacqGHiiIZcaWGbbWaaSbaaWqa aiaad6eaaeqaaaWcbeqdcqGHris5aOWaamWabeaacqqHuoardaWgaa WcbaGaamOAaaqabaGcdaWcaaqaaiaadEhadaWgaaWcbaGaamOAaaqa baGccaWGjbWaaeWabeaacaWG0bWaaSbaaSqaaiaadMgaaeqaaOGaaG jbVlabgwMiZkaaysW7caWG0bWaaSbaaSqaaiaadQgaaeqaaaGccaGL OaGaayzkaaGaciyzaiaacIhacaGGWbWaaeWabeaacaaMi8UabCOSdy aafaGaaCOwamaaBaaaleaacaWGPbaabeaakmaabmqabaGaamiDamaa BaaaleaacaWGQbaabeaaaOGaayjkaiaawMcaaaGaayjkaiaawMcaaa qaaiaadofadaahaaWcbeqaamaabmqabaGaaGjcVlaaicdacaaMi8oa caGLOaGaayzkaaaaaOWaaeWabeaacaWHYoGaaiilaiaaysW7caWG0b WaaSbaaSqaaiaadQgaaeqaaaGccaGLOaGaayzkaaaaamaacmqabaGa aGjcVlaahQfadaWgaaWcbaGaamyAaaqabaGcdaqadeqaaiaadshada WgaaWcbaGaamOAaaqabaaakiaawIcacaGLPaaacaaMe8UaeyOeI0Ia aGjbVlqahQfagaqeaiaayIW7daqadeqaaiaahk7acaaISaGaaGjbVl aadshadaWgaaWcbaGaamOAaaqabaaakiaawIcacaGLPaaaaiaawUha caGL9baaaiaawUfacaGLDbaaaaaaaa@9A30@

Δ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqqHuoardaWgaaWcbaGaamyAaaqaba aaaa@339B@ est l’indicateur d’événement.

Alors, l’estimateur de variance linéarisé de Taylor est

V ^ ( β ^ ) = I 1 ( β ^ ) G I 1 ( β ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHwbGbaKaadaqadeqaaiqahk7aga qcaaGaayjkaiaawMcaaiaaysW7caaMc8UaaGypaiaaysW7caaMc8+e xLMBb50ujbqegWuDJLgzHbYqHXgBPDMCHbhA5baceiGae8xsaK0aaW baaSqabeaacqGHsislcaaIXaaaaOWaaeWabeaaceWHYoGbaKaaaiaa wIcacaGLPaaacaaMe8Uaae4raiab=LeajnaaCaaaleqabaGaeyOeI0 IaaGymaaaakmaabmqabaGabCOSdyaajaaacaGLOaGaayzkaaaaaa@533F@

I ( β ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaatCvAUfKttLearyat1nwAKfgidfgBSL 2zYfgCOLhaiqGacqWFjbqsdaqadeqaaiqahk7agaqcaaGaayjkaiaa wMcaaaaa@3E7E@ est la matrice d’information observée et la p × p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGWbGaey41aqRaamiCaaaa@351D@ matrice G MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeabq9VaaC4raaaa@333F@ est définie comme étant

G = i , j A N : i < j π i π j π i j π i j ( u ^ i π i u ^ j π j ) ( u ^ i π i u ^ j π j ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaaMi8UaaC4raiaaysW7caaMc8UaaG ypaiaaysW7caaMc8+aaabuaeqaleaacaWGPbGaaGilaiaaysW7caWG QbGaeyicI4SaamyqamaaBaaameaacaWGobaabeaaliaaiQdacaaMe8 UaamyAaiaaykW7caaI8aGaaGPaVlaadQgaaeqaniabggHiLdGccaaM c8+aaSaaaeaacqaHapaCdaWgaaWcbaGaamyAaaqabaGccqaHapaCda WgaaWcbaGaamOAaaqabaGccaaMe8UaeyOeI0IaaGjbVlabec8aWnaa BaaaleaacaWGPbGaamOAaaqabaaakeaacqaHapaCdaWgaaWcbaGaam yAaiaadQgaaeqaaaaakmaabmaabaGaaGjcVpaalaaabaGabCyDayaa jaWaaSbaaSqaaiaadMgaaeqaaaGcbaGaeqiWda3aaSbaaSqaaiaadM gaaeqaaaaakiaaysW7caaMc8UaeyOeI0IaaGjbVlaaykW7daWcaaqa aiqahwhagaqcamaaBaaaleaacaWGQbaabeaaaOqaaiabec8aWnaaBa aaleaacaWGQbaabeaaaaaakiaawIcacaGLPaaadaahaaWcbeqaaOGa mai2gkdiIcaadaqadaqaamaalaaabaGabCyDayaajaWaaSbaaSqaai aadMgaaeqaaaGcbaGaeqiWda3aaSbaaSqaaiaadMgaaeqaaaaakiaa ysW7caaMc8UaeyOeI0IaaGjbVlaaykW7daWcaaqaaiqahwhagaqcam aaBaaaleaacaWGQbaabeaaaOqaaiabec8aWnaaBaaaleaacaWGQbaa beaaaaaakiaawIcacaGLPaaaaaa@89A9@

π i j MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaHapaCdaWgaaWcbaGaamyAaiaadQ gaaeqaaaaa@34E2@ sont les probabilités d’inclusion conjointe pour les unités i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbaaaa@320A@ et j . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGQbGaaiOlaaaa@32BD@

En particulier, pour les plans d’échantillonnage en grappes stratifiés dans lesquels les UPE sont sélectionnées au moyen d’un échantillon aléatoire simple sans remise, la p × p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGWbGaaGjbVlabgEna0kaaysW7ca WGWbaaaa@3837@ matrice G MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeabq9VaaC4raaaa@333F@ se réduit à

G = h = 1 H n h ( 1 f h ) n h 1 i = 1 n h ( e h i + e ¯ h ) ( e h i + e ¯ h ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaaMi8UaaC4raiaaysW7caaMc8UaaG ypaiaaysW7caaMc8+aaabCaeqaleaacaWGObGaaGypaiaaigdaaeaa caWGibaaniabggHiLdGccaaMc8+aaSaaaeaacaWGUbWaaSbaaSqaai aadIgaaeqaaOWaaeWabeaacaaIXaGaaGjbVlabgkHiTiaaysW7caWG MbWaaSbaaSqaaiaadIgaaeqaaaGccaGLOaGaayzkaaaabaGaamOBam aaBaaaleaacaWGObaabeaakiaaysW7cqGHsislcaaMe8UaaGymaaaa daaeWbqabSqaaiaadMgacaaI9aGaaGymaaqaaiaad6gadaWgaaadba GaamiAaaqabaaaniabggHiLdGcdaqadeqaaiaahwgadaWgaaWcbaGa amiAaiaadMgacqGHRaWkaeqaaOGaaGjbVlabgkHiTiaaysW7ceWHLb GbaebadaWgaaWcbaGaamiAaiabgwSixlabgwSixdqabaaakiaawIca caGLPaaadaahaaWcbeqaaOGamai2gkdiIcaadaqadeqaaiaahwgada WgaaWcbaGaamiAaiaadMgacqGHRaWkaeqaaOGaaGjbVlabgkHiTiaa ysW7ceWHLbGbaebadaWgaaWcbaGaamiAaiabgwSixlabgwSixdqaba aakiaawIcacaGLPaaaaaa@7D1E@

e h i + MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHLbWaaSbaaSqaaiaadIgacaWGPb Gaey4kaScabeaaaaa@34F3@ est la somme pondérée des scores résiduels, u ^ h i j , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWH1bGbaKaadaWgaaWcbaGaamiAai aadMgacaWGQbaabeaakiaacYcaaaa@35DA@ dans la strate h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGObaaaa@3209@ et l’UPE i ; MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbGaai4oaaaa@32C9@ e ¯ h .. MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHLbGbaebadaWgaaWcbaGaamiAai aai6cacaaIUaaabeaaaaa@34AB@ est la moyenne de e h i + ; MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWHLbWaaSbaaSqaaiaadIgacaWGPb Gaey4kaScabeaakiaacUdaaaa@35BC@ n h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGUbWaaSbaaSqaaiaadIgaaeqaaa aa@3328@ est le nombre d’UPE; et f h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGMbWaaSbaaSqaaiaadIgaaeqaaa aa@3320@ est la fraction d’échantillonnage dans la strate h . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGObGaaiOlaaaa@32BB@

Ces estimateurs sont largement étudiés par la littérature sur les enquêtes-échantillons. Par exemple, Binder (1992) et Lin (2000) fournissent des conditions en vertu desquelles β ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaaaaa@326A@ et V ^ ( β ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHwbGbaKaadaqadeqaaiqbek7aIz aajaaacaGLOaGaayzkaaaaaa@3546@ sont convergents. Chambless et Boyle (1985) ont calculé la variance fondée sur le plan et la normalité asymptotique pour des modèles à risques proportionnels discrets.

1.2.2  Estimateur de la variance par répliques au moyen de la méthode du jackknife avec suppression d’une UPE

La méthode du jackknife est une méthode d’estimation de la variance par répliques couramment utilisée en cas d’enquêtes complexes. Pour créer des rééchantillonnages, elle supprime (en lui attribuant un poids nul) une UPE à la fois de l’échantillon complet. Dans chaque rééchantillonnage, les poids d’échantillonnage des UPE restantes sont modifiés par le coefficient du jackknife α r . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacqaHXoqydaWgaaWcbaGaamOCaaqaba GccaGGUaaaaa@349A@ Les poids modifiés sont appelés poids de rééchantillonnage.

Supposons que l’UPE i r MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbWaaSbaaSqaaiaadkhaaeqaaa aa@332D@ dans la strate h r MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGObWaaSbaaSqaaiaadkhaaeqaaa aa@332C@ soit omise du r e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGYbWaaWbaaSqabeaacaqGLbaaaa aa@3328@ rééchantillonnage, alors les poids de rééchantillonnage et les coefficients du jackknife sont donnés par

w h i j ( r ) = { 0 i = i r et h = h r w h i j / α r i i r et h = h r w h i j h h r MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG3bWaa0baaSqaaiaadIgacaWGPb GaamOAaaqaamaabmqabaGaaGjcVlaadkhacaaMi8oacaGLOaGaayzk aaaaaOGaaGjbVlaaykW7caaI9aGaaGjbVlaaykW7daGabaqaauaaba qadiaaaeaacaaIWaaabaGaamyAaiaaysW7caaI9aGaaGjbVlaadMga daWgaaWcbaGaamOCaaqabaGccaaMe8UaaGPaVlaabwgacaqG0bGaaG jbVlaaykW7caWGObGaaGjbVlaai2dacaaMe8UaamiAamaaBaaaleaa caWGYbaabeaaaOqaamaalyaabaGaam4DamaaBaaaleaacaWGObGaam yAaiaadQgaaeqaaaGcbaGaeqySde2aaSbaaSqaaiaadkhaaeqaaaaa aOqaaiaadMgacaaMe8UaeyiyIKRaaGjbVlaadMgadaWgaaWcbaGaam OCaaqabaGccaaMe8UaaGPaVlaabwgacaqG0bGaaGjbVlaaykW7caWG ObGaaGjbVlaai2dacaaMe8UaamiAamaaBaaaleaacaWGYbaabeaaaO qaaiaadEhadaWgaaWcbaGaamiAaiaadMgacaWGQbaabeaaaOqaaiaa dIgacaaMe8UaeyiyIKRaaGjbVlaadIgadaWgaaWcbaGaamOCaaqaba aaaaGccaGL7baaaaa@8319@

et α r = n h r 1 n h r , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeabq9VaeqySde2aaSbaaSqaaiaadkhaae qaaOGaaGjbVlaaykW7caaI9aGaaGjbVlaaykW7daWcbaWcbaGaamOB amaaBaaameaacaWGObWaaSbaaeaacaWGYbaabeaaaeqaaSGaeyOeI0 IaaGymaaqaaiaad6gadaWgaaadbaGaamiAamaaBaaabaGaamOCaaqa baaabeaaaaGccaGGSaaaaa@4505@ respectivement, pour toutes les unités d’observation j MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGQbaaaa@320B@ dans la strate h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGObaaaa@3209@ et l’UPE i . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGPbGaaiOlaaaa@32BC@ Le nombre d’UPE dans la strate h r MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGObWaaSbaaSqaaiaadkhaaeqaaa aa@332C@ est de n h r . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGUbWaaSbaaSqaaiaadIgadaWgaa adbaGaamOCaaqabaaaleqaaOGaaiOlaaaa@3513@

On peut appliquer la méthode du jackknife pour estimer les variances des paramètres de régression estimés pour le modèle de Cox parce que les paramètres du modèle sont les solutions d’un ensemble d’équations d’estimation qui sont des fonctions lisses de totaux (les fonctions de score correspondantes sont données dans la section 2). Les propriétés des estimateurs de la variance par la méthode du jackknife pour les modèles de régression à risques proportionnels sont étudiées dans Shao et Tu (1995, section 8.3).

Pour appliquer la méthode du jackknife, on estime les paramètres du modèle au moyen de l’échantillon complet et en utilisant chaque échantillon répété. Soit β ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaaaaa@326A@ les coefficients de régression à risques proportionnels estimés à partir de l’échantillon complet et soit β ^ r MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaadaWgaaWcbaGaamOCaa qabaaaaa@338D@ les coefficients de régression estimés à partir du r e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGYbWaaWbaaSqabeaacaqGLbaaaa aa@3328@ rééchantillonnage. Alors, la matrice de covariance de β ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaaaaa@326A@ est estimée par

V ^ ( β ^ ) = r = 1 R α r ( β ^ r β ^ ) ( β ^ r β ^ ) . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHwbGbaKaadaqadeqaaiqahk7aga qcaaGaayjkaiaawMcaaiaaysW7caaMc8UaaGypaiaaysW7caaMc8+a aabCaeqaleaacaWGYbGaaGypaiaaigdaaeaacaWGsbaaniabggHiLd GccaaMc8UaeqySde2aaSbaaSqaaiaadkhaaeqaaOWaaeWabeaaceWH YoGbaKaadaWgaaWcbaGaamOCaaqabaGccaaMe8UaeyOeI0IaaGjbVl qahk7agaqcaaGaayjkaiaawMcaamaabmqabaGabCOSdyaajaWaaSba aSqaaiaadkhaaeqaaOGaaGjbVlabgkHiTiaaysW7ceWHYoGbaKaaai aawIcacaGLPaaadaahaaWcbeqaaOGamai2gkdiIcaacaGGUaaaaa@5C4A@

Si les fractions de sondage ne sont pas ignorables, la matrice de covariance de β ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHYoGbaKaaaaa@326A@ est estimée par

V ^ ( β ^ ) = r = 1 R α r ( 1 f r ) ( β ^ r β ^ ) ( β ^ r β ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaaceWHwbGbaKaadaqadeqaaiqahk7aga qcaaGaayjkaiaawMcaaiaaysW7caaMc8UaaGypaiaaysW7caaMc8+a aabCaeqaleaacaWGYbGaaGypaiaaigdaaeaacaWGsbaaniabggHiLd GccaaMc8UaeqySde2aaSbaaSqaaiaadkhaaeqaaOWaaeWabeaacaaI XaGaeyOeI0IaamOzamaaBaaaleaacaWGYbaabeaaaOGaayjkaiaawM caamaabmqabaGabCOSdyaajaWaaSbaaSqaaiaadkhaaeqaaOGaaGjb VlabgkHiTiaaysW7ceWHYoGbaKaaaiaawIcacaGLPaaadaqadeqaai qahk7agaqcamaaBaaaleaacaWGYbaabeaakiaaysW7cqGHsislcaaM e8UabCOSdyaajaaacaGLOaGaayzkaaWaaWbaaSqabeaakiadaITHYa IOaaaaaa@60E2@

f r = n h r N h r MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeabq9VaamOzamaaBaaaleaacaWGYbaabe aakiaaysW7caaI9aGaaGjbVpaaleaaleaacaWGUbWaaSbaaWqaaiaa dIgadaWgaaqaaiaadkhaaeqaaaqabaaaleaacaWGobWaaSbaaWqaai aadIgadaWgaaqaaiaadkhaaeqaaaqabaaaaaaa@3EB9@ est la fraction de sondage dans la strate h r . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeabq9VaamiAamaaBaaaleaacaWGYbaabe aakiaac6caaaa@353B@

En pratique, on utilise les estimations de la variance par linéarisation de Taylor et les estimations de la variance par la méthode du jackknife pour construire les intervalles de confiance t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWG0baaaa@3215@ de Wald avec R H MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGsbGaaGjbVlabgkHiTiaaysW7ca WGibaaaa@36C7@ degrés de liberté, où R MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGsbaaaa@31F3@ est le nombre d’UPE (ou le nombre de rééchantillonnages) et H MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8qrpq0dc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaGaaeaadaaakeaacaWGibaaaa@31E9@ est le nombre de strates.

On montre facilement que l’estimateur de la variance par la méthode du jackknife équivaut algébriquement à l’estimateur linéarisé de Taylor pour les estimateurs linéaires du plan de sondage. En revanche, pour ce qui est des estimateurs non linéaires du plan de sondage, comme les coefficients de régression pour les modèles de régression à risques proportionnels, la méthode du jackknife tend à produire des estimations de la variance légèrement plus élevées que la méthode linéarisée de Taylor (Fuller, 2009).

Notons que si l’estimation de l’échantillon complet présente une vraisemblance monotone, il est très probable que la plupart des échantillons répétés présentent également des vraisemblances monotones. Il en résultera de nombreuses estimations par répliques « inutilisables ».

Les procédures d’analyse des données d’enquête dans SAS/STAT prennent en charge à la fois les méthodes d’estimation de la variance linéarisée de Taylor et d’estimation de la variance par répliques (Mukhopadhyay, An, Tobias et Watts, 2008).


Date de modification :