Analyse semi-paramétrique des modèles de durées : l'apport des méthodes bayésiennes
Institution:
Aix-Marseille 2Disciplines:
Directors:
Abstract EN:
We propose a semiparametric analysis of duration models. In this special class of regression models, the dependant variable is the time spent by a person in a particular state - the duration of an unemployment spell for instance - and the explanatory variables are the personal characteristics of this person. The semiparametric analysis of these models consists in specifying the relation between the duration and the explanatory variables (duration is supposed to be a specified function of the explanatory variables, depending on a finite number of unknown parameters) without specifying the data distribution. The parameters involved in this relation are then considered as parameters of interest, and the data distribution is a nuisance parameter. The thesis begins with a survey of nonbayesian semiparametric methods of estimation; it seems that these methods fail in discarding the nuisance data distribution. We then suggest a bayesian method, the principle of which is to give a prior distribution on the nuisance parameter - the data distribution. We then get semiparametric estimators for the parameters of interest, by computing their posterior distribution, conditional on the data and integrated with respect to the nuisance parameter. The thesis ends with a simulation, to check the robustness of the estimators we propose.
Abstract FR:
Nous proposons une analyse semi-paramétrique des modèles de durée. Dans ces modèles de régression particuliers, la variable expliquée est le temps qu'un individu passe dans un état donné - par exemple le temps passé au chômage - et les variables explicatives sont les caractéristiques personnelles de cet individu. L'analyse semi-paramétrique de ces modèles consiste à paramétrer la relation entre la durée et les variables qui la déterminent (la durée est supposée être une fonction des variables explicatives, entièrement spécifiée et dépendant de paramètres inconnus) tout en laissant indéterminée la distribution des durées. Les paramètres intervenant dans la relation entre les variables ont alors le statut de paramètres d'intérêt, et la distribution des durées est considérée comme un paramètre nuisible. La thèse commence par une revue des méthodes employées par la statistique classique; il apparait que ces méthodes ne permettent pas d'éliminer le paramètre nuisible qu'est la distribution des durées. Nous proposons alors une approche baye- sienne, dont le principe est de munir le paramètre de nuisance - la distribution des durées - d'une distribution a priori. Nous obtenons ainsi des estimateurs semi- paramétriques pour les paramètres d'intérêt du modèle, en calculant leur distribution a posteriori, conditionnelle aux observations et marginalisée par rapport au paramètre nuisible. La thèse se termine par une simulation, où sont vérifiées les qualités de robustesse des estimateurs que nous proposons.