Sélection non-paramétrique des régresseurs
Institution:
Toulouse 1Disciplines:
Directors:
Abstract EN:
This thesis deals with variable selection in regression models without specifying the functional form of the regression or the distribution of the data. A general framework is proposed to select among sets of regressors, whether the competing sets are nested, overlapping of non-nested. Our framework is based on the mean square error between the regression and the explained variable, which may be considered either locally for some values of the explanatory variables, or globally by averaging over possible values of the regressors. Some criteria for evaluating a model are proposed in these two cases. They are based on the nonparametric estimation of the regression function by the kernel method. A nonparametric decomposition-of-the-variance formula is obtained. In the case of global selection, the various proposed criteria have a parametric rate of convergence and are asymptotically efficient. Some hypothesis testing procedures are derived. These procedures are directional, consistent against all alternatives, and are valid when the regressions are non-nested, in a sense precisely defined.
Abstract FR:
Cette thèse s'intéresse à la sélection des variables explicatives dans un modèle de régression lorsque la forme de la régression et la distribution des variables sont inconnues. Un cadre théorique de la sélection de redresseurs est défini, permettant de discriminer entre différents ensembles de redresseurs, qu'ils soient emboités, imbriqués ou strictement non-emboités. La discrimination s'opère suivant l'erreur quadratique moyenne entre la régression et la variable expliquée, considérée soit localement pour des valeurs particulières des variables explicatives, soit globalement sur l'ensemble des valeurs possibles. Des critères d'évaluation des modèles sont proposés dans ces deux cas. Ils sont basés sur l'estimation fonctionnelle de la régression par la méthode du noyau. Une formule de décomposition non-paramétrique de la variance empirique est obtenue. Dans le cas de la sélection globale, les différents critères d'évaluation proposés ont une vitesse de convergence paramétrique et sont efficaces. Des procédures de tests d'hypothèse pour la sélection de redresseurs sont construites à partir de ces critères. Ces procédures sont directionnelles et convergentes contre toute alternative, et sont applicables lorsque les régressions sont non-emboitées, dans un sens défini précisément.