thesis

Covariance estimation and study of models of deformations between distributions with the Wasserstein distance

Defense date:

Jan. 1, 2014

Edit

Institution:

Toulouse 3

Disciplines:

Abstract EN:

The first part of this thesis concerns the covariance estimation of non stationary processes. We are estimating the covariance in different vectorial spaces of matrices. In Chapter 3, we give a model selection procedure by minimizing a penalized criterion and using concentration inequalities, and Chapter 4 presents an Unbiased Risk Estimation method. In both cases we give oracle inequalities. The second part deals with the study of models of deformation between distributions. We assume that we observe a random quantity epsilon through a deformation function. The importance of the deformation is represented by a parameter theta that we aim to estimate. We present several methods of estimation based on the Wasserstein distance by aligning the distributions of the observations to recover the deformation parameter. In the case of real random variables, Chapter 7 presents properties of consistency for a M-estimator and its asymptotic distribution. We use Hadamard differentiability techniques to apply a functional Delta method. Chapter 8 concerns a Robbins-Monro estimator for the deformation parameter and presents properties of convergence for a kernel estimator of the density of the variable epsilon obtained with the observations. The model is generalized to random variables in complete metric spaces in Chapter 9. Then, in the aim to build a goodness of fit test, Chapter 10 gives results on the asymptotic distribution of a test statistic.

Abstract FR:

La première partie de cette thèse est consacrée à l'estimation de covariance de processus stochastiques non stationnaires. Le modèle étudié amène à estimer la covariance du processus dans différents espaces vectoriels de matrices. Nous étudions dans le chapitre 3 une méthode de sélection de modèle par minimisation d'un critère pénalisé en utilisant des inégalités de concentration, et le chapitre 4 présente une méthode basée sur l'estimation sans biais du risque. Dans les deux cas des inégalités oracles sont obtenues. La seconde partie de cette thèse concerne l'étude de modèles de déformations entre distributions. On suppose observer une quantité aléatoire epsilon à travers une fonction de déformation. C'est l'importance de la déformation, représentée par un paramètre theta, que l'on cherche à retrouver. Nous présentons plusieurs méthodes d'estimation basées sur la distance de Wasserstein en alignant les lois des observations pour retrouver le paramètre de déformation. Dans le cas où les variables aléatoires sont à valeurs réelles, le chapitre 7 donne des propriétés de consistance pour un M-estimateur et sa distribution asymptotique. On y utilise des techniques de Hadamard différentiabilité pour appliquer une Delta-Méthode fonctionnelle. Le chapitre 8 concerne l'étude d'un estimateur de type Robbins-Monro et présente des propriétés de convergence pour un estimateur à noyau de la densité de la variable epsilon obtenu à l'aide des observations. Le modèle est généralisé à des variables dans des espaces métriques complets dans le chapitre 9, puis, dans l'optique de créer un test d'adéquation, le chapitre 10 donne des résultats sur la distribution asymptotique d'une statistique de test.