Apprentissage de modèles Markoviens pour l'analyse de séquences
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Initially, Machine Learning allowed to learn models from labeled data. But, for numerous tasks, notably for the task of user modeling, if the available quantity of data is potentially without limit, the quantity of labeled data is almost nonexistent. Within the framework of this thesis, we are interested in the unsupervised learning of sequence models. The information of sequence constitutes the first level of structured data, where the data are no more simple vectors of characteristics. We propose approaches that we apply to the automatic learning of Hidden Markov Models ( HMMs) and Hierarchical HMMs (HHMMs). Our purpose is to learn simultaneously the structure and the parameters of these Markovian Models, to minimize the quantity of prior information necessary to learn them.
Abstract FR:
Initialement, l'apprentissage supervisé a permis d'apprendre des modèles à partir de données étiquetées. Mais, pour de nombreuses tâches, notamment dans le cadre de la modélisation utilisateur, si la quantité de données disponible est potentiellement sans limite, la quantité de données étiquetées est quasi-nulle. Dans le cadre de cette thèse, nous nous intéressons à l'apprentissage non-supervisé de modèles de séquences. L'information de séquence constitue le premier niveau de données structurées, où les données ne sont plus de simples vecteurs de caractéristiques. Nous proposons des approches d'apprentissage non-supervisé de séquences que nous appliquons à l'apprentissage automatique de modèles de Markov cachés (MMC) et modèles de Markov cachés hiérarchiques (MMCH) notamment. Notre but est d'apprendre simultanément la structure et les paramètres de modèles markoviens, pour minimiser la quantité d'information a priori nécessaire.