thesis

Champs markoviens conditionnels pour l'étiquetage de séquences

Defense date:

Jan. 1, 2013

Edit

Institution:

Paris 6

Disciplines:

Authors:

Directors:

Abstract EN:

La thèse intitulée "Champs Markoviens Conditionnels pour l'étiquetage de séquences" porte sur la reconnaissance de séquences qui regroupe des applications aussi variées que la reconnaissance de parole, de caractères manuscrits, de vidéos, de gestes, de séries financières, de séquences biologiques, de données médicales, d'images de dimensions variables (empreintes, documents scannés), de données météorologiques ou encore industrielles (obtenues par des séries de capteurs). . . Cette thèse développe deux axes de recherches centrés sur un modèle statistique discriminant : le HCRF (Hidden Conditional Random Field). Le premier axe tire profit des avancées récentes survenues dans le domaine des réseaux de neurones. Ces modèles sont intégrables dans les modèles de séquences et permettent de dépasser les limitations intrinsèques des modèles linéaires. Par ailleurs, l'introduction d'états cachés dans des modèles purement discriminants a permis de mieux prendre en compte l'évolution temporelle du signal au sein d'une même classe. En s'appuyant sur ces deux idées, nous avons proposé un nouveau modèle, baptisé NeuroHCRF. Le second axe part du constat que la vaste majorité des travaux, dans la reconnaissance d'écriture manuscrite comme dans la reconnaissance de parole, n'optimise pas le critère utilisé pour évaluer la performance du modèle pour diverses raisons tant pratiques que théoriques. Nous montrons que certaines limitations à l'optimisation directe du critère d'évaluation peuvent être contournées en utilisant les algorithmes de maximisation de marge et définissons un nouvel algorithme d'apprentissage.

Abstract FR:

This thesis, entitled "Conditional Random Fields for sequence labeling", deals with sequential recognition. This task includes a wide range of applications such as speech recognition, handwriting recognition, video analysis, action decoding, stock analysis, biological sequences, medical data, meteorological data analysis, industrical process evolution modeling,. . . This thesis focused on two axes based on a discriminant statistical model : the HCRF (Hidden Conditional Random Field). The first axis takes advantage of the recent advances that occurred in the field of neural networks. These models can be integrated into sequential models and allow to overcome the inherent limitations of basic linear models. Moreover, the introduction of hidden states in purely discriminative models allow the modeling of the temporal evolution of the signal within the same class. Based on these ideas, we proposed a new model, called NeuroHCRFThe second axis start with the fact that most works, both in handwriting recognition and in speech recognition, does not optimize the criterion used to evaluate the model's accuracy for various practical and theoretical reasons. We show that some limitations of the direct optimization of the criterion can be circumvented by using maximum-margin approaches and defined a new training algorithm.