thesis

Reconnaissance de caractères par méthodes markoviennes et réseaux bayésiens

Defense date:

Jan. 1, 2004

Edit

Institution:

Paris, ENST

Abstract EN:

This thesis concerns printed and handwritten character recognition using Markovian models and Bayesian Networks. The first part consists in combining two hidden Markov models using semi-continuous and discrete HMMs. The first HMM is constructed using the vertical flow of writing (vertical HMM), while the second is obtained using the horizontal flow (horizontal HMM). Then we propose two fusion schemes: a decision fusion model which combines likelihoods resulting from both vertical and horizontal HMMs, and a fusion data model which consists in a unique HMM which takes as observations both the horizontal and vertical flows of writing. The results show the importance of the semi-continuous case and the performance of fusion models. In the second part, we introduce static and dynamic bayesian networks. Then we present the Jensen Lauritzen Olesen algorithm (JLO) used for exact inference, and parameters learning with full and partial observability. The new approach we propose for character recognition uses the formalism of dynamic bayesian networks (DBN). We build and test various models: single-flow HMMs, auto-regressive HMMs by coupling dynamically observations and coupled models coupling the two flows of writing. The results obtained show that coupled models perform better (up to 6 %) than single-flow models.

Abstract FR:

Cette thèse porte sur la reconnaissance de caractères imprimés et manuscrits par méthodes markoviennes et réseaux bayésiens. La première partie consiste à effectuer une modélisation stochastique markovienne en utilisant les HMMs classiques dans deux cas : semi-continu et discret. Un premier modèle HMM est obtenu à partir d'observations de type colonnes de pixels (HMM-vertical), le second à partir d'observation type lignes (HMM-horizontal). Ensuite nous proposons deux types de modèles de fusion : modele de fusion de scores qui consiste à combiner les deux vraisemblances résultantes des deux HMMs, et modèle de fusion de données qui regroupe simultanément les deux observations lignes et colonnes. Les résultats montrent l'importance du cas semi-continu et la performance des modèles de fusion. Dans la deuxième partie nous développons les réseaux bayésiens statiques et dynamiques, l'algorithme de Jensen Lauritzen Olesen (JLO) servant comme moteur d'inférence exacte, ainsi que l'apprentissage des paramètres avec des données complètes et incomplètes. Nous proposons une approche pour la reconnaissance de caractères (imprimés et manuscrits) en employant le formalisme des réseaux bayésiens dynamique. Nous construisons certaines types de modèles : HMM sous forme de réseau bayésien dynamique, modèle de trajectoire et modèles de couplages. Les résultats obtenus mettent en évidence la bonne performance des modèles couplés. En général nos applications nous permettent de conclure que l'utilisation des réseaux bayésiens est efficace et très prometteuse par le fait de modéliser les dépendances entre différentes observations dans les images de caractères.