Identification automatique de types de formulaires par des méthodes stochastiques markoviennes
Institution:
Le HavreDisciplines:
Directors:
Abstract EN:
Identification of forms is a significant operation of an automatic system of reading. No distinctive sign is supposed to mark the form. The treatment starts with the extraction of the rectangular blocks of texts or rectangles including the drawings or the images. Since the forms include handwritten fields, the position, dimensions of the rectangular blocks present are variable. The phenomena of merging and fragmentation resulting from the segmentation induce an additional variability in the number of the rectangles. This double variability of the rectangles is naturally random. A first statistical method carries out the recognition by the calculation of a distance, which generalizes the Mahalanobis distance. Learning requires taking care of the phenomenon of merging/fragmentation. This statistical model appears to be actually a Markovian stochastic model of order 0. A second stochastic method rests on the construction of planar hidden Markov models (PHMM: Pseudo-2D Hidden Markov Model). We describe in particular a new unsupervised training of the states number by a dynamic aggregation method. The recognition is based on the estimation of the conditional probability calculated by an extension of a doubly imbricated Viterbi algorithm. For the two methods, we sought to make automatic all the phases of the training and the recognition. The experimental results confirm the validity of the two methods
Abstract FR:
L'identification de formulaires est une opération importante de la chaîne de traitement d'un système de lecture automatique. Aucun signe distinctif n'est supposé marquer le formulaire. Le traitement commence par l'extraction des blocs rectangulaires de textes ou de rectangles englobant les dessins ou les images. Etant donné que les formulaires comprennent des champs manuscrits, la position, les dimensions des blocs rectangulaires présents sont variables. Les phénomènes de fusionnement et de fragmentation résultant de la segmentation induisent une variabilité supplémentaire dans le nombre des rectangles. Cette double variabilité des rectangles, présentent un caractère aléatoire. Une première méthode, de nature statistique, effectue la reconnaissance par le calcul d'une distance, qui généralise celle de Mahalanobis, entre la forme inconnue et un modèle déterminé par appariement dans chaque classe. L'apprentissage nécessite la délicate prise en compte du phénomène de fusionnement/fragmentation. Ce modèle statistique se révèle être en réalité un modèle stochastique markovien d'ordre 0. Une deuxième méthode, de nature stochastique, repose sur la construction de modèles de Markov cachés planaires (PHMM : Pseudo-2D Hidden Markov Model). Nous décrivons notamment un nouvel apprentissage non supervisé du nombre d'états par une méthode d'agrégation dynamique. La reconnaissance est basée sur l'estimation de la probabilité conditionnelle calculée par une extension de l'algorithme de Viterbi doublement imbriqué. Pour les deux méthodes, nous avons cherché à rendre automatiques toutes les phases de l'apprentissage et de la reconnaissance. Les résultats expérimentaux confirment la validité des deux méthodes