thesis

Contributions à la localisation adaptive de zones informatives sur des images de documents

Defense date:

Jan. 1, 2016

Edit

Institution:

Rouen

Disciplines:

Authors:

Directors:

Abstract EN:

Our contributions in this thesis are dealing with field spotting in colored document images. Our goal is to end up with a solution that automatically returns the right position of a region of interest (ROI), defined by a user on a reference document, into a flow of documents from the same class. As documents are provided from different and unknown sources, the position of the required information seems to be variable from an instance to another. Hence, absolute positions are considered as weak features to fill this kind of tasks. In this thesis, we propose a system that automatically localizes the information based on a relative position built with an adjacency graph. Our solution is divided into 3 modules: the first one is dedicated to turning the image into an adjacency graph built with immutable informative zones. This structure, independent of coordinates, is used to describe the position of the ROI as well as the structure of the target document. Our second contribution is related to the subgraph isomorphism tolerant to topology distortions. Our goal is to operationnalize the structure representation proposed above in order to get the best matching between the graph describing the ROI and a subgraph from the target graph describing the document layout. In the last module, we focus on an optimization problem and we propose a solution leading to evolve performances of our system by optimizing the parameters of the process line. Our technique is based on an evolutionary system and is able to be automatically adapted to the processed document class.

Abstract FR:

Nous présentons dans cette thèse nos contributions pour la localisation automatique d’informations dans des images de documents en couleur. Notre objectif est de proposer une solution qui permet de localiser automatiquement une information, préalablement définie par un utilisateur sur un document modèle, dans un flux entrant de documents de la même catégorie. Les documents étant susceptibles de provenir de différentes sources de numérisation dont nous ignorons les caractéristiques, nous proposons de caractériser l’information cible par un positionnement relatif, invariant aux translations et aux changements d’échelle. Le modèle proposé dans ce cadre repose sur un graphe d’adjacence de régions qui décrit l’agencement d’ancres de repérage extraites du document. Le graphe obtenu permet à la fois de décrire l’information recherchée mais aussi la structure du document cible, indépendamment des coordonnées géométriques. Notre seconde contribution est une formulation linéaire en nombres entiers du problème de recherche d’isomorphisme de sous-graphes tolérant aux erreurs. La résolution de cette formulation permet d’extraire le sous-graphe correspondant à l’information recherchée dans le document cible. Enfin, notre troisième contribution concerne l’optimisation des paramètres d’une chaîne de traitement pour améliorer la performance de la localisation de l’information. L’approche proposée, qui repose sur un algorithme évolutionnaire, permet au système de s’adapter automatiquement à la classe de document traitée.