Segmentation robuste d'images de documents par une approche multiresolution : conception et validation d'une architecture parallele dediee
Institution:
NantesDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these s'inscrit dans le domaine de l'analyse automatique d'images de documents. Plus specifiquement, une methode generique a ete developpee pour l'extraction de la structure physique de document, principalement pour la localisation de lignes de texte et celle de blocs de lignes. L'originalite de ces travaux reposent sur deux points essentiels. En premier lieu, l'analyse est menee a differentes resolutions de l'image, garantissant ainsi une quasi independance des performances vis-a-vis de la taille des caracteres. Ensuite, le concept meme de modelisation de region de type texte a ete completement redefini. Cela a abouti a la conception d'un ensemble d'algorithmes capables d'extraire tout type de texte (imprime ou manuscrit) sur des documents montrant des caracteristiques tres diverses en termes de complexite et d'orientation. Ces documents peuvent egalement comporter certaines degradations jugees severes qui concernent le fond de l'image. Les traitements concus et developpes se decomposent principalement en deux phases. La premiere est l'extraction des bords des objets lineiques, correspondant a la fois aux lignes de texte et aux traits. La seconde phase est l'analyse topologique de ces bords pour reformer les mots, puis simultanement les lignes de texte et blocs de lignes. Les traitements au niveau pixel ont egalement fait l'objet d'une projection sur une architecture specifique. La regularite et le caractere local des algorithmes ont pu etre avantageusement exploites par l'elaboration d'une architecture de type matrice de processeurs