Knowledge Tree

thesis

Analyse d'images de documents complexes et identification de scripts : cas des documents administratifs

Defense date:

Jan. 1, 2010

Edit

Institution:

La Rochelle

Disciplines:

Computer sciences

Authors:

Mohamed Benjelil

Directors:

Rémy Mullot

Abstract EN:

This thesis describes our work in the field of multilingual multi-script complex document image segmentation: case of official documents. We proposed texture-based approach. Two different subjects are presented: (1) document image segmentation; (2) Arabic and Latin script identification in printed ant/ or handwriten types. The developed approaches concern the flow of documents that do not obey to a specific model. Chapter 1 presents the problematic and state of the complex document image segmentation and script identification. The work described in chapter 2 aimed at finding new models for complex multilingual multi-script document image segmentation. Algorythms have been developed for the segmentation of document images into homogeneous regions, identifying the script of textual blocs contained in document image and also can segment out a particular object in an image. The approach is based on classification on text and non text regions by mean of steerable pyramid features. Chapter 3 describes our work on official documents images segmentation based on steerable pyramid features. Chapter 4 describes our work on Arabic and Latin script identification in printed and/ or handwritten types. Experimental results shows that the proposed approaches perform consistently well on large sets of complex document images. Examples of application, performance tests and comparative studies are also presented.

Abstract FR:

Ce document présente nos travaux sur les méthodes d'analyse d'images de documents multilingues multi-script : cas des documents administratifs à l'aide d'une approche texture. Deux thèmes sont abordés: (1) segmentation d'images de documents; (2) identification de scripts Arabe et Latin imprimés et / ou manuscrits. Les approches développés concernent le flux de documents tout venant dont la particularité est qu'il n'obéit pas à un modèle bien déterminé. Le premier chapitre présente la problématique et l'état de l'art de la segmentation et l'identification de script dans les documents complexes. Le second chapitre est consacré au développement d'outils méthodologiques pour la segmentation d'images de documents en régions. Dans le troisième chapitre nous présentons l'application de notre approche sur la segmentation des documents administratifs. Dans le quatrième chapitre nous présentons l'application de notre approche sur l'identification de script Arabe et Latin imprimés et/ ou manuscrits. Trois objectifs distincts sont envisagés: (1) la segmentation complète de l'image, (2) l'identification du script du contenu textuel de l'image du document, (3) la possibilité d'extraire un objet particulier dans l'image. L'approche adoptée est basée sur la classification des régions à l'aide des caractéristiques extraites de la décomposition en pyramide orientale. Les résultats obtenus au cours de cette thèse convergent, tous, pour démontrer la capacité des approches proposés à l'analyse et à la caractérisation d'images de documents complexes. Des exemples d'application, des tests de performance et des études comparatives sont ensuites présentées.