Contributions à la reconnaissance de l'écriture arabe manuscrite
Institution:
Paris 5Disciplines:
Directors:
Abstract EN:
This work deals with offline handwriting recognition. This task consists in automatically reading cursive words from an image. We present a recognition system for isolated handwritten Arabic words, given a lexicon. The recognition system is a hybrid Neural Networks (NN) a Hidden Markov Models (HMM), with grapheme segmentation. The originality of our approach is the way we deal with diacritical marks (dots and other secondary shapes). We have introduced a new shape-based alphabet designed to take advantage of redundancy of shapes of Arabic letters. We have demonstrated that on the considered application (recognition handwritten Tunisian city names with publicly available IFN/ENIT database), diacritical marks are not mandatory to perform a decent classification. Although diacritical marks are not mandatory, they still bring useful information. We also introduced a recognition procedure for diacritical marks, ai a combination strategy between recognition with and without diacritical marks. This combination significantly reduces the error rate. As a result, our recognition rates improve state of the art on this database, according to the training and testing procedure defined by the authors of the database. As an improvement, we discussed a strategy based on Weighted Finite State Machines (WFSM). We successfully applied this formalism on an easiei task : the recognition of French names written in capital letters. Those experiments confirm that this formalism easily integrates specific constraints P given application. We believe that the use of WFSM could be very helpful for the recognition of Arabic writing. This will be subject for further work
Abstract FR:
Ces travaux s'inscrivent dans le cadre de la reconnaissance manuscrite hors-ligne. Celle-ci consiste à déchiffrer des mots manuscrits présents dans une image. Nous proposons un système de reconnaissance de mots manuscrits arabes isolés, appartenant à un lexique. Ce reconnaisseur s'appuie sur un System hybride à base de Réseaux de Neurones (RN) et de Modèles de Markov Cachés (MMC) et une segmentation en graphèmes. L'originalité de notre approche tient à la stratégie d'utilisation des signes diacritiques (points et autres signes secondaires associés aux lettres). Nou: avons proposé un nouvel alphabet de corps de lettres qui permet de mieux exploiter les redondances des formes des lettres arabes. Nous avons ains montré que sur l'application considérée (reconnaissance de noms de villes tunisiennes à l'aide de la base publique IFN/ENIT), les signes diacritique n'étaient pas indispensables pour effectuer la tâche de classification. Bien qu'ils ne soient pas indispensables, les signes diacritiques apportent néanmoins une information supplémentaire. Nous avons donc également proposé une technique de reconnaissance des signes diacritiques, ainsi qu'une stratégie de combinaison entre reconnaissance sans diacritiques et reconnaissance avec diacritiques. Cette combinaison permet de réduire signitïcativemenl le taux d'erreur. Les performances obtenues par le systèir proposé sont les meilleures rapportées dans la littérature, selon le protocole expérimental défini par les auteurs de la base de données. Dans les pistes d'améliorations de ce système de reconnaissance en langue arabe, nous avons proposé une stratégie qui repose sur l'utilisation d'automates à états finis pondérés ( WFSM pour Weighted Finite State Machines). Nous avons utilisé ce formalisme avec succès sur une tâche plus simple de reconnaissance de noms de familles français écrits en lettres capitales. Nous avons ainsi pu vérifier que ce formalisme permettait d'inlég facilement des contraintes propres à la langue ou à l'application considérée. L'utilisation de WFSM pour la reconnaissance de l'écriture arabe semr. Prometteuse, et fera l'objet de travaux ultérieurs.