thesis

Reconnaissance de textes manuscrits à vocabulaire limité avec application à la lecture automatique des chèques

Defense date:

Jan. 1, 1991

Edit

Institution:

Rouen

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Les travaux décrits dans ce document concernent un système de reconnaissance off-line de mots manuscrits cursifs omni-scripteurs dans un vocabulaire limité appliqué à l'identification du montant littéral des chèques postaux. La première partie de ce document effectue une analyse bibliographique sur le thème: reconnaissance off-line de l'écrit manuscrit cursif. Elle s'attache à analyser les différents travaux réalisés à ce jour, dans les cinq modules qui composent un système de reconnaissance: segmentation du document, pré-traitements, représentation du texte à reconnaître, reconnaissance et post-traitements. La deuxième partie concerne les différents processus de localisation et de caractérisation des entités à reconnaître et l'approche de reconnaissance retenue pour l'identification des mots composant les sommes littérales des chèques. Les particularités de l'application et les données autorisées en entrée du processus de reconnaissance nous ont amené à élaborer une stratégie d'identification fondée sur la coopération des deux méthodes habituellement utilisées dans les systèmes de lecture automatique: les approches globale et analytique. L'approche globale effectue une reconnaissance des mots d'après leurs formes. Elle utilise une description arbitrairement appauvrie pour minimiser le problème de la variabilité de l'écriture omni-scripteurs et de la qualité d'écriture autorisée. L'approche analytique grâce à deux descriptions, la première élaborée à l'aide des lettres sûres et la deuxième constituée de toutes les lettres reconnues, complémente l'approche globale pour récupérer ses éventuels défauts. Ces deux modules de reconnaissance utilisent une entrée un même découpage des mots en segments-lettres réalisé par un processus de segmentation. La coopération entre les deux approches génère, pour chaque entité à reconnaître, des hypothèses de mots filtrées postérieurement par la grammaire particulière des montants des chèques. Tous les modules réalisés, ainsi que les approches de reconnaissance retenues sont évalués sur des données réelles issus des centres financiers de La Poste