thesis

Reconnaissance de l'écriture manuscrite : extension à de grands lexiques de l'analyse de la forme globale des mots

Defense date:

Jan. 1, 1990

Edit

Institution:

Paris 6

Disciplines:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Dans le cadre d'un système de reconnaissance mono-scripteur, notre travail concerne les traitements morphologiques des mots manuscrits. Son objectif principal est de montrer que ces traitements sont réalisables, sans limiter le vocabulaire du scripteur, à partir d'un ensemble réduit de formes de mots connues. Les traitements envisages constituent une pré-reconnaissance de la forme globale des mots: ils doivent délimiter l'ensemble des mots candidats traite par des analyses ultérieures. On sélectionne, d'abord, des séquences fréquentes de lettres (ou n-grammes), pour constituer l'ensemble des n-grammes de référence permettant de recouvrir tous les mots du vocabulaire utilisé. Cette sélection, qui minimise le nombre de mots d'apprentissage, se prête bien au traitement de grands vocabulaires. Les analyses des traces des mots portent sur leur forme globale, à l'aide d'approximations appelées profils. On détermine les profils des n-grammes de référence par segmentation des profils des mots d'apprentissage. Une première méthode de pré-reconnaissance s'appuie sur une partition du vocabulaire regroupant les mots qui, pour le scripteur donne, ont de fortes chances de se ressembler. On associe, à chaque classe, un profil prototype en vue de la reconnaissance. La trop grande variabilité des profils nous a incités à élaborer une nouvelle méthode, évitant de synthétiser ces prototypes. Elle consiste à rechercher directement les profils des n-grammes de référence qui correspondent à telle portion du profil du mot inconnu. Cela permet d'ordonner les mots du vocabulaire pour constituer l'ensemble candidat; un mot donné sera d'autant mieux place que les n-grammes qui le constituent et leurs emplacements sont compatibles avec les correspondances trouvées. Cette nouvelle méthode donne des résultats satisfaisants. Des vocabulaires étendus peuvent être traités avec des listes réduites de mots d'apprentissage.