Reconnaissance d'ecriture manuscrite dynamique par approche descendante - caracterisation du style de l'ecriture et application
Institution:
Rennes 1Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Dans le cadre de la realisation d'un bloc-note electronique, nous abordons la reconnaissance de mots manuscrits par une methode descendante inspiree par le processus humain de lecture. Nous procedons par reduction progressive des mots du lexique et nous cherchons ensuite a mettre en correspondance le mot manuscrit avec les mots candidats. Notre approche est holistique: les mots sont representes par leur silhouette sous forme de chaine de caracteres representant la succession des primitives. Alors que l'approche globale habituelle consiste a comparer la representation du mot manuscrit avec la representation de chaque mot du dictionnaire, nous etablissons toutes les representations d'un mot et nous precalculons leur distance. Ceci est rendu possible par une representation tres compacte des mots et par une evaluation fine de la distance. Dans la premiere reduction du lexique les primitives decrivent uniquement l'appartenance des segments descendants aux differentes parties d'un mot: corps, hampes, jambages ou f. Le lexique est organise sous forme de reseau de neurones associatif ce qui nous permet d'obtenir non seulement les mots ayant ete decrits par une silhouette a la construction du lexique, mais egalement les mots semblables. L'activation du reseau produit une liste de mots ordonnes selon leur distance a la silhouette initiale. Nous obtenons 67% des mots parmi les 10 premieres hypotheses sur un lexique de 6700 mots. Dans la deuxieme reduction du lexique la silhouette s'enrichit de primitives representant diverses formes de boucles. Les mots obtenus precedemment sont reordonnes, la proportion de mots corrects parmi les dix premiers passe a 86%. La derniere reduction utilise les signes diacritiques, elle permet d'ameliorer le score de 7%. La derniere phase de la reconnaissance suit une approche structurelle, elle opere une segmentation du trace guidee par les caracteres des mots candidats. Dans un contexte applicatif, la lecture automatique opere rarement sur des mots isoles ou pour un scripteur inconnu. Une des originalites de notre approche provient de l'utilisation d'informations globales sur le graphisme de l'ecriture et extraites sur le texte entier. Apres etude des correlations entre caracteristiques de l'ecriture, nous montrons la possibilite de definir des classes de scripteurs. L'etude des caracteristiques nous permet d'adapter les differentes etapes de la reconnaissance au scripteur au niveau extraction des primitives, codage du lexique et dans le futur l'adaptation des prototypes de caracteres au scripteur. Grace a cette adaptation nous avons ameliore les pourcentages concernant uniquement les differentes etapes de la reduction du lexique, nous obtenons 81%, 92% et 94% de mots classes parmi les 10 premiers