Reconnaissance de l'écriture manuscrite : analyse de la forme globale des mots et utilisation de la morpho-syntaxe
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
Machine recognition of handwriting: global analyses of word shapes and morpho-syntactic evaluation,Machine recognition of handwriting aims at a goal which is not far-removed from human reading. The study of reading may thus provide uscful hints to as yet unsuccessful computer recognition of unrestricted handwriting. A writer oriented system (for a 10000 word vocabulary) has been developed in this framework and tested. It operates on the basis of interaction of full-word shape analyses and syntactic and lexical-semantic processing. The system comprises:• 1 mage transformations designed so as to enable global shape comparisons of scanned words. These transformations reOect the global shape of word images and not their internal structure thereby permitting to conduct shape comparisons within a given unrestricted handwriting. • A syntactic parser based on a markovian mode! whose rules emerge through training. Lt checks the grammaticality of candidate sentences which result from shape comparisons. • Semantic weighting of sen. Tences which are found grammatical. Lt is based on computing lexical co-occurrences in thematically organized textual data-bases.
Abstract FR:
La reconnaissance de l'écriture par un ordinateur et par un être humain (la lecture) présentent beaucoup de points communs. C'est pourquoi l'observation de la lecture a permis d'aborder d'une manière nouvelle le problème non résolu de la reconnaissance d 'une écriture manuscrite quelconque. Un système dont le but est une reconnaissance mono-scripteur sur un lexique de 10000 mots a été réalisé et testé. S'inspirant des recherches sur la lecture, ce système fait coopérer une analyse globale de la forme du mot, des traitements syntaxiques et un calcul de proximités lexico sémantiques. La reconnaissance morphologique utilise des transformations d'images de mots digitalisées permettant d’effectuer des comparaisons de forme globales. Ces transformations traduisent la forme globale de l'objet constitué par le mot indépendamment de sa structure interne (enchevêtrement des formes élémentaires qui le constitue). Ceci permet d'effectuer des comparaisons de forme à l'intérieur d’une écriture donnée quelle que soit celle-ci. Un analyseur syntaxique basé sur un modèle markovien à apprentissage permet d 'évaluer la grammaticalité des phrases proposées à l'issue de la reconnaissance morphologique. Les phrases grammaticalement correctes sont sémantiquement pondérées à l'aide d 'un calcul de cooccurrences lexicales effectué sur des bases textuelles thématiques.