thesis

Reconnaissance globale de mots manuscrits arabes basée sur une recherche avec un dictionnaire

Defense date:

Jan. 1, 1998

Edit

Institution:

Rouen

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Dans ce document nous décrivons une méthode de reconnaissance globale des mots manuscrits arabes. L'acquisition des mots est effectuée par un scanner. Tout d'abord des indices visuels appelés primitives sont choisis sur le mot selon le critère de l'importance de l'information amenée et en privilégiant la facilité de calcul. Ces primitives sont codées par leur nombre d'apparition dans le mot, pour former un vecteur de caractéristiques. La variabilité de l'écriture donne des vecteurs différents pour le même mot, mais le codage des primitives peut regrouper des mots non ressemblants avec le même code. Le vecteur de caractéristiques est choisi avec 7 primitives qui donnent le nombre des traces, des alifs isolés, des boucles, des points situés au-dessus et au-dessous de trace, des hampes et des jambes. Pour générer les vecteurs proches du mot recherché, la variation du nombre des primitives dans le mot est analysée. On évalue le degré de ressemblance des vecteurs proches pour classer les candidats dans une liste selon le nombre de leurs primitives. Deux méthodes aux performances similaires sont retenues. La première est la fonction discriminante qui est une fonction linéaire des écarts entre le nombre de primitives de deux vecteurs. Les coefficients de cette fonction discriminante sont proportionnels à la variance des primitives. La deuxième méthode est la distance de Mahalanobis, qui est une fonction quadratique des écarts entre le nombre de primitives de deux vecteurs. Les résultats pour les deux méthodes sont semblables. Le dictionnaire est construit avec une structure d'arbre binaire de recherche ou chaque nœud contient un vecteur de primitives avec l'ensemble des mots qui sont associes a ce vecteur. Le parcours de l'arbre est très rapide et les comparaisons avec les mots du dictionnaire sont effectués avec le calcul du degré de ressemblance. Tout en ayant un nombre très faible de modèles dans le dictionnaire, la génération des vecteurs proches nous donne les moyens de rechercher toutes les possibilités. Les résultats sont analysés avec l'augmentation du nombre de modèles de mots des différents scripteurs dans le dictionnaire et en élargissant l'intervalle de recherche.