Classification probabiliste par reseaux de neurones ; application a la reconnaissance de l'ecriture manuscrite
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these decrit une contribution a la realisation d'un systeme automatique de reconnaissance des montants litteraux de cheques, en ecriture manuscrite cursive. Parmi les nombreuses phases de traitement de l'information necessaires pour leur reconnaissance, nous nous interessons uniquement, dans ce travail, a la phase de classification: notre objectif est de fournir, pour chaque caractere, une liste d'identifications possibles, par ordre de vraisemblance decroissante. Cette liste est ensuite traitee par un systeme superviseur qui, a partir de plusieurs informations differentes, prend une decision de reconnaissance du montant. Le probleme pose est donc essentiellement un probleme d'estimation de probabilite d'appartenance d'une lettre inconnue a une classe parmi plusieurs possibles. Jusqu'a present, les classifieurs a base de reseaux de neurones ont ete utilises essentiellement pour prendre une decision ; pourtant, les proprietes mathematiques fondamentales des reseaux de neurones en font d'excellents candidats pour effectuer une estimation de probabilites. Notre travail a donc porte sur la recherche de methodes permettant d'estimer, a l'aide de reseaux de neurones, en disposant d'une base d'apprentissage necessairement limitee, les probabilites a posteriori des classes. Dans un premier temps, nous etablissons une distinction entre, d'une part, les systemes permettant une estimation directe des probabilites a posteriori, et, d'autre part, les classifieurs bayesiens, qui necessitent l'estimation des densites conditionnelles. Dans ce dernier cas, nous proposons des solutions originales permettant notamment l'estimation des densites conditionnelles a partir de fonctions discriminantes. Puis, nous presentons la classification probabiliste (bayesienne ou non) a l'aide de reseaux de neurones. Nous presentons, en premier lieu, les approches qui utilisent les architectures classiques telles que les perceptrons multi-couche et les reseaux a fonctions radiales de base. Nous presentons ensuite une methode originale qui consiste a decomposer un probleme multi-classe en un ensemble de problemes a deux classes, et a determiner les probabilites a posteriori a partir de celles qui sont estimees par les classifieurs a deux classes. Cette approche represente une alternative aux architectures precedemment citees, qui presente l'avantage d'etre modulaire et rapide a mettre en uvre. Enfin, dans le cadre de notre probleme de reconnaissance de cheques, nous montrons les effets que peuvent avoir les differentes methodes deja evoquees, pour la reconnaissance des caracteres, ainsi que pour la reconnaissance des mots qui l'emploie. Nous nous sommes attaches alors plus particulierement a la pertinence des mesures de performances, ainsi qu'au choix de la fonction de cout