Machines a vecteurs de support pour la reconnaissance des formes : proprietes et applications
Institution:
Paris 13Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these est consacree aux machines a vecteurs de support (svm), algorithme d'apprentissage statistique propose par vapnik en 1995. L'algorithme svm repose sur l'idee de plonger les donnees dans un espace de caracteristiques via une fonction non lineaire (appele noyau de hilbert-schmidt) puis de calculer dans cet espace une surface de decision lineaire (appelee hyperplan optimal). Dans la premiere moitie de la these, apres une breve presentation de l'algorithme svm, nous discutons les differentes strategies d'optimisation envisageables pour le mettre en uvre et nous proposons un etat de l'art en svm en trois domaines : analyse des ameliorations a l'algorithme, liens entre les svms et autres methodes de l'apprentissage statistique et applications des svms. La deuxieme partie est consacree aux experimentations. Les classifieurs svm sont testes et compares avec d'autres algorithmes sur plusieurs problemes de caracteristiques diverses, notamment identification de chiffres manuscrits et identification de visages. Nous profitons des proprietes de la svm lineaire pour proposer une methode de nettoyage automatique de bases de donnees. Ensuite, nous realisons une analyse de l'influence sur la qualite d'estimation des differents parametres qui definissent une svm pour la regression. Nous proposons une approche locale pour la regression qui ajuste automatiquement sa precision en fonction des caracteristiques locales du bruit. Cette approche est testee et comparee avec d'autres algorithmes sur un probleme de regression simple et sur deux problemes de prevision de series temporelles de taille et caracteristiques diverses. Les resultats montrent que l'approche locale est tres utile lorsque la distribution du bruit present dans les donnees depend des entrees. En general, les resultats situent les svm, aussi bien en classification qu'en regression, parmi les meilleures methodes dans tous les problemes testes.