Approche probabiliste pour l'élaboration et la validation de systèmes de décision : application aux réseaux neuronaux
Institution:
Paris 9Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette thèse étudie les liens entre l'apprentissage supervisé et la régression. Comme exemple d'application, nous avons choisi les réseaux neuronaux de type perceptron multicouches pour résoudre des problèmes de discrimination et plus généralement d'approximation de fonctions. L'approche qui consiste à relier l'apprentissage supervisé et la régression, possède deux avantages: d'une part elle permet d'expliquer comment le formalisme de la théorie bayésienne de la décision peut être introduit dans le cadre de la discrimination; d'autre part elle permet d'utiliser des outils issus de la statistique. Le lien avec la théorie bayésienne est à l'origine de nouvelles approches modulaires pour résoudre des problèmes de discrimination, d'où une meilleure compréhension des structures de la base de données et un meilleur contrôle des qualités d'apprentissage (chaque module expert résout une tache locale de discrimination). A partir d'outils issus de la statistique, nous avons étudié les propriétés asymptotiques des estimateurs obtenus en régression non linéaire. Cette approche nous a permis de proposer de nouveaux outils pour concevoir et valider des systèmes élaborés lors d'un apprentissage supervisé. L'objectif principal est alors d'adapter la complexité du système à la quantité d'information (pertinente) présente dans l'échantillon d'apprentissage. Cet objectif nous amènera à présenter la notion de généralisation, qui caractérise la qualité d'approximation de la fonction de régression (l’espérance conditionnelle), i. E. Le comportement du système sur des données futures suivant la même loi que les données d'apprentissage. Cette thèse essaie de mettre en valeur en second point important: une procédure d'apprentissage sur un échantillon de taille finie est composée de deux étapes: 1) un algorithme d'optimisation pour déterminer les paramètres du système qui minimiserons une fonction d'erreur; 2) évaluer les capacités de généralisation du système (car il s'agit d'apprendre une relation statistique)