thesis

Apprentissage par proportion analogique

Defense date:

Jan. 1, 2007

Edit

Institution:

Rennes 1

Disciplines:

Authors:

Directors:

Abstract EN:

The work presented in this thesis lies within the scope of reasoning by analogy. We are interested in the analogical proportion (A is to B as C is to D) and we describe its use and especially its contribution in machine learning. Firstly, we are interested in defining exact analogical proportions. Then, we tackle the problem of defining a new concept, the analogical dissimilarity which is a measure of how close four objects are from being in analogical proportion, including the case where the objects are sequences. After having defined the analogical proportion, the analogical dissimilarity and the approximate resolution of analogical equations, we describe two algorithms that make these concepts operational for numerical or symbolic objects and sequences of these objects. We show their use through two practical cases : the first is a problem of learning a classification rule on benchmarks of binary and nominal data ; the second shows how the generation of new sequences by solving analogical equations enables a handwritten character recognition system to rapidly be adapted to a new writer.

Abstract FR:

Les travaux présentés dans cette thèse s’inscrivent dans le cadre du raisonnement par analogie. Nous nous intéressons à la proportion analogique (A est à B ce que C est à D) et nous décrivons son utilisation et surtout son apport en apprentissage artificiel. Nous abordons tout d’abord le cas des proportions analogiques exactes. Ensuite, nous nous attachons plus particulièrement à définir une nouvelle notion, la dissemblance analogique qui mesure si quatre objets sont éloignés d’être en proportion analogique, et à l’appliquer en particulier à des séquences. Après avoir défini la proportion analogique, la dissemblance analogique et la résolution approchée d’équations analogiques, nous décrivons deux algorithmes qui rendent opérationnels ces notions d’apprentissage et de résolution pour des objets numériques ou symboliques et pour des séquences de ces objets. Nous montrons ensuite leur efficacité au travers de deux cas pratiques : le premier est l’apprentissage d’une règle de classification par proportion analogique pour des objets décrits par des attributs binaires et nominaux ; le second montre comment la génération de nouveaux exemples (par résolution approchée d’équations analogiques) peut aider un système de reconnaissance de caractères manuscrits à s’adapter très rapidement à un nouveau scripteur.