thesis

Apprentissage par analogie de structures d'arbres

Defense date:

Jan. 1, 2012

Edit

Institution:

Rennes 1

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Les travaux de cette thèse s'inscrivent dans la continuité des travaux faites sur le thème d'apprentissage par analogie dans le projet CORDIAL de l'IRISA. Les efforts précédents ont porté sur l'étude de la proportion analogique dans le cas des objets numériques et symboliques, puis dans le cas de séquences de ces objets, ainsi que sur l'utilisation de ces notions pour l'apprentissage. Nous nous intéressons ici, dans nos travaux, à l'application de ce concept en apprentissage automatique pour le Traitement automatique du langage naturel (TALN), notamment pour l'analyse syntaxique et pour la génération de la prosodie en synthèse de parole. Ceci nécessite de définir le concept de proportion analogique entre quatre structures d'arbres. Notre approche trouve son originalité dans l'utilisation des propriétés hiérarchiques des structures manipulées et dans l'utilisation de mesure de dissemblance analogique (DA) entre ces structures. Son intérêt réside donc dans son adaptation facile à différents contextes et différentes données, quand ceux-ci sont propices à une représentation arborescente. Dans ce cadre, deux algorithmes ont été mis en place pour calculer la DA entre quatre structures d'arbres et pour résoudre une équation analogique. Le principe de notre démarche réside à étendre la notion connue d'alignement entre deux arbres à quatre (ou un plus grand nombre) d'arbres et de profiter des propriétés de l'alignement lors de la définition de l'analogie sur les structures d'arbres en question. Les applications de notre démarche se sont attachées à des problèmes de traitement de langue, notamment en analyse syntaxique et la génération de paramètres prosodiques. Le principe est le même dans les deux cas. Pour ce faire, il est nécessaire de détecter une dissemblance analogique dans le domaine source et de faire l'hypothèse qu'elle pourrait s'appliquer dans le domaine cible. Les résultats se sont montrés encourageants dans leur globalité, en tout cas comparés à la méthode du plus proche voisin. De profondes améliorations sont encore nécessaires, principalement dans la complexité des algorithmes. Nous souhaitons que leur réalisation ultérieure permette d'appliquer cette méthode, qui nous semble prometteuse, à des problèmes variés.