thesis

Inférence grammaticale pour l'apprentissage de la syntaxe en reconnaissance de la parole et dialogue oral

Defense date:

Jan. 1, 2001

Edit

Institution:

Rennes 1

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Le contexte global de la thèse (réalisée dans le cadre de la convention CTI 97-1b-004, signée avec France Telecom) est l'apprentissage automatique de la syntaxe pour de la reconnaissance de la parole dans l'interaction orale entre l'homme et l'ordinateur. Le travail décrit dans ce document consiste à construire des modèles de langage, qui serviront de filtres syntaxiques à un ensemble d'hypothèses issues des étages situes en amont du processus de reconnaissance. Les modèles proposés sont des grammaires régulières. Elles constituent une alternative aux modèles utilisés couramment qui s'appuient uniquement sur la fréquence d'apparition des groupes des mots. Le travail de recherche est focalisé d'une part sur l'aspect algorithmique des techniques d'apprentissage appliqués aux grammaires formelles (inférence grammaticale), d'autre part sur la méthodologie d'intégration de ces modèles dans le processus de reconnaissance. Il est distribué selon quatre axes : L’utilisation d'un algorithme particulier (ECGIA) pour apprendre des modèles de langage à partir des corpus, par le biais de techniques de correction d'erreurs. Deux paramétrages originaux ont été proposés pour cet algorithme : l'un fondé sur les connaissances à priori, l'autre sur une approche entièrement automatique à l’élaboration d'une technique de lissage des grammaires apprises. Elle est indispensable à l'évaluation et à l'utilisation de ces modèles dans le cas d'insuffisance des données d'apprentissage (cas courant). Parallèlement, nous avons élaboré puis utilisé une méthode d'évaluation des grammaires non-stochastiques, fondée sur les techniques de correction d'erreurs ; elle permet de comparer leur pouvoir de généralisation à la transposition des techniques de clustering