Utilisation conjointe de réseaux neuronaux et de connaissances explicites pour le décodage acoustico-phonétique
Institution:
AvignonDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Les travaux presentes dans cet ouvrage sont consacres a l'application de methodes connexionnistes dans un systeme de decodage acoustico-phonetique (dap). Ce n'est que depuis quelques annees, que les reseaux neuronaux sont utilises dans de nombreux domaines. Une etude comparative des modeles les plus courants est effectuee en se basant sur une definition generale. La parole est un domaine d'application qui est souvent aborde pour la validation des theories neuromimetiques. Cependant, de nombreuses caracteristiques de cette activite humaine, telles que l'imparfaite connaissance du domaine, la distorsion temporelle des evenements de parole et la continuite du signal, sont des inconvenients majeurs qu'il a fallut prendre en compte. L'integration du parametre temps se fait soit en donnant aux reseaux une architecture particuliere, soit en lui associant des methodes plus resistantes a ce genre de problemes. Pour notre part, nous avons choisi d'utiliser conjointement une base de regles prolog II et des reseaux neuronaux pour constituer un systeme de dap prevu pour fonctionner en parole continue. A cet effet, l'environnement dont nous disposions, adapte au traitement de connaissances numeriques et symboliques dans le cadre de la reconnaissance automatique de la parole, a ete modifie afin de gerer des reseaux multi-couches et auto-generateurs. Dans notre application, les regles dirigent l'apprentissage en choisissant les exemples pertinents dans une base de sons. En situation de reconnaissance, leur role essentiel est de decrire la structure des sons ; elles selectionnent dans le signal d'entree des reseaux et interpretent leurs sorties en fonction du contexte. Des strategies differentes ont ete mises en place pour localiser et identifier les voyelles, les fricatives et les occlusives (en accord avec les particularites acoustiques de chaque macro-classe) ; plusieurs architectures de reseaux ont ete parallelement testees