Reseaux de neurones pour le traitement automatique du langage : conception et realisation de filtres d'informations
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Les travaux exposes dans ce memoire montrent comment les reseaux de neurones peuvent etre utilises dans une application operationnelle de filtrage de documents. Une partie importante de ce memoire est centree sur la problematique de representation des textes. Apres avoir montre que les textes pouvaient etre representes efficacement avec un faible nombre de mots clefs, nous montrons que la prise en consideration du contexte local de ces mots ameliore les performances. La classification est effectuee par des reseaux de neurones dont l'architecture est determinee automatiquement selon la representation choisie. Pour eviter le surapprentissage, une methode de regularisation s'avere indispensable pendant la phase d'apprentissage, d'autant plus que la taille des bases d'apprentissage est souvent limitee. Les evaluations effectuees a partir du corpus reuters-21578 et les resultats obtenus lors de notre double participation aux conferences trec-8 et trec-9 montrent la validite de notre approche. Ces travaux ont ete integres dans une application operationnelle de filtrage de depeches et ont permis de developper de nouvelles fonctionnalites qui tirent avantage du fait que la construction d'un nouveau filtre est entierement automatique des lors que l'on dispose d'une base de documents prealablement etiquetees.