Apprentissage et filtrage syntaxico-sémantique de syntagmes nominaux pertinents pour la recherche documentaire
Institution:
Paris 13Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Nous proposons un systeme d'extraction de groupes nominaux qui s'appuie sur la syntaxe et la semantique, et qui aide a la mise a jour de thesaurus ou la creation d'index libres. L'originalite du systeme tient a la possibilite de faire varier la forme des groupes nominaux recherches, relativement a un centre d'interet. Ce dernier est concretise par un profil de filtrage. Il est ainsi possible de definir plusieurs points de vue sur un seul document, qui se traduisent par autant d'ensembles differents de groupes nominaux extraits du document. Le systeme doit donc etre calibre pour un champ d'investigation determine (domaine d'activite, type de document) avant d'etre exploite. Il requiert de l'operateur (documentaire, terminographe,. . . ) une participation active pour la mise au point des profils de filtrage. Ces profils sont definis en fournissant au systeme des exemples de groupes nominaux recherches (dits pertinents) et de groupes nominaux non pertinents. Une procedure d'apprentissage construit ensuite une modelisation linguistique des syntagmes consideres pertinents. L'evaluation de la pertinence des syntagmes nominaux repose sur une description syntaxicosemantique de leurs dependances lexico-syntaxiques elementaires. Le filtrage des dependances syntaxiques non pertinentes est effectue en procedant a des elagages syntaxiques dans les arbres des syntagmes a filtrer. Les groupes nominaux sont ainsi depouilles de proprietes linguistiques declarees non pertinentes dans le profil de filtrage. Notre experimentation montre que l'utilisation d'informations semantiques combinees avec des informations de structure syntaxique accroit notablement les performances du filtrage des syntagmes nominaux.