thesis

Vers une indexation structurée basée sur des syntagmes nominaux : impact sur un SRI en vietnamien et la RI multilingue

Defense date:

Jan. 1, 2004

Edit

Disciplines:

Authors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Notre travail a pour objectif de proposer un modèle unifié pour la recherche d'information multilingue. Nous proposons un modèle d'indexation structurée basée sur des syntagmes nominaux dans le but d'augmenter la précision du système. Ce modèle a été étendu pour le multilinguisme. Nous avons utilisé un analyseur morpho-syntaxique pour extraire et structurer des syntagmes nominaux des documents et des requêtes, sous la forme [Tête, modifieurs]. Cette structure permet de pondérer l'importance d'un terme selon son rôle dans le syntagme. De plus, nous proposons un ensemble de règles de décomposition de syntagmes en ensemble de sous syntagmes plus petits, qui sont organisés sous la forme de réseau Bayésiens qui servent de base pour la phase d'interrogation. La fonction de correspondance est calculée en se basant sur les probabilités de déduire les syntagmes de requête, à partir leurs sous syntagmes présents dans un document donné. Pour le multilinguisme, le réseau de la requête est transformé d'une langue source vers une autre langue cible en se basant sur les nœuds qui composent deux termes, en utilisant un dictionnaire bilingue et un thésaurus de co-occurrences de termes.