thesis

Formalisation et spécification d'un système de filtrage incrémental d'information

Defense date:

Jan. 1, 2004

Edit

Institution:

Toulouse 3

Disciplines:

Authors:

Directors:

Abstract EN:

The context of this thesis work is information filtering systems. Information filtering monitors a stream of incoming documents to find those that match the user's information need called profile. Usually, in order to identify whether a document is relevant or not a score that measures the similarity between a document and a profile is computed. When the score is higher than the threshold the document is selected, otherwise it is rejected. Our contribution is profiles learning and the decision function adaptation. The profile learning consists in constructing at each arrival of relevant document, a temporary profile allowing to reselect the document of interest with the highest score. Afterward, This temporary profile, is integrated in the profile of the user. The decision function adaptation consists to estimate the scores discrete probabilities, then plot the scores distribution using a linear regression. After that, deduce the threshold that permits to optimize this function. The experiments are presented to validate the proposed methods. Keywords: incremental filtering, user profile, temporary profile, reinforcement score, profile learning, adpating decision function, probabilities distribution

Abstract FR:

Le contexte d'étude de cette thèse est "les systèmes de filtrage d'Information (SFI)". Un SFI permet d'extraire, à partir d'un flot d'informations, celles qui sont susceptibles de répondre aux besoins de l'utilisateur appelés profils. D'une façon générale, à chaque arrivée d'un document, un score de similarité entre celui-ci et le profil est calculé. Une fonction de décision permet ensuite de décider d'accepter ou de rejeter ce document. Notre contribution se situe dans l'apprentissage des profils et l'adaptation de la fonction de décision. L'apprentissage du profil consiste à construire pour chaque document pertinent sélectionné un profil temporaire permettant de retrouver ce document avec un score fort. Ce profil temporaire est ensuite intégré dans le profil de l'utilisateur. L'adaptation de la fonction de décision consiste à estimer les probabilités des scores et de tracer leur distribution par une régression linéaire. Ensuite, de déduire le seuil qui permet d'optimiser une fonction d'utilité. Des expérimentations ont été présentées pour valider les méthodes proposées.