Méthodes de sélection de collections dans un environnement de recherche d'informations distribuée
Institution:
Saint-Etienne, EMSEDisciplines:
Directors:
Abstract EN:
The topic of this thesis relates to the field of distributed information retrieval. A simple distributed information retrieval system (DIRS) is made up of servers containing document collections and a broker. Tipically, a user submits a request to the broker, which then forwards the query to a carefully selected subset of servers likely to contain relevant documents to the query. This operation is called server selection. Each selected server processes the query and returns a ranked list of results to the broker. Finally, the broker merges the result lists received into a single list and forwards it the user. We propose in this thesis three methods of server selection. These methods do not require server cooperation, and do not use any pre-stored metadata.
Abstract FR:
Le thème de cette thèse concerne le domaine de la recherche d'information distribuée (RID). Un système de RID (SRID) de recherche d'information distribuée gère la recherche sur un ensemble de collections de documents distribuées soit sur un réseau local, soit sur un ensemble plus étendu. Un SRID se compose, en général, d'un courtier et d'un ensemble de serveurs. Chaque serveur détient une collection de documents et un système de recherche d'information qui assure la recherche dans cette collection. Le courtier représente la composante avec laquelle l'utilisateur communique. A la réception d'une requête, le courtier choisit un sous-ensemble de serveurs parmi ceux qu'il connaît, auxquels il achemine la requête. Cette opération est appelée sélection de serveurs. Nous proposons dans cette thèse trois méthodes de sélection de serveurs. Ces méthodes ne nécessitent aucune coopération des serveurs interrogés, et aucune mise à jour de données au niveau du courtier.