thesis

Solutions basées sur les réseaux pour la recherche d'experts

Defense date:

Jan. 1, 2011

Edit

Institution:

Nice

Disciplines:

Abstract EN:

This thesis addresses expert finding task – the problem of identifying the right person with the appropriate skills and knowledge. Experts can be required for a variety of purpose : problem solving, question answering, providing more detailed information on a topic, to name a few. State-of-the-art expertise retrieval algorithms identify matching experts based on analysis of textual content of documents experts are associated with. While powerful, these models ignore and information networks between experts and between documents that might be available. In this thesis we utilize network structure expert finding and propose several novel solutions for this and related task. First, we argue that in a real –world setting the notion of the “best expert” also depends on the individual user and her needs. We propose a user-oriented approach that balances two factors that influence the user’s choice : time to contact an expert, and the knowledge value gained after. We use the distance between the user and an expert in a social network to estimate contact time, and consider various social graphs. Using a realistic test set, we demonstrate improvements over 50% against the state-of-the-art baseline on all retrieval measures. Second, we develop a generative model that model expert’s social connections along with the associated textual content. The model assumes that social links are determinate by expertise similarity between candidates. As a result, social links boost confidence about person’s level of expertise if she is connected to persons with the same expertise. The proposed model demonstrates the improved (over 27% on mean average precision) retrieval performance against the baseline. Finally, we also demonstrate a solution for the related task –person name disambiguation – that frequently appears when indexing documents associated with experts sharing the same name. We assume that expert finding system operates on a set of linked documents – the Web. We aim to assist expert finding system in disambiguating person names and propose a graph-based solution that clusters Web pages according to different people sharing the name. Our algorithm took the second place in the third Web people Search campaign among 8 competitors with total 27 submitted runs according to the official performance ranking. Presented solutions can be extended to a more general task of entity retrieval.

Abstract FR:

Cette thèse s’intéresse au problème de la recherche d’experts qui consiste à identifier la personne ayant les compétences recherchées. Les experts peuvent être sollicités pour diverses raisons : résoudre un problème, répondre à une question donnée relevant de leur domaine de compétence, fournir des informations plus détaillées sur un sujet, pour n’en citer que quelques exemples. Les algorithmes de l’état de l’art de la recherche d’experts identifient des experts correspondant au sujet souhaité en analysant le contenu textuel des documents où les experts sont associés. Bien qu’ils soient des outils puissants, ces modèles ignorent les réseaux sociaux et les réseaux d’informations entre experts d’un côté, et de l’autre côté entre les documents disponibles dans de tels réseaux. Dans cette thèse, nous utilisons la structure du réseau pour la recherche d’experts et nous proposons des solutions originales à ce problème et à une tâche similaire. Premièrement, nous postulons que dans un contexte réel la notion de « meilleur » expert dépend aussi de l’utilisateur et de ses besoins. Nous proposons une approche orientée utilisateur qui pondère deux facteurs qui influencent le choix de l’utilisateur : le temps de contacter un expert, et la valeur des connaissances acquises après. Nous utilisons la distance entre l’utilisateur et un expert dans un réseau social afin d’estimer le temps de la prise de contact, et nous considérons différents graphes sociaux. Nous montrons des améliorations supérieures de 50% par rapport à l’état de l’art, et ce, pour toutes les mesures de performance de recherche. Deuxièmement, nous développons un modèle génératif dont les liens sociaux d’expert sont modélisés avec le contenu textuel associé. Le modèle suppose que les liens sociaux sont déterminés par similarité d’expertise entre les candidats. En conséquence, les liens sociaux renforcent la confiance sur le niveau d’expertise de la personne si elle est connectée à des personnes avec les mêmes compétences. Le modèle proposé démontre la performance de recherche améliorée (plus de 27% en précision moyenne) par rapport à un résultat de référence. Enfin, nous montrons une solution à un problème lié désambiguïsation de noms de personnes – qui apparaît fréquemment lorsque l’indexation des documents associés à des experts partageant le même nom. Nous supposons que le moteurs de recherche d’experts fonctionne sur un ensemble de documents liés – le Web. Afin d’aider à un moteur de recherche d’experts de désambiguïser les noms de personnes, nous proposons une solution basée sur les graphes qui regroupe les pages Web selon les différentes personnes partageant le nom. Notre algorithme a été classé deuxième dans la troisième campagne de recherche des gens sur le Web parmi 8 concurrents avec un total de 257 essais soumis selon le classement de performance officiel. Les solutions présentées dans cette thèse peuvent être étendues à un problème plus général de la recherche d’entités.