Suivi de mouvements informationnels : construction, modélisation et simulation de graphes de citations, application à la détection de buzz
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette thèse a pour contexte général l'étude des mouvements informationnels sur le Web. La démarche retenue se base sur l'étude du graphe des citations entre sites d'information sur le Web selon trois axes principaux : la construction, l'analyse et la génération d'un graphe de citations. Pour construire le graphe de citations, nous proposons une méthode de crawling adaptée à l'extraction de corpus de relations de citations entre sources Web. La stratégie choisie se base sur une extraction exhaustive des publications des sources et un nettoyage des pages afin d'en extraire les liens hypertextes utiles. L'analyse du graphe extrait consiste en une méthode de caractérisation des noeuds du graphe, considérés comme des sources d'information ayant des comportements de publication distincts et nous permet d'en identifier quatre. L'objectif de nos travaux sur la génération de graphes de citations est d'obtenir des graphes réalistes, c'est-à-dire capables de reproduire les comportements de publication identifiés sur les données réelles. Ainsi, nous proposons un modèle suffisamment flexible et adaptable en imitant au mieux le processus de publication réel d'un article sur un site et l'implémentons en un outil de simulation. Enfin, nous proposons une mise en application de nos travaux dans le cadre d'une étude sur la détection de buzz. Nous étudions le concept de buzz en proposant une définition sur laquelle nous basons plusieurs formalisations adaptées aux données disponibles. L'interprétation des expérimentations effectuées nous conduit à attribuer les méthodes de détection proposées à des cas d'application spécifiques selon la sémantique qui peut leur être attribuée.