thesis

Cartographies pour la recherche et l'exploration de données documentaires

Defense date:

Jan. 1, 2006

Edit

Institution:

Montpellier 2

Disciplines:

Abstract EN:

This thesis is based on information visualization techniques in order to explore and analyze documentary data. Two representations are studied from a theoretical and practical point of view: Venn-Euler diagrams and node-link diagrams. Venn-Euler diagrams are set-based representations. We use them as graphical formulation interface for boolean queries. Each diagram can also be seen as a map of the documents base which provides information on its content and feedback on the quality of the search keywords. Node-link diagrams are used to visualize graphs. We studied layout, filtering and graphical encoding methods applicable to this kind of diagrams. We designed a graph visualization API which allows us to evaluate the properties of various force models, such as the classics from Fruchterman-Reingold and Eades, or the visual clustering models from Noack. We implemented several filtering algorithms in order to enhance the readability of diagrams while controlling the lost of information. Graphical encoding is the use of various visual display elements, such as color, size and shape to map data attributes. Customization of graphical encoding allows users to bring to the foreground their objects of interest within the visualization. The association of these methods provides us solutions to create interactive and customizable displays which are particularly useful for exploration and visual analysis of various real complex graphs, such as web pages, bibliographical and documentary data networks

Abstract FR:

Cette thèse s’appuie sur les techniques de visualisation d’information afin d’explorer et d’analyser des données documentaires. Deux représentations sont étudiées d’un point de vue théorique et pratique : les diagrammes de Venn-Euler et les diagrammes noeud-lien. Les diagrammes de Venn-Euler sont des représentations ensemblistes. Nous les utilisons comme interface de formulation graphique de requêtes booléennes. Chaque diagramme constitue aussi une cartographie de la base documentaire qui fournit des informations sur son contenu et sur la qualité des termes de recherche employés. Les diagrammes noeud-lien permettent quant à eux de représenter des graphes. Nous nous sommes particulièrement intéressés aux techniques de placement, de filtrage et de codage graphique applicables à ces diagrammes. Nous avons conçu une librairie de visualisation de graphes qui nous a permis d’évaluer les propriétés de différents modèles de force, tels que les standards de Fruchterman-Reingold et d’Eades, ou les modèles de clustering visuel de Noack. Nous avons développé des algorithmes de filtrage dans le but d’améliorer la lisibilité des représentations tout en contrôlant la quantité d’information perdue. Le codage graphique est l’utilisation des différents variables graphiques, telles que couleur, taille et forme, pour représenter des attributs des données. Son paramétrage permet à l’utilisateur de faire émerger ses objets d’intérêt au sein de la visualisation. L’association de ces méthodes nous permet de créer des visualisations interactives et paramétrables particulièrement utiles à l’exploration et à l’analyse visuelle de différents graphes complexes réels, tels que des réseaux de pages Web, de données bibliographiques et documentaires