thesis

Structuration des documents par l'exploitation de la dynamique du regard chez l'homme : application aux documents web

Defense date:

Jan. 1, 2003

Edit

Institution:

Lyon, INSA

Disciplines:

Directors:

Abstract EN:

A paper-document is a complex and multi-layered object, which carries information on different levels. Among these levels, the layout of the page highly determines the usability and the visual readability of documents. In order to analyse the document, an extraction of the structures physical, functional, and logical, has to be performed. Our project is to extend this document approach to web sites, hence assimilated as documents with informational structure. We will show that a web site, with a consistent set of pages and hypertext links, could indeed be comprehended as such a type of document. In an experimental study, we used an eye-tracking device to record and analyse the eye path, first on web pages (considered as document-images) and then on web documents. This approach allows new openings on the treatment of documents based on a comprehensive analysis and understanding of document structure.

Abstract FR:

Le document papier est un objet complexe et multiforme, porteur d'informations à plusieurs niveaux. Celui de la mise en page conditionne en grande partie la lisibilité du document. L'analyse et la compréhension de la mise en page se fait par l'intermédiaire de l'extraction des structures (physique, fonctionnelle, logique). Notre projet repose sur l'étude des possibilités d'extension de certains concepts et de certaines définitions aux sites web dans l'intention de les assimiler, d'un certain point de vue, à des documents ayant une structure porteuse d'informations. Partant du site web considéré comme un ensemble de pages et de liens hypertextes possédant une cohésion, nous montrons en quoi il s'apparente au document. Nous utilisons l'oculométrie (enregistrement du regard des utilisateurs face à un écran) dans un travail expérimental, d'abord sur des pages web identifiées à des documents numérisés, puis sur des documents web. Ce travail de thèse ouvre le champ des connaissances du traitement informatique des documents tels que nous les connaissons à de nouvelles approches. Le concept multidisciplinaire du document web alliant reconnaissance des formes, point de vue de l'utilisateur et lisibilité permet finalement d'intégrer le document web dans la classe des documents structurés.