Filtrage automatique et appariement des segments textuels associés aux images à partir de documents électroniques : réalisation du système FILIMAGE
Institution:
Paris 4Disciplines:
Directors:
Abstract EN:
This study presents the extraction of the textual segments which refer to the images in the electronic documents. The objective of this automatic treatment aims at reaching the extracted components. The matching of these components is a means of exploration adapted to acquire and visualize relevant information. The results obtained are drawn from observations on large corpora. The approach adopted for the semantic filtering of the text associated with the image is based on a formalism called "contextual Exploration", in term of the declaratory rules. The Filimage system includes three specific modules of the preprocessing, extraction and matching of the textual and visual components. It proposes to the user a consultation, a visualization of the whole of the extracts which are stored on a digitized support. They make appear new reflexions attached to the operational systems of the filtering of information for a better comprehension of the document in its entirety.
Abstract FR:
Cette étude présente l'extraction des segments textuels qui font référence aux images dans les documents électroniques. L'objectif de ce traitement est d'automatiser l'accès aux image et leurs commentaires. L'appariement de ces composantes est un moyen d'exploration adapté pour acquérir et visualiser des informations pertinentes. Les résultats obtenus sont tirés d'observations sur des corpus volumineux. L'approche adoptée pour le filtrage sémantique du texte associé à l'image est basée sur un formalisme appelé " Exploration contextuelle ", en terme des règles déclaratives. Le système Filimage comprend trois modules spécifiques de pré-traitement, d'extraction et d'appariement des composantes textuelles et visuelles. Il propose à l'utilisateur une consultation, une visualisation de l'ensemble des extraits qui sont stockés sur un support numérisé. Ils mettent en évidence de nouvelles réflexions rattachées aux systèmes opérationnels du filtrage d'informations en vue d'une meilleure compréhension du document dans son intégralité.