Analyse des structures de documents, une approche objet
Institution:
Rennes 1Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
L'analyse de documents consiste a developper un modele de haut niveau pour representer des images binaires obtenues par numerisation d'un document papier. Le but de ce traitement est de rendre le document accessible aux systemes de manipulation de documents structures, et de reduire leur cout d'archivage et de transmission. Dans un premier temps, la structure geometrique est construite en realisant une segmentation recursive desscendante de chaque page, pour detecter les groupes de lignes. Ensuite, a partir de la description typographique de ces derniers, on realise leur classification et leur etiquetage logique. Au cours du traitement on procede a la recherche de l'ordre de lecture des composants et on restitue ainsi un flot de texte unique en eliminant les coupures dues a la mise en pages du document d'origine. Toute notre etude s'appuie sur une representation interne du document analyse proche de la norme oda et sur une modelisation a base d'objets