Interprétation automatique de dessins : Méthodes d'analyse et de reconnaissance
Institution:
Lyon, INSADisciplines:
Directors:
Abstract EN:
Automatic interpretation of documents is developed to make easier the retrieval and then the exploitation of the handmade paper drawings. We propose a set of stages achieving the transformation of a paper drawn diagram into numeric data allowing storage and including a drawing interpretation which could be used by a specialized software. To do that, we need to extract the graphic and alphanumeric information from the document in order to rebuild the semantic data associated to the different objects in the drawing and to their relationships. To realize this duty, we have taken advantage of natural techniques commonly associated with human perception. They have inspired the architecture of our model. At first stage, a global perception of the document is realized, using a limited number of elementary primitives: the Pixel, the Vector and the Quadrilateral. So a first representation of the document is obtained. All along the different levels of the analysis, this representation will provide a precise description of all the shapes from the original document. Next, the dual use of our representation of the document and of a multi-expert system tends to improve the local analysis all along the reading and understanding steps. A mechanism of perceptive cycles allows the different experts to cooperate. Each expert has some elementary, precise and enough knowledge of some particular domains, such as extraction of text, of curves, of mechanical elements. Too, it uses the global vision to focus its attention on different places in the image. The hypotheses that the experts have assumed are verified and they induce the evolution of the document representation. Every step of the process brings some new information that is used either to confirm a previous hypothesis or to state a new one until full understanding of the document is obtained
Abstract FR:
L'objectif de l'interprétation automatique de documents est de faciliter l'exploitation des dessins. Nous en proposons un ensemble d'étapes permettant la transformation du schéma papier en données numériques interprétées. Cette interprétation consiste à extraire l'information graphique et alphanumérique du document afin de reconstituer la sémantique associée aux différents objets du dessin et à leurs relations. Dans le but de construire un tel système, nous avons choisi de nous inspirer du fonctionnement du système visuel humain. Nous imaginons une première phase de perception globale qui nous donne une première représentation du document à l'aide d'un nombre limité de primitives élémentaires : le Pixel, le Vecteur, et le Quadrilatère. Nous montrons que cette représentation est suffisante pour fournir une description précise de toutes les formes du document initial et valable aussi longtemps que possible dans les différents niveaux d'analyse. Dans une seconde étape, l'utilisation duale d'un système multi-experts et de la représentation préalablement construite permet, au cours d'une phase de lecture et d'interprétation, d'utiliser les données fournies par la vision globale afin d'améliorer les analyses locales. Un mécanisme de cycles perceptifs permet aux différents experts de coopérer pour extraire seulement les évidences, ce qui a pour effet de limiter les erreurs d'analyse. Chaque expert réalise une tâche précise telle que, par exemple, la détection du texte, des courbes, des éléments mécaniques ou la reconstruction 3D du mécanisme. Tous les experts utilisent la vision globale pour focaliser leur attention sur des zones précises de l'image qu'ils étudient en détail pour faire avancer l'analyse. Notre système s'efforce d'extraire aussi bien les formes que les connaissances, de manière hiérarchique et réfléchie, et les transcrit dans un modèle de représentation évolutif. Ainsi se trouve constituée une interface intelligente entre le dessin sur support papier et les logiciels spécialisés dans le traitement de tels dessins.