thesis

Indexation d'images graphiques : application à la numération et à la valorisation du patrimoine

Defense date:

Jan. 1, 2008

Edit

Institution:

La Rochelle

Disciplines:

Directors:

Abstract EN:

This thesis aims at developing the novel framework for the indexing and the content-based image retrieval (CBIR) of historical ornamental images namely lettrines. Lettrines are line-drawing images with letters and various patterns composed in the complicated arrangement. The purpose of indexing is to segment lettrines into multiple regions of interest and label them. We implemented two segmentation schemes called adaptive window segmentation (AWS) and hierarchical wavelet segmentation (HWS). Both methods are unsupervised and globally different but share the principle concept which is the usage of optimum window size to determine texture descriptors. Due to the lack of the ground truth, a new segmentation evaluation system was developed to evaluate segmentation results. It appeared that both segmentation approaches provided the high classification rate. Further experiments indicated that they were susceptible to high level of noises but invariant to changes in scale and rotation. Regarding CBIR, three graph-based techniques were selected: minimum spanning tree (MST), pairwise geometric histogram (PGH), and attributed relational graph (ARG) to perform similarity matching. Without the knowledge of relevance between images, the retrieval results were evaluated using the average precision and the precision-recall graph of the generated sets of images. The evaluation confirmed that our CIR system provided the good retrieval performance especially when combined three techniques together. In addition, it was sufficiently robust to changes in scale and rotation.

Abstract FR:

Cette thèse vise à développer un nouveau système pour l'indexation et la recherche par le contenu (CBIR) d'images de lettrines. Nous avons mis en œuvre deux techniques de segmentation, d'une part basées sur une fenêtre adaptative (AWS) et d'autre part basée sur une segmentation par ondelette hiérarchique (HWS). Ces deux méthodes non-supervisées sont généralement différentes mais partagent le même principe et s'appuient sur l'utilisation d'une fenêtre adaptative afin de déterminer les descripteurs de texture. En raison de l'absence de la vérité terrain, un nouveau système d’évaluation de la segmentation est également développé. L'évaluation de ces techniques de segmentation met en évidence un taux de classement élevé. D'autres expérimentations indiquent que la segmentation reste sensible à un haut niveau de bruit, mais mettent en évidence une bonne résistance à certaines transformations affines telles que les changements d'échelle et d'orientation. La suite du manuscrit se poursuit avec le développement d'un système de recherche par le contenu. Trois techniques à base de graphe ont été sélectionnées pour caractériser la complexité des images graphiques. Sans la connaissance de la vérité terrain, les résultats de recherche d'images par le contenu ont été évalués en utilisant la moyenne de précision, et le graphe "rappel-précision" des séries d'images générées. L'évaluation a confirmé que notre système de recherche par le contenu met en évidence de bonnes performances, en particulier lorsque nous avons combiné les trois techniques. En outre, cette évaluation met en évidence une bonne robustesse face aux changements d'échelle et d'orientation.