thesis

Contribution à l'évaluation d'algorithmes de traitement d'images

Defense date:

Jan. 1, 2002

Edit

Institution:

Paris, ENST

Directors:

Abstract EN:

It is more relevant to evaluate the usefulness of an image segmentation algorithm in the context of a specific task rather than try to address the general segmentation performance issue. A case in point is the photo-interpretation of aerial images. It is necessary that the delineation of the objects and the features emphasized satisfy human vision requirements. So we aim to assess segmentation algorithms based on the understanding of the reasoning of photo-experts. In an effort to determine segmentation features in alignment with their perception, alternatively called psychovisual features, we have collected 2 sets of data. We determined from the images, concurrently, various objective performance measures and collected subjective votes of a jury of evaluators. We considered two approaches to select relevant features and to build a performance measure. Firstly, we used the method of canonical analysis of tables between the 2 feature spaces. We selected an optimal subset of features and built a similarity measure, which is a linear combination of feature values. Secondly by using fuzzy logic, we differently took into consideration the marks from evaluators. We selected a new subset of features and built a new similarity measure. Then we combined information given by the previous measures and proposed an original measure that discriminates, quite well, ``good'' and ``bad'' segmentation results in accordance with a human judgement. So we succeeded in linking numerical values with a semantic classification of the segmentation outcome of the algorithms. Hence we have proposed a quantification of the quality of delineation that is in alignment with a human judgement of quality.

Abstract FR:

Dans cette thèse, nous nous sommes attachés à caractériser la notion de confiance que peut accorder un utilisateur de chaînes de traitement d'images. Nous nous sommes placés à l'interface entre deux domaines : celui du traiteur d'images et celui de l'expert, habitué à traiter manuellement des images. Si les chaînes d'aide à l'interprétation ont été notre guide principal, nous nous sommes attachés à proposer une démarche aussi générique que possible. Nous nous sommes appuyés sur l'expertise d'interprètes images. Nous leur avons fait préciser les attributs visuels qui leur semblaient caractériser les objets segmentés. Puis, ils ont noté la ressemblance entre les objets segmentés automatiquement et manuellement. Nous avons adopté deux approches pour contraindre le choix de l'espace de représentation des objets segmentés et construire la mesure de performance. En premier lieu, une approche statistique fondée sur une analyse canonique nous a permis de sélectionner un sous-ensemble d'attributs. Sur cet ensemble, nous avons obtenu une première mesure des performances qui s'approche du jugement visuel exprimé par les notes. Puis, en nous appuyant sur la théorie des sous-ensembles flous, nous avons proposé une nouvelle mesure de la qualité des segmentations obtenues. La combinaison de ces deux mesures nous a finalement permis de proposer une nouvelle famille de mesures des performances qui associe à un résultat numérique des notions sémantiques. Nous la qualifierons de mesure objective qualitative. Ainsi, nous avons proposé une quantification de la qualité des segmentations obtenues de façon automatique qui est en adéquation avec un jugement humain de cette qualité.