thesis

Approches multiéchelles pour la segmentation de très grandes images : application à la quantification de biomarqueurs en histopathologie cancérologique

Defense date:

Jan. 1, 2009

Edit

Institution:

Caen

Abstract EN:

Viewing and analyzing automatically sections of cancer tissue are major challenges to progress in the understanding of cancer development and to discover new indicators of response to therapy. The new microscopical scanners provide an essential assistance by supplying high-resolution color “virtual slides” of the whole histological slide that can reach several gigabytes. This allows us to overcome the issue of the distribution heterogeneity of the markers which have to be quantified. The aim of this thesis is to design a method in order to segment the various stromal compartments on an ovarian carcinoma virtual slide. The difficulties to overcome are the size of images and the choice of criteria to differentiate the compartments. To tackle these problems, we developed a generic segmentation framework which combines a smart split of the image to a characterization of each compartment, regarded as a texture. This characterization is based on a multiscale modeling of textures thanks to a hidden Markov tree model, applied to the wavelet decomposition coefficients. Rather than considering all classes of compartments at once, the multiclass problem was transformed into a set of binary problems. The influence of hyperparameters on segmentation was also analyzed. This allowed us to select the most appropriate classifiers. Several methods of combination of the best classifier decisions were then studied. The method was tested on more than twenty virtual slides. The results are promising, notably if we consider the variability of samples and the difficulty to identify precisely a compartment: about 60% of points are well classified (between 35 % and 80 % according to the slide).

Abstract FR:

Visualiser et analyser automatiquement des coupes fines de tumeurs cancéreuses sont des enjeux majeurs pour améliorer la compréhension des mécanismes de la cancérisation. Les scanners microscopiques haute résolution fournissent des «lames virtuelles» (de plusieurs Gigaoctets) de la totalité de la lame histologique. Ceci permet de s'affranchir de l'hétérogénéité de distribution des marqueurs à quantifier. Le but de cette thèse est de concevoir une méthode de segmentation des différents types de stroma d'une lame virtuelle de carcinome ovarien. Les obstacles sont la taille des images et le choix de critères permettant de différencier les compartiments stromaux. Pour les contourner, nous proposons une méthode générique de segmentation multiéchelle qui associe un découpage judicieux de l'image à une caractérisation des compartiments considérés comme des textures. Celle-ci repose sur une modélisation multiéchelle des textures par un modèle d'arbre de Markov caché, appliqué aux coefficients de la décomposition en ondelettes. Plutôt que de considérer toutes les classes simultanément, nous avons transformé le problème en un ensemble de problèmes binaires. L'analyse de l'influence d'hyperparamètres sur la segmentation nous a permis de sélectionner les classifieurs les mieux adaptés. Différentes méthodes de combinaison des décisions des meilleurs classifieurs ont ensuite été étudiées. La méthode a été testée sur une vingtaine de lames virtuelles. Les résultats obtenus sont prometteurs, compte tenu de la variabilité des échantillons et de la difficulté à, parfois, identifier très précisément un compartiment. Environ 60% des points sont correctement classés (de 35 à 80% selon la lame).