thesis

Validation d'une classe par estimation de sa stabilité

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris 9

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

A l'issue d'une classification automatique, il est naturel et important de s'assurer de la validité des classes obtenues. Dans la première partie de notre travail, nous présentons les principes généraux des méthodes de validation en classification automatique. Trois types de validation sont alors traités : l'adéquation des résultats obtenus avec la dissimilarité initiale, la mesure de la stabilité des résultats et l'écart entre les classifications obtenues sur échantillon d'apprentissage et sur échantillon test. Dans la deuxième partie, nous présentons les principales approches qui ont été proposées pour valider une classe issue d'un algorithme de classification. Enfin, dans la troisième partie, nous proposons trois indices de validation i, h et v qui mesurent respectivement l'isolation, la compacité et la validité d'une classe. Les valeurs prises par ces indices ne peuvent être interprétées directement, mais elles sont utilisées afin de tester l'hypothèse nulle h#0 pour laquelle les données sont reparties de façon uniforme dans l'enveloppe convexe des données initiales. A partir de jeux de données simulés, et en tenant compte de plusieurs facteurs (i. E taille des échantillons, nombre de classes générées, méthode de classification utilisée, forme, séparation et degré d'homogénéité des classes), nous décrivons le comportement des trois indices, et comparons leurs valeurs à celles prises par l'indice u de validité introduit par Gordon. Ces simulations nous ont permis de constater que les trois indices, i, h et v constituent un outil précis de validation, et qui permettent de détecter la présence de points qui influencent l'isolation et/ou la compacité d'une classe