thesis

Coefficients d'association et binarisation par la classification hierarchique dans les arbres de decision. Application a l'identification de la structure secondaire des proteines

Defense date:

Jan. 1, 1996

Edit

Institution:

Rennes 1

Disciplines:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Les arbres de decision constituent le motif principal des apports introduits dans ce travail. D'une part nous considerons l'utilisation dans cette technique de discrimination, d'une large palette de coefficients d'association entre attributs qualitatifs, dont certains sont nouveaux dans le domaine. L'indice de haldane light et margolin, que nous reduisons a celui de gini, presente un bon comportement. Neanmoins les coefficients de lerman, bien qu'etant comparables en termes de performance, peuvent s'averer superieurs en termes de complexite. D'autre part et surtout, les attributs descriptifs presentent dans le cadre de notre application, un tres grand nombre de categories, ce qui rendait leur binarisation impraticable avec les techniques deja existantes. Notre methode arcade, en regroupant ces categories au travers de la classification hierarchique avl, permet le traitement de ces attributs. Finalement, l'application de notre methode au probleme de la prediction de la structure secondaire des proteines demontre la pertinence de notre approche