thesis

NGPLS : Algorithme Génétique Nicheur couplé à la Projection en Structures Latentes. Un nouvel outil de constructions de relations structure-activité quantitatives. Applications pharmaceutiques aux domaines de l'oncologie et du système nerveux central

Defense date:

Jan. 1, 2001

Edit

Institution:

Aix-Marseille 3

Disciplines:

Authors:

Abstract EN:

In the quantitative structure-activity relationships (QSAR) research field, a common solution to perform variable selection and QSAR model building is the use of a simple genetic algorithm (GA) coupled with partial least squares (GAPLS). Variable selection and QSAR model building is a polyoptima problem and we demonstrated that a simple GA is a poor tool for such problem. We investigated an alternative solution to better handle the search space polyoptimality and to identify more predictive QSAR models. We proposed a new algorithm that is a combination of a niching genetic algorithm with partial least squares (NGPLS). Niching genetic algorithms have the ability to divide the search space in niches and to promote useful diversity. We demonstrated on different reference QSAR datasets that NGPLS outperforms GAPLS and allows to identify more predictive and diverse QSAR models than GAPLS. However, NGPLS is slower. We also highlighted that NGPLS can induce a cooperative effect between maintained QSAR models that can be decisive to find better final solutions. Finally, we worked on two different pharmaceutical applications lying on the oncology and the central nervous system areas. In both studies, we confirmed that NGPLS permits to discover more predictive and diverse QSAR models than GAPLS. We also proposed a new directional QSAR approach combining a D-optimal design, PLS and principal component analysis that proved in combination with NGPLS to be efficient decision making tools for the lead optimisation process.

Abstract FR:

Une solution souvent utilisée dans la littérature pour la sélection de variables et la construction de relations structure-activité quantitatives est le couplage d'un algorithme génétique simple (GA) plus ou moins modifié avec la projection en structures latentes (GAPLS). L'espace des relations structure-activité quantitatives est un espace à optima multiples sur lequel nous avons montré que la GAPLS est un outil peu performant. Nous avons donc envisagé une solution alternative à la GAPLS sachant que la poly-optimalité de l'espace de recherche et la découverte de modèles QSAR plus prédictifs sont les deux sources de difficulté qui ont motivé nos travaux. Nous avons proposé un nouvel algorithme NGPLS basé sur un algorithme génétique nicheur couplé à la PLS qui a la particularité de promouvoir une diversité utile en formant des niches écologiques dans l'espace de recherche formé par la fonction objective. Nous avons démontré sur des matrices QSAR de références que la NGPLS permet systématiquement d'identifier et de maintenir des modèles QSAR plus performants et plus divers que la GAPLS. La NGPLS est en revanche plus lente. Nous avons également montré que la NGPLS peut introduire un effet de coopération entre des modèles QSAR performants pour produire des modèles plus prédictifs. Enfin, nous avons abordé deux applications pharmaceutiques touchant à l'oncologie et au système nerveux central. Dans la première étude portant sur des inhibiteurs (BPHI, benzo[f]perhydroisoindole) de la farnésyl transférase et la seconde sur le passage de la barrière hémato-encéphalique, la NGPLS a permis d'identifier des modèles QSAR plus prédictifs que ceux proposés par la GAPLS. Enfin, nous avons proposé une nouvelle approche QSAR combinant un plan d'expériences D-optimal, la PLS et une projection en composantes principales qui s'est révélée comme la NGPLS être un outil d'aide à la décision efficace dans le procédé d'optimisation d'un nouveau médicament.