thesis

L'apprentissage d'heuristiques de controle pour la planification : une approche abductive

Defense date:

Jan. 1, 1991

Edit

Institution:

Paris 6

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Apex est un systeme de planification qui ameliore ses performances en creant des heuristiques de controle des regles qui choisissent l'action a prendre ou le but a poursuivre a une etape du developpement d'un plan. Pour construire ces regles, il utilise une methode abductive visant a expliquer, a partir de la trace de resolution d'un probleme, pourquoi le choix de telle action ou de tel but a conduit (ou non) a un plan optimal. Les hypotheses explicatives sont des interactions reperees a l'interieur d'un plan grace a deux types de symptomes: les identites et les incompatibilites entre les faits vises, prerequis, ajoutes ou supprimes par les actions du plan. Pour etre jugees significatives, ces interactions doivent remplir la contrainte differentielle: une interaction positive (negative) est censee expliquer pourquoi un plan est optimal (sous-optimal) si elle ne figure dans aucun plan sous-optimal (optimal) issu du meme point de choix. En outre, diverses contraintes de sens commun eliminent les interactions illusoires (ex. Un fait ajoute par une action n'a aucun effet sur le plan s'il est deja vrai au moment ou l'action est envisagee). Le souci de comprendre pour apprendre est le trait principal de la methode abductive d'apex. C'est ce qui la rapproche de l'apprentissage a partir d'explications (ebl), dont elle se distingue sur deux points essentiels. Premierement, l'explication au sens d'ebl n'est ni plus ni moins qu'une preuve, etablie par deduction a partir d'une theorie supposee adequate et d'un seul exemple. En revanche, les explications produites par abduction sont des hypotheses plus ou moins plausibles, destinees a etre evaluees et affinees de maniere incrementale au travers de multiples exemples. En retablissant le poids de l'experience dans le processus explicatif, la methode abductive permet de synthetiser des connaissances qualitativement nouvelles et d'etendre ainsi la theorie initiale. Par exemple, tout en ameliorant son efficacite, apex decouvre des concepts non definis dans sa theorie de depart, tels que violation de precondition ou coincidence de buts. Deuxiemement, les regles creees par apex font abstraction du contenu des domaines d'application et sont enoncees dans le metalangage du planificateur. Les experiences que nous avons menees temoignent de l'interet d'un tel compromis entre generalite et puissance: la methode abductive a conduit non seulement a des performances tout a fait interessantes, mais egalement a un transfert efficace des regles apprises vers d'autres domaines