Decouverte de connaissances dans une base de donnees pour la gestion des ressources humaines
Institution:
NantesDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these est la premiere issue d'une collaboration de l'entreprise performanse et de l'ireste. Elle s'inscrit dans un vaste projet d'ecd. La majorite des indices utilises en apprentissage empirique inductif, par recherche d'inclusions, sont issus de la probabilite conditionnelle ou de la comparaison du nombre d'exemples et de contre-exemples d'une implication. Ces deux grandeurs souffrent de quelques lacunes auxquelles nous avons tente d'apporter des reponses. Pour cela nous avons etudie et applique a l'apprentissage, l'indice d'intensite d'implication. Cet indice est issu de travaux statistiques, et calcule l'etonnement statistique que l'on a d'observer la configuration des effectifs concernes par l'implication, sous l'hypothese de leur independance. En generalisant son utilisation, nous avons etabli la possibilite de determiner d'autres dependances que la seule implication dont la premisse et la conclusion sont des descriptions positives. Pour mieux apprecier comment l'intensite d'implication resout les insuffisances des indices tres utilises en apprentissage, nous les avons compares sur des jeux d'essais et par simulation, en fonction des variables qu'ils manipulent. L'utilisation de l'intensite d'implication a ete faite au travers de deux algorithmes, fiable1 et fiable2. Le premier a comme source d'inspiration, charade. Cet algorithme permet de trouver toutes les implications caracteristiques observables sur un espace d'apprentissage. Les resultats fournis par fiable1 sont riches mais pas toujours simple a exploiter, c'est pourquoi nous avons travaille sur un second, fiable2. Ce dernier est proche des algorithmes aq, dans sa demarche, et proche de charade dans sa recherche des descriptions. L'utilisation de fiable1 genere un systeme de regles dont certaines sont redondantes. Pour ameliorer la lecture du systeme de regles acquis, il est bon de les eliminer. Au regard de la litterature nous avons constater que cette problematique n'est pas tres active. Les methodes que nous avons rencontrees n'eliminent pas toutes les redondances et sont specifiques a la methode d'apprentissage. Nous avons donc travaille sur une methode generale pouvant s'adapter a la majorite des systemes d'apprentissage. Cette methode est une adaptation de la methode de recherche de la couverture minimale d'un ensemble de dependances fonctionnelles quelconques. Elle aboutit a un ensemble minimal d'implications, mais ne s'applique qu'a un ensemble de regles logiques. Le domaine d'application de ces travaux est celui de l'entreprise performanse : la gestion des ressources humaines. Forte de ces resultats, performanse obtient un feed-back de ses systemes experts et explique les comportements de quelques populations d'individus definies.