thesis

Contribution à la régression multiple multidimensionnelle et à la génération de règles incertaines

Defense date:

Jan. 1, 1994

Edit

Institution:

Toulouse 3

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La prevision peut etre abordee d'un point de vue numerique (par exemple en regression) ou symbolique (par exemple en generation de regles). Independamment de l'orientation choisie, l'utilisation de mesures de proximite s'impose. Les produits-scalaires peuvent aider a obtenir celles-ci. Neanmoins, si la structure des donnees a analyser est telle que les mesures sont tres correlees, il peut etre judicieux de substituer aux produits-scalaires des semi-produits scalaires. On a en effet eu a proceder de la sorte lors de la conception d'un generateur de regles incertaines. On etudie donc les semi-produits scalaires utiles en analyse de donnees, puis on introduit les semi-produits scalaires dits relationnels utiles quand on est en presence de plusieurs groupes de variables. C'est en particulier le cas en prevision, ou on dispose d'un ensemble de variables explicatives et d'un ensemble de variables a expliquer. On presente la regression multiple multidimensionnelle de facon originale dans l'espace des individus, puis quelques reflexions provenant d'un debut de recherche sur la protection de cette regression quand seules les variables a expliquer sont tres correlees sont exposees. Cette protection dependrait d'un critere base sur l'effet d'association entre les variables a expliquer. Un generateur de produits scalaires relationnels est utilise pour experimenter cet axe de recherche. On propose ensuite un generateur de regles incertaines a partir de variables qualitatives et adapte a de grandes bases de donnees. On montre que l'algorithme est de complexite lineaire par rapport au nombre d'individus. Ce generateur est guide dans l'exploration de l'ensemble des conjonctions de modalites possibles par les valeurs de statistiques estimees sur la population etudiee dans le cadre d'une geometrie relationnelle, et d'autre part, il effectue des approximations statistiques et euclidiennes. En particulier, la longueur des premisses des regles est limitee en considerant une mesure de la redondance de l'information contenue dans les donnees, le nombre equivalent. La programmation de cet algorithme (70 sous-programmes, 450. 197 octets) a ete realisee en collaboration avec monsieur j. Trejos