Classification prétopologique des données : application à l'analyse des trajectoires patients
Institution:
Lyon 1Disciplines:
Directors:
Abstract EN:
The objective of my work is to develop clustering methods based on a new mathemetical concept : pretopology. My approach was driven by two major concerns : (1) to develop methods which are applicable to complex data and for which we cannot use metric concepts due to the nature of these data, (2) to integrate various points of view in the clustering process. Thus, proposed methods are only founded on families of reflexive binary relationships between objects to be clustered. Three methods are developed according to two steps. The first one consists in using the minimal closed subset algorithm to get a covering from data. The second one uses this covering to extract "centers" from which the final clustering is determined. The numbers of clusters is then predetermined by the number of centers, corresponding to information given by the minimal closed subsets. This means the number of clusters is only derived from the data itself. A software tool has been developed in view to test our approach on complex data issued from the PMSI (French DRG system) allowing to give answers to questions related to the concept of "patient profile" inside health care delivery organizations (public hospital and private clinics
Abstract FR:
Le travail a porté sur la mise au point de méthodes de classification automatique des données fondées sur les concepts de la prétopologie. La démarche a été guidée : par le souci de pouvoir appliquer ces méthodes à des données complexes non plongeables dans un espace métrique sans courir le risque de les dénaturer, ainsi que par le souci de pouvoir proposer une classification sur la base de plusieurs critères d'analyse. Les méthodes ainsi proposées permettent donc de traité des données modélisées dans des espaces sur lesquels, à priori, on dispose seulement d'une famille de relations binaires réflexives. Trois méthodes ont été développées. Elles fonctionnent en deux étapes. La première consiste à utiliser l'algorithme des fermés minimaux pour obtenir un recouvrement directement à partir des données. La deuxième utilise ce recouvrement pour extraire des "noyaux" à partir desquels la classification est construite. Le nombre de classes est ainsi prédéterminé par le nombre de noyaux, donc par la structure intime des données. Un outil logiciel a été développé afin de tester ces méthodes sur des données issues des grandes bases médico-économiques hospitalières, permettant ainsi d'apporter un élément à la construction de trajectoires patients au sein du système de soins