Methodes d'analyse multi-dimensionnelle appliquees a la recherche d'informations bibliographiques : controle-qualite d'une base de donnees astronomiques
Institution:
Université Louis Pasteur (Strasbourg) (1971-2008)Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
La base de donnees astronomiques simbad, developpee par le centre de donnees de strasbourg, contient plus d'un million d'objets (stellaires et non stellaires) decrits par des informations heterogenes (references bibliographiques, donnees astronomiques, mesures physiques et identificateurs synonymes). Le nombre de donnees est en forte augmentation du fait de l'integration de nouveaux catalogues et de l'apport des satellites observatoires. L'afflux considerable des donnees nouvelles rend indispensable le recours a des methodes automatiques pour assurer le controle de la qualite des donnees existantes, afin de partir sur des bases fiables, et de suivre cette qualite au fur et a mesure que les donnees s'accumulent. Au cours de ce travail, nous avons concu deux methodes, adaptees au probleme de controle de la qualite, puis developpe les outils logiciels que nous avons appliques aux donnees de simbad pour en optimiser le contenu: un systeme expert, fonde sur un ensemble de connaissances et de regles pre-etablies, qui suit le raisonnement d'un astronome: cette methode se revele efficace pour les donnees astronomiques, mais ne permet pas de traiter la bibliographie; des methodes d'analyses multivariees, utilisant les mots-cles associes aux references bibliographiques, qui permettent de regrouper des objets astronomiques en fonctions de ces mots-cles: les informations contenues dans les references bibliographiques apportent une information quantifiable pour caracteriser les objets astronomiques qui peut etre utilisee pour deceler des anomalies dans une base de donnees comme simbad; une premiere application a ete realisee sur les types d'objets caracterisant la population de simbad