Eurecas/darc : la sous-structure en chimie. contribution a la representation de l'information structurale et application a la recherche dans de tres grandes bases de donnees
Institution:
Paris 7Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
L'information et la conception en chimie sont particularisees par la complexite structurale des molecules et leur tres grand nombre. Elles sont abordees par les sous-structures, qui ont evolue vers une abstraction plus grande suggeree par l'ordinateur. La recherche correspondante de sous-structures dans une base de donnees conditionne la demarche du chimiste en cao. Le systeme presente a propose pour la premiere fois une solution pour les tres grandes bases de donnees et un langage sous-structural rigoureux, modelise par l'introduction des graphes generiques. La methode, nouvelle, repose sur la formalisation et la representation de l'information structurale. Elle est generalisee par un modele theorique -graphes generatifs et classes abstraites, points de vue et aspects semantiques, hierarchie avec heritage, ordre induit- applicable aux domaines de la chimie et a d'autres disciplines. Le systeme operationnel resultant est expose, et confronte au modele: etapes du traitement, statistiques (frels, infra-frels), choix d'une hierarchie finalisee, structure de donnees,. . . Les strategies de recherche specifiques a la methode, et complement essentiel a la structuration, sont detaillees. La realisation majeure presentee est eurecas/darc qui a rendu possible l'interrogation en ligne des 10 millions de structures du cas et qui a ete commercialisee. Le travail, situe de maniere critique dans le contexte de la chimie, est complete par deux etudes bibliographiques originales: les systemes sous-structuraux et les systemes de recherche par sous-structures