thesis

Recherche collaborative d'information : repenser l'architecture des SRIs à l'ère numérique

Defense date:

Jan. 1, 2004

Edit

Institution:

Paris 8

Disciplines:

Directors:

Abstract EN:

With the recent explosion of the Web, data bases multi-media, digital libraries, great changes were born at the same time in nature of the documents and the corpora and the needs of the users. The corpora of documents became much larger and are often composed of heterogeneous documents as well in the form as in the contents, thus having a weak structuring. Consequently, new needs appear to structure these corpora overall in order to have a representation easily easy to handle of it by machine, to establish bonds between the various objects of these corpora and to make them dynamic and finally to organize the collections in order to allow collaborative work between the users. This context causes the exploitation of: the contribution of the languages of galaxy XML to evolve to the semantic Web with like examples XML for the description of the documents structured on the Web, RDF for the description of the accessible resources on the Web, XML-Query for the research based on the structure of documents XML, Xlink for the description of sophisticated bonds hypertextes, etc; terminological and conceptual resources (ontologies) and their structuring for the use of the Web; semantic annotation of the documentary resources; user profiles; tools and means of collaborative work between users. This exploitation of language XML and its potential arises through the realization of ICRS, our Information Collaborative Retrieval System which includes a data base of documents in format XML structured according to models' published in our repertory of XML models and which they make it possible to solve the problems of exchange of information between various in particular university organizations. All work was completed following a review of the literature on the subject and a terrain survey based on surveys carried out near the users of the numerical resources in various French libraries.

Abstract FR:

Avec la récente explosion du Web, des bases de données multimédias, des bibliothèques numériques, de grands changements ont vu le jour à la fois dans la nature des documents et des corpus et dans les besoins des utilisateurs. Les corpus de documents sont devenus beaucoup plus gros et sont souvent composés de documents hétérogènes aussi bien dans la forme que dans le contenu, possédant ainsi une faible structuration. Par conséquent, apparaissent de nouveaux besoins pour structurer globalement ces corpus de façon à en avoir une représentation facilement manipulable par machine, établir des liens entre les différents objets de ces corpus et les rendre dynamiques et enfin organiser les collections de façon à permettre le travail collaboratif entre les utilisateurs. Ce contexte suscite l’exploitation : de l’apport des langages de la galaxie XML pour évoluer vers le Web sémantique avec comme exemples XML pour la description des documents structurés sur le Web, RDF pour la description des ressources accessibles sur le Web, XML-Query pour des recherches basées sur la structure des documents XML, Xlink pour la description de liens hypertextes sophistiquées, etc. ; des ressources terminologiques et conceptuelles (ontologies) et leur structuration pour l’usage du Web ; de l’annotation sémantique des ressources documentaires ; des profils utilisateurs ; des outils et moyens du travail collaboratif entre les utilisateurs. Cette exploitation du langage XML et de son potentiel se présente à travers la réalisation de ICRS, notre système de recherche collaborative d’information qui intègre une base de données de documents en format XML structurés selon des modèles publiés dans notre répertoire de modèles XML et qui répondent à des besoins d’échanges de documents entre différents organismes notamment universitaires. Tout le travail a été réalisé suite à un état de l’art sur le sujet et une étude de terrain basée sur des enquêtes menées auprès des utilisateurs des ressources numériques dans différentes bibliothèques françaises.