Élaboration d'un thésaurus pour l'indexation thématique d'oeuvres littéraires
Institution:
Paris 3Disciplines:
Directors:
Abstract EN:
This thesis gives an account of the building up of a thesaurus of literary terms for the indexing of the french literary works listed in the literature data bank, worked out at the Paris III-Sorbonne nouvelle university. The aim has been to give a fair representation of the contents of literary texts in the french language, using the received terminology. The thesaurus, in accordance with the norms of information retrieval, distributes the vocabulary into allowed and not allowed terms. A first version was used for the indexation, by students, of 1500 works. The results of that first phase were then used in their turn for the improvement of the thesaurus, the themes’ list and its structure. It now has the form of a non hierarchical semantic network. Besides, a number of tests in automatic indexation have shown that computer-aided thematic indexation, based on abstracts, is worth considering. Statistical studies prefigure the kind of literary studies that a thematic data base would allow. Such studies would bear on the correlations between themes and movements, epochs, genres, etc. . .
Abstract FR:
Cette thèse retrace les étapes de l'élaboration d'un thesaurus de termes littéraires destine a indexer les œuvres de la littérature de langue française répertoriées dans la banque de données d'histoire littéraire, développée a l'université de paris iii-la Sorbonne nouvelle. Il s'agit de rendre compte du contenu des textes littéraires du domaine francophone, en utilisant la terminologie en usage. Un thesaurus, conforme a la norme documentaire, permet de structurer le vocabulaire en descripteurs et non descripteurs. Une première version a été utilisée pour faire indexer 1500 œuvres par des étudiants. Les résultats de cette première phase ont permis d'améliorer le thesaurus, la liste des thèmes et sa structure. Il se présente actuellement sous la forme d'un réseau sémantique non hiérarchisé. Par ailleurs, des essais d'indexation automatique ont permis d'établir qu'une indexation thématique assistée par ordinateur s'appuyant sur des résumés était envisageable. Des études statistiques préfigurent ce que pourraient être les études littéraires permises par une base de données thématiques : analyse des corrélations de la thématique avec les mouvements, les époques, les genres. . .