thesis

La segmentation des documents techniques composites dans une perspective d'indexation : vers la définition d'un modèle dans une optique d'automatisation

Defense date:

Jan. 1, 2001

Edit

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Cette thèse porte sur la définition d'un modèle de segmentation des documents techniques (manuels d'utilisation) en unités documentaires dans une perspective d'indexation. La finalité de ce modèle est de pouvoir réaliser un traitement automatique, de ce fait il repose sur les critères de surface repérables dans un processus automatique. Pour définir notre modèle de segmentation, nous sommes partis de la réalité des documents techniques pour en induire les critères de segmentation. En ce sens, nous avons mené une étude sur 5 manuels d'utilisation. Nous nous sommes librés à une validation psychologiques du modèle de segmentation auprès de juges. Les résultats dégagés de l'étude du corpus et de la validation psychologique nous ont permis d'établir un certain nombre de règles de segmentation. Pour finir, nous avons posé le problème de filtrage des unités segmentées pour pouvoir optimiser la recherche d'information dans les documents techniques. L'originalité de notre travail consiste en la définition d'une méthode de segmentation qui se veut dynamique avec la prise en compte des différents médias existants dans les documents techniques.