thesis

Compréhension et catégorisation dans une activité complexe : l'indexation de documents scientifiques

Defense date:

Jan. 1, 1993

Edit

Institution:

Toulouse 2

Disciplines:

Abstract EN:

Indexing consists in identifying the main ideas of a document and in converging them into indexing terms chosen among a controlled vocabulary. An important variability among indexers has been shown and thereby raises two questions : what processing are made by indexers to structure and to reduce the information contained into a document and to categorize the ideas into indexing terms ? what factors step in these processing ? a situation reproducing the characteristics of the actual work has been built up. Twenty-five subjects have indexed eleven books ; they had to write the terms presenting the main ideas and the indexing terms retained from the documenting language rameau. Two classes of variables have been manipulated : the textual content (three topics and two languages) and the operators' characteristics (expertise in indexing, practice of rameau and familiarity with the scientific domain). The results reveal three indexing strategies that can vbe distinguished, on the one hand, by the nature of knowledge involved and the objectives pursued, on the other hand, by the preferential use of either bottom-up processes driven by the knowledge. The major difference depends on the level of analysis of the document : those who pratice rameau carried the level of analysisrequired by this language, the unexperienced in the language carried out a 'specific' description and the beginner indexers have chosen a general level of analysis to access quickly to the language.

Abstract FR:

La tache d'indexation consiste a reperer dans un document les idees importantes representant soncontenu et a les transformer en termes d'indexation issus d'un vocabulaire controle. Le constat d'une variabilite dans le choix des termes affectes par plusieursindexeurs a un meme document souleve deux questions : quels sont les traitements effectues par les indexeurs pour structurer et condenser l'information contenue dans l'ouvrage et pour categoriser les idees retenues en termes d'indexation ? quels sont les facteure intervenant dans ces traitements ? une situation d'observation reproduisant les caracteristiques de la situation teelle de travail a ete construite. Vingt-cinq sujets ont indexe onze ouvrages en notant les termes representant les idees principales et les termes d'indexation retenus du langage rameau. Deux categories de variables ont ete manipulees : le contenu textuel (trois domaines et deux langues) et les caracteristiques des indexeurs (expertise dans l'indexation, pratique de rameau et familiarite avec le domaine). Les resultats revelent l'existence de trois strategies d'indexation se distinguant par, d'une part, la nature des connaissances invoquees et le type d'objectifs poursuivies et, d'autre part, la mise en oeuvre privilegiee de processus soit ascendants guides par des indices textuels, soit descendants guides par des connaissances. La difference essentielle est liee au niveau d'analyse du document : les indexeurs pratiquants rameau ont adopte le niveau d'analyse requis par ce langage, les non pratiquants ont effectue une description 'fine' et les debutants sont restes a un niveau general.