Le reperage des termes dans un corpus bilingue anglais francais
Institution:
Lyon 2Disciplines:
Directors:
Abstract EN:
This work examines the problems faced by the linguist-terminologist compiling the nomenclature of a terminological dictionary through corpus processing. It first identifies the specific problems in this regard: a problem-space always proportional to the size of the corpus, a motivation curve dropping gaster than the inevitable fall in the ratio between number of words processed and number of terms identified, separating terms from nonterms, and managing irregular and piecement flow of data necessary for making terminological judgements. A detailed review of terminological literature leads to two conclusions. One: although literature on the term and its characteristics constitutes an invaluable starting point, it does not provide satisfactory answers to the very crucial problemsposed. Two: there is no algorithm guaranteeing a hitchfree extraction of a list of terms from target-domain texts. Using a bilingual (english french) corpus of limnology texts. The work develops and tests a theoretical framework, the "term pact", within which it addresses the problems. It proposes, in particular, to consider "terminologicality"as a heuristic function computed from structural regularities discerned in the target-domain discourse turned genre.
Abstract FR:
Cette these aborde la problematique du reperage des termes dans un corpus par le terminologue-linguiste. Elle identifie d abord les problemes specifiques de la problematique : un espace-probleme a la mesure de la taimme du corpus, une courbe de motivation qui tombe en fleche avec la chute du rapport nombre de mots depouilles nombre de termes releves, la separation des termes des non-termes, et la gestion du flux aleatoire et irregulier des donnees permettant de statuer sur les unites considerees. Un examen detaille de la litterature terminologique foisonnante debouche sur deux constats : l absence d elements de reponse satisfaisants a l ensemble des problemes poses et la chimere d un algorithme garantissant l extraction facile d une liste de terme a partir de textes du domainecible. En s appuyant sur un corpus de textes bilingues (anglais francais) de l ecologie des eaux continentales, elle elabore et teste un cadre theorique, le "pacte terminologique", au sein duquel les elements de solution aux problemes sont examines. Il y est propose en particulier de considerer le "terminologisme" essentiellement comme une fontion heuristique calculee a partir des regularites constatees dans le discours du domaine-cible constitue en un genre.