Un système multilingual d'interprétation automatique : étape du sous-logiciel "analyse" pour les langues germaniques
Institution:
MetzDisciplines:
Directors:
Abstract EN:
In part one of the thesis, the reader is reminded first of all the language models underlying grammars from which the systems of automatic processing of languages borrow, and second of the computing aids that make applications possible. A vast survey of the machine translation and computer-assisted translation systems incepted since the early beginnings up to 1991 illustrates the developments in connection with translating. In counterpart to the limits offered by the present systems, in part 2 of this thesis, another path is laid down, whose basis is the following hypothesis : is it possible to a minimum the quality of the target-text for a reader - a specialist of the area who, however, is not familiar with the language of the source-text-, to recreate its meaning through implicit comprehension? Hyperanalysis applies to the whole of the text. The local hypersyntactic module explores everything that introduces an object, defines it, names it (<derivation system). The global hypersyntactic module analyses paragraph patterns and recognizes the architecture of text parts. The hypersemantic module analyses paragraph patterns and recognizes the architecture of text parts. The hypersemantic module locates both specific and standard objects using typography and presentation of the source-text. The construction of the target-text is based on the assumption that there is a similarity between derivational systems of language groups (romantic, germanic. . . ). Using limited vocabulary lists, it is (root+prefix proverb), and from derivational elements and from simple words. In part 3 a description is provided of all the steps in the analysis consisting in breaking the source-text (compuonds words, derived words) into constituents which will ultimately be labelled agin in the target-language
Abstract FR:
La première partie de la thèse rappelle les modèles sous-jacents aux grammaires dont s'inspirent les systèmes de traitement automatique de la langue ainsi que les outils informatiques disponibles pour les appliquer. Un panorama des systèmes de traduction automatique et de traduction assistée par ordinateur illustre les développements liés à la traduction, effectués depuis le début jusqu'en 1991. En réponse aux limites de ces systèmes, la seconde partie propose une autre voie qui repose sur l'hypothèse suivante : peux-t-on réduire à un minimum la qualité d'un texte cible pour qu'un lecteur, spécialiste du domaine mais ne maîtrisant pas la langue source, puisse en recréer le contenu par compréhension implicite ? L'hyperanalyse s'applique à l'ensemble du texte. Le module hypersyntaxique local repère tout ce qui introduit un objet, le définit, le nommé (système dérivationnel). Le module hypersyntaxique global analyse les structures de paragraphe et reconnaît l'architecture de grandes parties de texte. Le module hypersémantique localise les objets spécifiques et les objets standards en s'appuyant sur la typographie et la présentation du texte source. La construction du texte cible repose sur l'hypothèse d'une similarité entre les systèmes dérivationnels d'un groupe de langues (roman, germanique. . . ). En utilisant des dictionnaires réduits, il est possible de produire un texte à partir de la traduction hors-contexte de correspondances de bases (racine+préfixe préverbe), d'éléments de dérivation et de mots simples. La troisième partie est une description de toutes les étapes de l'analyse qui consiste a décomposer le texte source (composes, dérivés) en constituants qui seront ensuite réétiquetés dans la langue cible