thesis

L'expression de la causalité dans les textes : contribution au filtrage sémantique par une méthode informatique d'exploration contextuelle

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris 4

Disciplines:

Abstract EN:

The object of this thesis is to study causality through its discursive expression in French texts. This linguistic study has been made in the perspective of automatic language processing. This work takes place within a project of semantic filtering of texts (named SAFIR : automatic information filtering for summarizing texts) which is dedicated to the production of syntheses and summaries. But the present work ranges over knowledge acquisition through texts. Our first objective is to index the various linguistic processes that are used by authors to convey causal relations. We use an original contextual exploration method that is not based upon a "deep representation" of the text under consideration, rather upon an automatic identification of markers that are considered as relevant. We propose a map made of 1500 markers (verbs, phrases, adverbs,. . . ) which are automatically identifiable indices of the causal relations conveyed by a speaker or a third party.

Abstract FR:

La thèse a pour objectif d'étudier la causalité à partir de son expression discursive dans des textes français. Cette étude linguistique est effectuée dans la perspective du traitement automatique des langues. Ce travail s'intègre dans un projet de filtrage sémantique des textes orienté vers la production de synthèses et de résumes (projet SAFIR : système automatique de filtrage d'informations pour le résumé). Mais sa portée s'étend à l'acquisition des connaissances à partir de textes. Notre premier objectif consiste à répertorier les différents procédés linguistiques employés par les auteurs pour communiquer des relations causales. Nous utilisons une méthode informatique originale d'exploration contextuelle qui ne se base pas sur une "représentation profonde" du texte, mais sur une identification automatique de marqueurs considérés comme étant pertinents. Nous proposons une carte de 1500 marqueurs (verbes, locutions, adverbes. . . ) qui sont des indices automatiquement identifiables des relations causales prises en charge par l'énonciateur ou par des tiers.