thesis

Analyse discursive automatique de texte : application à la modélisation des connaissances

Defense date:

Jan. 1, 2008

Edit

Institution:

Paris 13

Disciplines:

Directors:

Abstract EN:

NPL is mainly focused on words and sentences even if most people agree that a better understanding of text structure could help extract kowledge. In this thesis, we show that, in certain domains, textual approaches are relevant for NLP, taking as an exampe a specific task related to the medical domain : the automatic modelling of health practice guidelines. Clinical Guidelines are legal documents providing an aid for physicists in their diagnosis and treatment tasks. Because these recommendations are not really followed, there is a need for electronic tools that facilitate the access to these documents. Our system, GemFrame, is capable of automatically structure Health Practice Guidelies by recognizing conditions and recommandations and computing the relations between these two kinds of segments. We have showed that these relations involve large parts of texts, beyond the sentence barrier, that justify a textual approach. Wer propose a strategy based on the recognition of linguistic features acquired by an original method that links linguistic observation and machine learning. The system has been fully validated on three complementary aspects: usefulness, performances and relevance of the method

Abstract FR:

Les systèmes d'analyse sémantique reposent le plus souvent sur des analyses locales du texte tandis qu'il devient de plus en plus évident que la structure du texte fait sens et doit être exploitée pour fournir un meilleur accès au contenu des documents. Notre travail s'inscrit dans un cadre applicatif précis, garant d'une évaluation solide, dans le domaine médical : la modélisation des Guides de Bonnes Pratiques. Les guides sont des textes de recommandation médicales écrits par des autorités en matière de santé et adressés aux médecins afin d'uniformiser les pratiques thérapeutiques. Ces document étant peu exploités par les médecins, un effort spécifique a été fait pour construire des outils informatiques permettant de faciliter l'accès aux guides. Pour alimenter ces outils, les textes ont besoin d'être modélisés. Nous proposons l'application GemFrame permettant de fournir automatiquement une représentation structurée des textes. Elle vise à extraire les segments expriment une recommandation et ceux exprimant une condition puis associer à chaque segment "condition" l'ensemble des segments "recommandation" qui dépendent de cette condition. Les relations de dependances s'établissent souvent au delà du niveau de la phrase, ce qui signifie le recours à une approche textuelle. Nous proposons une stratégie basée sur l'exploitation de connaisances linguistiques obtenues par une methode originale liant observation linguistique et apprentissage artificiel. Le système a étè validé sur trois aspects complémentaires: utilité, performance et pertinence de la méthode.