thesis

Construction automatique d'un dictionnaire orienté vers l'analyse morpho-syntaxique de l'arabe, écrit voyellé ou non voyellé

Defense date:

Jan. 1, 1989

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

This thesis adresses the problem of the automatic treatment of a natural langage : arabic. Its purpose is to treat written arabic, as it is printed, without any pre-editing. First play, we describe the automatic construction of a dictionary, which allows the recognition of the lexical units that makeup the text, units which do not always appear in the dictionary because of agglutination in Arabic. As for syntactic analyses, we resolve grammatic ambiguities, taking into account the problems caused by agglutination.

Abstract FR:

Le présent travail pose le problème du traitement automatique d'une langue naturelle : l'arabe. Le but est d'appréhender la langue arabe écrite, telle qu'elle se présente, sans aucun prétraitement manuel. En premier lieu, il s'agit donc de construire automatiquement un dictionnaire, qui doit permettre l'analyse aussi bien des textes voyellés que non voyellés. En second lieu, l'analyse morphologique doit permettre la reconnaissance des unités lexicales qui composent le texte, lesquelles ne correspondent pas toujours aux entrées du dictionnaire à cause des problèmes de l'agglutination. Côté analyse syntaxique, on s'est intéressé à la levée des ambiguïtés grammaticales simplement. Elle doit en plus prendre en compte les problèmes dûs à l'agglutination.