thesis

De la synthese lexicographique a la detection et correction des graphies fautives arabes

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris 11

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Dans ce travail nous nous attaquons a deux problematiques distinctes, mais etroitement liees et complementaires. La premiere est la construction de dictionnaires electroniques pour la langue arabe. La seconde est la detection et la correction des erreurs orthographiques dans les textes arabes. Le premier dictionnaire que nous nous sommes proposes de construire est oriente vers les applications d'analyse et de traitement automatiques de donnees textuelles. Il contient tous les mots de la langue arabe sous leurs formes flechies et voyellees, accompagnes d'informations linguistiques les decrivant. Devant l'impossibilite constatee d'une generation completement automatique, nous avons edifie une chaine de generation semi-automatique. En ce sens qu'elle comporte des procedures automatiques et d'autres manuelles. Ces dernieres permettent, par l'utilisation d'outils logiciels intelligents, d'introduire, de verifier voire meme de corriger les donnees linguistiques collectees. Par ailleurs, une autre voie d'experimentation a ete exploree. Elle consiste a ne plus se contenter d'un dictionnaire de formes flechies mais de proceder a la generation d'un dictionnaire contenant l'ensemble des formes agglutinees arabes. L'idee etant que l'usage d'un tel dictionnaire aurait au moins comme avantage de simplifier les algorithmes d'analyse morphologique et de correction orthographique. Pour ce qui concerne le second objectif vise par ce travail, nous nous sommes interesses aux erreurs lexicales portant aussi bien sur les consonnes que sur les voyelles des mots arabes. La detection des erreurs est effectuee lors de l'analyse morphologique. La correction, quant a elle, se fait par une version amelioree (dite tolerante) de l'analyseur morphologique. Les candidats a la correction d'un mot errone sont trouves grace a des algorithmes particuliers de parcours d'arbre.