thesis

Les Méthodes de compression de textes : algorithmes et performances

Defense date:

Jan. 1, 1990

Edit

Institution:

Paris 7

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La compression de textes a pour but de réduire le nombre de symboles nécessaires à la représentation d'un texte. L'objet de cette thèse est l'étude, la mise au point et la comparaison de méthodes de compression universelles, c'est-à-dire capables de traiter de manière efficace n'importe quel type de textes. Nous montrons que l'utilisation d'automates permet d'augmenter l'efficacité des méthodes de compression classiques et nous présentons une nouvelle méthode basée sur l'utilisation de l'automate des facteurs. Nous présentons les deux grandes classes d'algorithmes de compression de données : les algorithmes de codages statistiques et les algorithmes de codage par facteurs. Les algorithmes de codage statistique traitent les textes par blocs de longueur fixe, un bloc fréquent ayant une traduction courte. Nous présentons les codages de Huffman statique et adaptatif ainsi que le codage arithmétique. Nous proposons une représentation du codage arithmétique à l'aide d'un transducteur ce qui garantit un traitement en temps réel. Les codages par facteur traduisent les textes en utilisant leurs propres facteurs. Nous présentons les algorithmes de codage dus à Ziv et Lempel, et nous décrivons une nouvelle méthode basée sur l'utilisation de l'automate des facteurs. Ce travail se termine par la comparaison des performances des algorithmes décrits