Contribution a l'etude des suites symboliques applications aux sequences genetiques
Institution:
Aix-Marseille 1Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Dans cette these, divisee en trois parties, nous nous interessons aux aspects de l'etude des suites symboliques (i. E. A valeurs sur un alphabet fini) concernant l'arithmetique et la theorie des langages en appliquant certains de nos resultats a l'etude des sequences genetiques. Nous etudions dans la premiere partie les suites codant l'orbite, sous l'action d'une rotation d'angle irrationnel, d'un point du cercle unite partitionne en un nombre fini d'intervalles. Nous donnons une caracterisation combinatoire de ces codages. Nous montrons ensuite que les langages de ces suites peuvent etre engendres en iterant infiniment quatre morphismes (i. E. Quatre applications lettres a mots) particuliers. L'ordre dans lequel sont appliques ces morphismes est defini par un developpement de type fractions continues de l'angle de rotation et des longueurs du decoupage. Nous donnons enfin une caracterisation combinatoire des codages naturels d'echanges de trois intervalles. Dans la deuxieme partie, nous presentons une methode originale permettant de recoder un mot fini ou infini sur un alphabet plus grand. Ceci nous permet tout d'abord d'expliciter les liens entre les suites qui ont ultimement n + c#s#t#e facteurs de longueur n et les suites sturmiennes et de montrer que ces suites sont des codages d'echanges d'intervalles. Nous utilisons egalement ce recodage pour approximer le langage d'un mot ou d'un ensemble de mots par des langages rationnels. Cette application de notre recodage a ete initialement developpee pour identifier et etudier les zones regulieres de l'adn, qui sont responsables de certaines maladies genetiques. Une autre application concerne l'amelioration du calcul d'alignements de sequences dans le sens d'une meilleure interpretation biologique. Enfin la derniere partie de ce travail est consacree a un outil de visualisation position/echelle de donnees relatives aux sequences genetiques et son application a la recherche de zones de l'adn dont la transcription est potentiellement structuree.