Knowledge Tree

thesis

Conception et realisation d'une base de donnees cineradiographique : application a l'etude de la coarticulation

Defense date:

Jan. 1, 1998

Edit

Institution:

Université Stendhal (Grenoble)

Disciplines:

Linguistics

Authors:

KAMEL BENSABER

Directors:

Pascal Perrier

Abstract EN:

In this thesis we present a general framework, based on the object-oriented paradigm, for modeling and designing a model of speech data representation, and we propose a particular use of it for cineradiographic data, including sagittal views of the vocal tract, frontal pictures of the lips, and acoustic signals. We introduce semantics to represent relationships between speech objects. Thus we adopte the concept of primary data, referring to either the raw data (recorded signals and images) or their related descriptive data (information on speakers, corpora and recording conditions), and of derived data, such as vocal-tract contours, sagittal distances, area functions, or any other possible measurements taken from x-rays pictures. Indeed, the notion of a derived data model has been useful for users, to manage raw data and the results of data analysis in the same way. Our investigation consisted in developing a data model to represent basic speech data entities used most often in the speech research community. This model has been useful in managing all speech databases available at icp. We have extended the data model to integrate cineradiographic data (x ray films as primary data and their derived data). Data abstraction techniques such as inheritance were found to be essential for describing either primary data (x ray realizations and video realizations) or derived data and their components. The query interface was used to query both primary data and derived data. In order to illustrate the importance of a cineradiographic database, we propose a coarticulation study of vcv sequences. The tokens were pronounced by a female french speaker at the institute of phonetics in strasbourg. We focused our study on anticipatory coarticulation, our aim is to contribute to understanding the programming unit in speech production. We observed situations where vcv sequences were produced in accordance with the khozhevnikov & chistovich model; other situations confirm the look-ahead model hypothesis, or the m. E. M (abry & lallouache) model hypothesis, or the ohman's theory. Of these four hypotheses, only the m. E. M model appears to be consistent these data.

Abstract FR:

Le travail realise au cours de cette these a essentiellement pour objectif la valorisation de donnees existantes et leur acces par l'ensemble de la communaute parole. Il se situe ainsi dans la perspective d'une mise a la disposition de la communaute de recherche en parole, d'un grand volume de donnees sous forme de films rayons x, de signal acoustique et de traces du contour du conduit vocal, effectues a partir des radiographies par des experts phoneticiens. Les aspects importants de la constitution de cette base sont la sauvegarde des donnees. Sa gestion d'acces et l'interfacage avec les outils de traitement et de visualisation des donnees. Nous avons propose un modele de representation des donnees parole dans un systeme de gestion de base de donnees oriente-objet. Nous avons accorde un interet particulier au probleme de representation des donnees evolutives. Pour cela, nous avons introduit le concept de donnees primaires : donnees brutes (signaux et images cineradiographiques) ou bien donnees descriptives des locuteurs, des corpus et des conditions d'enregistrements, et des donnees derivees extraites des donnees brutes. Nous avons developpe une interface utilisateur qui contient des fonctionnalites de base, permettant de realiser l'extraction des sons selon plusieurs criteres de selection. L'avantage principal offert par cette interface est le libre choix de l'utilisateur de maintenir le resultat au niveau de chaque selection ou bien l'abandonner pour en refaire d'autres dans une meme session d'interrogation de la base. Afin de montrer l'interet d'une base de donnees cineradiographiques, nous avons exploite un corpus enregistre par un locuteur de langue francaise. La methode d'analyse detaillee des traces du conduit vocal s'est averee interessante, particulierement pour recuperer l'ensemble des gestes articulatoires impliques dans la production caque sequence vcv. Cette methode nous a aide a suivre de pres les mouvements des articulateurs au niveau de chaque trace et a detecter les debuts des mouvements d'anticipation des levres et de la langue dans les sequences vcv analysees. L'analyse de ses sequences plaide en faveur des hypotheses du modele d'anticipation m. E. M propose par abry & lallouache par rapport aux autres modeles anciennement debattus dans la litterature. Dans l'avenir, nous proposons une confrontation de ce modele avec les donnees de la futur