thesis

Issues in early phonological and lexical acquisition

Defense date:

Jan. 1, 2013

Edit

Institution:

Paris 6

Disciplines:

Authors:

Abstract EN:

Over the last four decades, a growing body of research has been dedicated to the study of the cognitive mechanisms allowing infants to acquire their native language with remarkable ease. The present dissertation reports the findings of three experimental studies addressing crucial issues in phonological and lexical acquisition at different stages of development. In a first study, we explored the types of mechanisms driving the acquisition of a sound inventory. During the second half of the first year of life, infants’ phonetic perception is refined according to the native language structure, with speech sound discrimination declining for non-native contrasts and improving for native contrasts. However, a question that has remained unanswered is how to account for the order in which the different native categories are acquired. In particular, two hypotheses have been proposed: (1) a frequency-based hypothesis, according to which exemplars of sound categories occurring the most frequently in the input speech should be acquired earlier than less frequent categories; (2) a universal markedness hypothesis, according to which less marked sounds should acquire before more marked ones. To disentangle these two possibilities, we designed a cross-language developmental study, in which the discrimination of two non-native contrasts was tested across two languages at two ages, and in which the two hypotheses predict different developmental scenarios for the two languages. So far, the pattern of results seems to converge on the universal markedness account (though more robust data is needed to validate this hypothesis). However, we also argue that an alternative frequency-based explanation can account for our results. In a second study, we investigated the acquisition of a receptive lexicon. To detect word-forms in the speech stream, it has been suggested that infants rely on statistical coherence between syllables, a universal, language-independent cue that would help them get started with a first set of forms. While it is well-known that infants are sensitive to statistical cues, we provide unique evidence confirming that infants really make use of this available resource to build a lexicon. In particular, we exploited the fact that a purely statistical learning strategy should extract words but also high-frequency sound sequences that do not correspond to actual words. Infants’ receptive lexicon was simulated using a crude algorithm that extracts frequent disyllabic sequences from a corpus of French infant-directed speech, and recognition of such sequences was tested in a series of preferential listening experiments. French-learning infants of 11 months, an age at which their word segmentation capacities are still rudimentary, were found to recognize isolated high-frequency nonword sequences (e. G. Va faire, n’as plus) and fail to differentiate between these nonwords and actual words in the same frequency range (e. G. Canard, “duck”; ballon, “ball”). These results show that infants do apply statistical cues, guiding them to build a “protolexicon”, containing both words and nonwords, and which will later be pruned as robust segmentation abilities develop. In a third study, we examined the output phonological representations of words in French-learning infants of 21 months, an age at which they comprehend many words but often misarticulate them or do not attempt to produce them at all. We showed that they are able to covertly produce the phonological form of words that they do not yet produce overtly, and make internal (though coarse) judgments about their phonological length. In an anticipatory eye-movement procedure, infants were presented with images of objects whose labels they had to covertly produce and categorize according to their length. Crucially, the images represented objects whose labels were understood but not yet overtly produced by the infants, according to parental report. Successful categorization was measured by correct anticipations of the appearance of each object to a designated side on a screen (left or right), which was determined by the length of the object’s label. Infants’ performance was significantly above chance when words were monosyllabic and trisyllabic (e. G. Chat vs. Pantalon), and marginally so with words of a smaller phonological difference, i. E. Monosyllables vs. Disyllables (e. G. Chat vs. Ballon). These observations constitute unique evidence that infants possess output phonological representations for words before they start producing them. Together, these findings offer new insights into infants’ phonological and lexical development, from the perceptual abilities allowing them to recognize the sounds and word-forms of their language to the representations of words in the output lexicon. We discuss the interpretation of our experimental results and propose avenues for future research to answer new questions raised by our findings.

Abstract FR:

Pendant ces quatre dernières décennies, de nombreux travaux de recherches ont été dédiés à l’étude des mécanismes cognitifs permettant aux enfants d’acquérir leur langue maternelle avec aisance. Dans trois études expérimentales, nous avons tenté de répondre à des questions centrales autour de l’acquisition phonologique et lexicale à différentes étapes du développement. Dans une première étude, nous avons exploré les mécanismes permettant l’acquisition de l’inventaire des catégories phonétiques natives. Durant la deuxième moitié de la première année de vie, le schéma perceptuel se réorganise selon les propriétés phonologiques de la langue maternelle, suivant un déclin des discriminations pour les contrastes non-natifs et une sensibilité accrue pour les contrastes natifs. Cependant, il n’existe pas de données empiriques robustes permettant de rendre compte de l’ordre d’acquisition des différentes catégories phonétiques natives. Deux hypothèses ont été proposées : l’une est basée sur la fréquence des exemplaires des catégories dans l’input, et propose que les catégories les plus fréquentes devraient être acquises avant les catégories moins fréquentes ; la deuxième hypothèse est basée sur la saillance universelle, et prédit que les sons phonologiquement moins marqués seraient acquis avant les sons plus marqués. Pour trancher entre ces deux hypothèses, nous avons conduit une étude développementale interlangue, dans laquelle nous avons testé la discrimination de deux contrastes non-natifs à deux âges chez deux groupes de nourrissons acquérant une langue différente. Les deux hypothèses prédisent un schéma de discrimination différent entre les deux groupes d’enfants. Pour l’instant, les résultats semblent converger vers l’hypothèse de la saillance universelle (bien que des données plus robustes soient nécessaires pour valider cette hypothèse). Cependant, nous soutenons que ces résultats sont également conformes à une variante de l’hypothèse de la fréquence. Dans une deuxième étude, nous avons examiné l’acquisition d’un lexique réceptif. Pour détecter les formes de mots dans la parole continue, il a été suggéré que les nourrissons pourraient se baser sur les régularités statistiques séquentielles ; cet indice universel de segmentation de la parole leur permettrait ainsi de commencer à construire leur lexique. Alors qu’il est bien connu que les nourrissons sont sensibles à ce genre d’indices statistiques, nous démontrons pour la première fois qu’ils font l’usage d’une telle stratégie pour identifier les mots de leur langue. Nous exploitons notamment le fait qu’une stratégie d’apprentissage statistique pure devrait extraire à la fois des vrais mots mais aussi des séquences de parole fréquentes qui ne correspondent pas à des vrais mots. Dans un premier temps, le lexique réceptif des enfants a été simulé via l’implémentation d’un algorithme rudimentaire qui génère des séquences dissyllabiques fréquentes à partir d’un corpus de parole adulte adressée à des nourrissons. Puis, dans trois expériences d’écoute préférentielle, nous avons montré que les nourrissons français de 11 mois, un âge auquel les capacités de segmentation sont encore fragiles, sont capables de reconnaître de telles séquences présentées en isolation (va faire, n’as plus), et qu’ils ne les distinguent pas des vrais mots de même fréquence (canard, ballon). Ces résultats montrent que les nourrissons appliquent réellement des indices de segmentation statistiques, construisant ainsi un ‘protolexique’ contenant à la fois des vrais mots et des non-mots. Ce protolexique sera par la suite sera raffiné avec le développement de capacités de segmentation plus robustes. Dans une troisième étude, nous avons examiné les représentations phonologiques des mots chez des nourrissons français de 21 mois. A cet âge, les enfants comprennent beaucoup de mots, mais ne prononcent pas correctement ces mots ou ne tentent pas encore de les prononcer. Cependant, nous avons montré que les nourrissons sont capables de produire intérieurement la forme phonologique de mots qu’ils ne prononcent pas encore à l’oral, et d’émettre des jugements intérieurs (bien qu’approximatifs) sur leur longueur phonologique. Dans une procédure basée sur l’anticipation du regard, les enfants voyaient des images d’objets dont ils devaient produire silencieusement les noms pour ensuite les catégoriser en fonction de leur longueur. Les images représentaient des objets que les nourrissons connaissaient mais - d’après un questionnaire de vocabulaire rempli préalablement par les parents - ne nommaient pas encore à l’oral. La catégorisation était mesurée par une anticipation correcte de l’apparition d’un objet vers un côté de l’écran (droit ou gauche), déterminé par la longueur du nom de l’objet. La performance des enfants était significativement supérieure à la chance quand les mots à catégoriser étaient monosyllabiques et trisyllabiques (ex. Chat vs. Pantalon), et marginalement (supérieure à la chance) quand il fallait catégoriser des mots avec une différence phonologique plus petite : monosyllabes vs. Dissyllabes (ex. Chat vs. Ballon). Ces observations démontrent que les enfants possèdent des représentations en ‘output’ des mots qu’ils comprennent mais n’ont pas encore commencé à prononcer. Ces trois études apportent de nouvelles connaissances sur les différents mécanismes cognitifs qui sous-tendent le développement phonologique et lexical chez les nourrissons. Nous avons notamment exploré les capacités perceptuelles leur permettant de reconnaître les sons et les formes sonores de mots de leur langue, ainsi que les représentations des mots dans le lexique de production. Nous discutons de l’interprétation de ces données et proposons quelques avenues de recherche pour répondre à de nouvelles questions soulevées suite à ces découvertes