thesis

Modélisation d'une typologie des erreurs d'accord en contexte

Defense date:

Jan. 1, 1989

Edit

Institution:

Paris 3

Disciplines:

Authors:

Directors:

Abstract EN:

Agreement error disturbs the understanding of the information in the written language and makes it difficult to do automatic analysis. Through a syntactic description and a typology, we try to understand the basis of the agreement error and to explain their mechanisms, in order to propose some assistance to automatic processing. We present in the first part: the agreement rules, a corpus of sentences, the morph syntactic labels (abbreviations) of a machine dictionary which are used to encode the sentences, and the variables which compose the set of descriptive attributes. In the second part, we expose and explain the contingency tables (between some selected variables) and the classifications. We give the results of four kind of classification, on one hand three relational methods, on the other hand a factorial method. In the third part, we expose the typology given by those analysis, namely representative types of the most salient and regular characteristics of the agreement error phenomenon. Some types do not prove to be very homogeneous but they bring significant elements to the elaboration of an automated processes that could help to select and maybe to correct the agreement errors. Finally we make some proposals that might be helpful to teaching: according to the classifications, it seems that the agreement rules and their learning need to be improved.

Abstract FR:

L'erreur d'accord perturbe la compréhension de l'information en langue écrite et dérègle l'analyse automatique. Par le biais d'une description syntaxique puis d'une typologie, il s'agit de comprendre les fondements des erreurs d'accord et d'en expliquer les mécanismes, de manière a proposer des éléments d'aide a la modélisation automatique (systèmes expert). Dans la première partie sont présentes : les règles d'accord, le corpus de phrases, les étiquettes (abréviations) morphosyntaxiques d'un dictionnaire de machine, et les variables qui composent la grille des descripteurs. Certaines de ces variables décrivent la phrase-erreur, le segment-erreur et le mo terreur, d'autres avancent des interprétations des causes susceptibles de favoriser ou de générer les erreurs d'accord. Dans la seconde partie sont exposes et commentes les divers croisements, en tableaux de contingence, de certaines variables, puis les classifications obtenues par les traitements statistiques, a travers trois méthodes d'analyse des données et une méthode d'analyse factorielle. La troisième partie propose d'abord la typologie obtenue a partir de ces analyses, soient des types représentatifs des particularités les plus saillantes et régulières du phénomène erreur d'accord. Certains types ne sont pas homogènes mais cette typologie apporte des éléments importants pour l'élaboration d'un traitement informatique qui permettrait de détecter et peut-être de corriger les erreurs d'accord. Viennent ensuite des propositions utiles a l'enseignement : au vu de ces classifications il apparait que les règles d'accord et leur apprentissage soient perfectibles.