thesis

Analyse automatique d'opinion : problématique de l'intensité et de la négation pour l'application à un corpus journalistique

Defense date:

Jan. 1, 2012

Edit

Institution:

Caen

Disciplines:

Authors:

Directors:

Abstract EN:

Since fifteen years, the interest in the field of opinion analysis has risen. This field gathers numerous studies such as lexicon constitution and detection of opinion's holder and target. Our study aims at automatic opinion analysis in news for economic intelligence. Our objective is ambitious as, beside the state of the art, we should focus on many criteria concerning opinion analysis. We propose a conceptual model allowing the characterization of opinion according to polarity, intensity, prototypicality, opinion's holder and target, author's engagement, etc. We have specifically designed a model for the negation and its effects on intensity and polarity. In addition to the classical effect of negation, our model is able to manage rhetorical usages such as euphemism which is frequently used in news texts. Based on this conceptual model, we set up an operation model specifying our data and and processing. We implemented two applications, one for Chinese and one for French, which allow us to validate our conceptual model as well as to test its accuracy.

Abstract FR:

La problématique de l’analyse d’opinion connaît un intérêt croissant depuis une quinzaine d’années. Cette problématique mène à de nombreux travaux ayant des objectifs allant de la constitution de ressources lexicales à l’identification des cibles d’une opinion. Le cadre applicatif de notre étude est l’analyse automatique d’articles de journaux pour la veille d’opinion. Ce cadre est ambitieux vis-à-vis de l’état de l’art puisque nous sommes amené à étudier un grand nombre de critères propres à l’analyse d’opinion. Nous proposons un modèle conceptuel permettant de caractériser une opinion par la polarité, l’intensité, la prototypicalité, la cible, la source, l’engagement de l’auteur, etc. En particulier, nous modélisons la négation et ses effets sur l’intensité et la polarité. En plus des cas classiques de négation, nous sommes en mesure de modéliser des effets de rhétoriques tels que l’euphémisme ou la litote, très présents dans le genre journalistique. À partir de ce modèle conceptuel, nous présentons un ensemble de choix techniques permettant de préciser les ressources et traitements nécessaires à l’automatisation. Nous mettons en œuvre deux applications (en chinois et en français) de la chaîne de traitements issue du modèle permettant de confirmer la validité du modèle conceptuel ainsi que la pertinence des résultats d'analyse.