Contribution à une représentation spatio-temporelle des dépêches épidémiologiques
Institution:
Aix-Marseille 2Disciplines:
Directors:
Abstract EN:
A spatio-temporal representation of event structures is important for an automatic comprehension of disease outbreak reports. The dispersion of components in this type of reports makes it difficult to have such a representation. This work describes an automatic extraction of event structures representation of these texts. We built an information extraction system by using cascaded finite state transducers which allowed the realization of three tasks : the named entity recognition, the arguments annotation and representation and the event structure representation. We obtained with this method a recall between 74. 24% and 100% for the named entity recognition task and a recall between 97. 18% and 99. 54% for argument representation task. Thereafter, we contributed to a normalization task in anaphoric pronouns resolution and in some inferences resolution concerning disease causation, concerned person, spatial and temporal location. We obtained a precision between 70. 83% and 100% for anaphoric pronouns resolution. The evaluation of inferences rules resolutions consisted in finding some counterexamples in the corpora for evaluation.
Abstract FR:
Une représentation spatio-temporelle des évènements est d’une grande importance pour une compréhension détaillée du sens des dépêches épidémiologiques. La dissémination des composants d’une telle représentation dans les dépêches rend difficile l’accès à leurs contenus. Notre travail consiste en une extraction automatique d’une représentation évènementielle de ce type de dépêches. Nous avons implanté un système d’extraction d’information en utilisant les cascades de transducteurs à nombre d’états fini qui a permis la réalisation de trois tâches : la reconnaissance des entités nommées, l’annotation et la représentation des arguments ainsi que la représentation des structures des évènements. Par cette méthode, nous avons obtenu une valeur de rappel comprise entre 74. 24% et 100% pour la reconnaissance des entités nommées et pour la représentation des arguments, nous avons obtenu un rappel compris entre 97. 18% et 99. 54%. Ensuite, nous avons effectué un travail de normalisation de cette représentation par une résolution de certaines coréférences et de certaines inférences dans les cas où les arguments cause pathologique, personne concernée, localisation spatiale et localisation temporelle sont omises ou partiellement reconnues. Nous avons obtenu une valeur de précision comprise entre 70. 83% et 100% pour les résolution de certaines anaphores pronominales. L’évaluation de la résolution des inférences est faite par une recherche des contre-exemples des sorties des règles proposées.