Extraction d'information dans des textes libres guidée par une ontologie : faciliter l'indexation du rendu audiovisuel d'un événement par l'indexation conceptuelle de textes relatant cet événement
Institution:
Paris 10Disciplines:
Directors:
Abstract EN:
INA needs so that its audio-visual files can be used to know the contents of its documents well. The documentalists must then view these documents and index them. In order to bring a help to the documentalists, we created an information extraction system while being useful to us of an ontology to create a semantic dictionary and syntaxical and semantic patterns. At the end, we obtain conceptual indices which could be used by the documentalists at the time of indexing. The results obtained are mitigated : the great variability of the language in the articles involves the creation of a significant number of patterns but the newspaper makes it possible to extract relevant information for INA.
Abstract FR:
L'INA a besoin pour que ses archives audiovisuelles puissent être utilisées de bien connaître le contenu de ses documents. Les documentalistes doivent alors visionner ces documents et les indexer. Afin d'apporter une aide aux documentalistes, nous avons créé un système d'extraction d'information s'appliquant sur des articles de presse écrite. Nous partons de l'hypothèse q'un même événement est, à la fois, décrit dans la presse écrite et visible à la télévision. Nous avons alors conçu notre système en nous servant d'une ontologie du domaine pour créer un dictionnaire sémantique et des patrons syntaxico-sémantiques. Nous obtenons, en sortie, des index conceptuels qui pourront être utilisés par les documentalistes lors de l'indexation. Les résultats obtenus sont mitigés : la grande variabilité de la langue dans les articles entra^inent la création d'un nombre important de patrons mais la presse écrite permet d'extraire des informations pertinentes pour l'INA.