La relation texte / image essai de modelisation dans un corpus geographique
Institution:
CaenDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Dans les documents electroniques disponibles sur le web, la relation texte/image n'existe souvent que grace a de simples liens hypermedia les reliant dans leur globalite. Or il existe des relations plus fines entre ces deux media. Le concept de liens multi-echelles propose ici prend en compte ces relations a travers un systeme de liens d'unites d'informations, refletant la granularite de l'information contenue dans les deux media. Les liens globaux relient les images et leur commentaire, les liens d'unites d'informations minimales relient des expressions linguistiques du texte aux objets contenus dans l'image auxquels elles referent, et les liens intermediaires relient des ensembles d'expressions linguistiques avec des ensembles d'objets. La modelisation de la relation texte/image dans un corpus geographique a consiste a appliquer les liens multi-echelles entre une carte et son commentaire. La creation du lien global est basee sur une hypothese de distribution du vocabulaire dans le document, associee a un aspect psychocognitif lie a la memoire de travail. Un lien minimal relie une expression linguistique et une zone de la carte referant a une meme entite georeferencee. Pour creer ces liens minimaux, il a ete necessaire de modeliser l'information geographique afin de s'abstraire des representations graphique et textuelle. Cette modelisation a conduit a sept classes d'expressions de l'information geographique permettant alors de creer un systeme d'extraction et d'interpretation des unites d'informations dans le texte afin de delimiter les zones auxquelles elles referent. La derniere partie de nos travaux est une etude basee sur les variations de teintes dans la carte afin d'extraire les unites d'informations graphiques, etude en partie validee par une premiere experimentation. Pour terminer nous proposons deux techniques permettant de tisser des liens entre les unites d'informations graphiques et textuelles.