Dynamique informationnelle d'une ressource Web : apport sémantique de la taxinomie : étude webométrique des sites des universités françaises
Institution:
Bordeaux 3Disciplines:
Directors:
Abstract EN:
The industrialisation of content generation and distribution has transformed the Web into an uncontrolled, semi-structured storehouse of data formatted in an indexing language. Qualitative methods are limited to encompass hypertextuality and the volume of publications. Hence, we propose a panorama of chosen disciplines dealing with the processing of vast amounts of hypertext data. We show also limits in dynamic evaluation and in the semantic of data characterisation statistics. Our contribution is organised on three levelsa method to construct a concise representation of the content of a website. The context of hypertext production is integrated in the creative process. In our experimental field, this is achieved by using the text supporting the structural hyperlinks of the site's homepage. The text provided for navigation on this page is strongly representative of the underlying contents of the website. A tool to measure the dynamic evolution of the content of a single html page. When applied to a homepage, this tool characterizes its evolution and stores the published "events". The taxonomy is successfully tested to classify textual events. Results also show the time-dependant relevance of the taxonomy. A systemic approach is applied to a corpus of French academic websites to explain the actual situation regarding scientometric evaluation. Our analysis combines results from qualitative and quantitative collections to put forward a case study of webometric tools. We show that using dynamically-built tools on a concise representation function of published data tends to fill the semantic gap between traditional binary data measurement and the contents measured.
Abstract FR:
Le langage documentaire et la canalisation des contributions par des dispositifs qui en facilitent l'usage transforment le Web. Les méthodes qualitatives d'évaluation des ressources du Web s'avèrent limitées quant à l'appréhension de leur hypertextualité et de leur volume. De leur côté, les méthodes quantitatives de la webométrie s'appuient sur une nécessaire complémentarité qualitative pour l'interprétation des données. En ignorant les contextes de production, les contenus et leur dynamique, les métriques actuelles souffrent d'un caractère statique et d'une limite sémantique. Notre apport est sur trois plans L'élaboration d'une méthode de construction de la représentation synthétique des données éditées. Le texte de navigation des pages d’accueil est très représentatif des contenus des niveaux sous-jacents du site. Un indicateur de la dynamique informationnelle nous permet le suivi de la publication évènementielle. La représentation synthétique est mise à l'épreuve pour le classement très efficace des évènements textuels. Les résultats montrent la dépendance temporelle de la taxinomie. Une méthode d'étude webométrique, élaborée par une démarche systémique, est appliquée au terrain particulier des sites web universitaires. L'analyse opérée combine études qualitatives et quantitatives, dresse un état actuel et révèle sa tendance. Le regard apporté à un espace hypertextuel sous l'angle téléologique de sa construction a permis de construire une perspective d'analyse webométrique qui affine les traditionnelles mesures infométriques. Nos recherches ont pu démontrer la pertinence de l'utilisation des méthodes exposées pour évaluer les éditions web.