thesis

Un modele de gestionnaire iteratif de flux informationnel sur internet

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris, CNAM

Disciplines:

Authors:

Directors:

Abstract EN:

The phenomenal growth of internet and proliferation of contents at one-line users 'disposal have amazingly increased the problem of informational overabundance. Within the context of a cifre contract, a performing access system to personalised information and shared on internet, called iterative management device of information flows, has been elaborated. The purely information research part is leaded through an hybridisation between a linguistic layer of terminological extraction and an infometric ? layer of themes automatic detection. Further this simple transfer of technical know-how, we had to think about the way of integrating this hybrid system in the innovative space, fluctuating and federative which is internet, that owns its proper hypertextual logic of information organisation. Its own characteristics, so much at sources identification level as the documents' nature (new process of electronical writing) have been taken into account. Afterwards, we conducted a categorisation of the documents on internet calculated from the hypertextual and textual cover of each one. This categorisation is the basis of the database iterative process. Whereas the first part uses most advanced technics of documentary world (indexation in complete text by accelerated linguistic treatment) combined with the ones of informative monitor world, technics capable of detecting weak signals (infometric treatment), the inherent part to internet applies itself to robots, to new 3d representation formats and to a systems typology of informational distribution available on the network.

Abstract FR:

La croissance phenomenale d'internet et la proliferation des contenus mis a la disposition des usagers en ligne ont considerablement accru le probleme de surabondance informationnelle. Dans le cadre d'un contrat cifre, un systeme d'acces performant a l'information personnalisee et partagee sur internet, appele gestionnaire iteratif de flux informationnel a ete elabore. La partie purement recherche d'information s'effectue par le biais d'une hybridation entre une couche linguistique d'extraction terninologique et une couche infometrique de detection automatique de themes. Depassant le simple transfert de ce savoir-faire technique, il a fallu reflechir a la maniere d'incorporer ce systeme hybride dans l'espace novateur, fluctuant et federateur qu'est internet, qui possede sa propre logique hypertextuelle d organisation de l'information. Ses caracteristiques propres, tant au niveau de l'identification des sources que de la nature des documents (nouveaux procedes d'ecriture electronique) ont ete prises en ensuite une categorisation des documents sur internet calculee a partir de la couverture hypertextuelle et textuelle de chacun d'eux a ete effectuee. Cette categorisation est a la base du processus iteratif du gestionnaire. Tandis que la premiere partie utilise les techniques les plus avancees du monde documentaire (indexation en texte integral par traitement linguistique accelere) conjuguees a celles du monde de la veille informative, techniques capables de detecter les signaux faibles (traitement infometrique), la partie inherente a internet s'applique aux robots, a des nouveaux formats de representation 3d et a une typologie de systemes de diffusion d'information disponible sur le reseau.