L'assemblage de programmes au sein de plateformes logicielles : syntaxe, sémantique et pragmatique : Application aux plateformes dédiées aux simulations en agronomie
Institution:
Montpellier 2Disciplines:
Directors:
Abstract EN:
The systems envisaged by the life sciences (genetics, agronomy, ecology etc. ) are, for the most, complex systems constituted by many interacting entities whose behaviour can not be apprehended by a single observer. In the 1960s, the advent of the computer allows the capitalization of knowledge gathered in computing programs. The advantage of these programs was quickly recognized in the areas of data extrapolation and prediction. In the early 1980s, the idea of accessing other knowledge by joining programs gave birth to software platforms. Such buildings are designed to allow a research team to access multidisciplinary knowledge by combination of programs developed by other teams working on other scientific objects and in other areas. The current issue of such software platforms is to answer new questions raised by sustainable development, which involves environmental sustainability, economic viability and social equity. To support the construction of software platforms, computer scientists have developed generic platform dedicated to program assembly. The research field opened by software platform is the study of languages dedicated in the association of programs developed using other languages. In terms of semantics (meaning), the assembly of programs raises the question of the consistency of their juxtaposition. As the programs are developed according to specific languages, this consistency needs to be analyzed to both syntactic and semantic levels. Furthermore, using a predetermined language dedicated to assembly raises the question of the role of the syntax on the possibilities to compose programs and therefore the semantics conveyed by the syntax. The thesis deals with semantic issues generated by the assembly. The underlying assumption is that assembly language is a semantic interface between programs. For our study, we developed an original frame of analysis elaborated on the basis of work from cybernetics, software engineering and artificial intelligence. The analysis frame considers morphological, syntactic, and semantic levels of the assembly language. Three assembly supports generic (MODCOM, OpenMI, and VLE) and three agronomic software platforms (APES, DSSAT, and SEAMLESS-IF) were analyzed (Chapter A). We show that the syntactic rules, inherent to assembly language, limit the ability of the assembly language to represent some complex systems. We also show that the efficiency of metadata and ontology depends on the semantic of the vocabulary used to describe the input and output of the programs. To access this semantics, we use the assumption that this is the description of the contents of the program that allows the construction of the vocabulary. We propose a model for programs description established using pragmatic linguistic results and morphosyntactic works (chapter B). The description is based on the seven pronouns and adverbs that French language offer. A typology of responses is associated to each of these interrogative pronouns and adverbs using linguistic bibliography. The use of the principle of Guillaume to organize these typologies provides a formal structure for the program description. In chapter C, the use of semantic networks (conceptual graph) as a support for implementation of the model is discussed, and the value of work is shown. In conclusion, we hold our contributions in light of questions and deliver research questions into perspective of this work
Abstract FR:
Les systèmes envisagés par les sciences du vivant (génétique, agronomie, écologie etc. ) sont pour la plupart des systèmes complexes constitués d'un grand nombre d'entités en interaction, dont le comportement et l'évolution ne peuvent pas être appréhendés par un observateur unique. A partir des années 1960, l'apparition de l'informatique permet de capitaliser les savoirs recueillis sous la forme de programmes. L'intérêt de ces programmes a rapidement été reconnu dans les domaines de l'extrapolation et de la prédiction. Au début des années 1980, l'idée d'accéder à d'autres savoirs par voie d'assemblage de programmes a donné naissance aux plateformes logicielles. De telles constructions visent à permettre à une équipe de recherche d'accéder à des savoirs pluridisciplinaires par association de programmes élaborés par d'autres équipes, travaillant sur d'autres objets et dans d'autres domaines. L'enjeu actuel de telles plateformes logicielles est de répondre aux nouvelles questions posées par le Développement Durable impliquant durabilité écologique, viabilité économique et équité sociale. En appui à la construction des plateformes logicielles, les informaticiens ont développé des supports génériques d'assemblage de programmes. Le champ de recherche ouvert par les plateformes est celui de l'étude de langages permettant d'associer des programmes établis au moyen d'autres langages. En termes de sémantique (signification), l'assemblage de programmes pose la question de la cohérence de leur juxtaposition. Les programmes étant développés selon des langages particuliers, cette cohérence s'analyse aux deux niveaux syntaxiques et sémantiques. Par ailleurs, l'utilisation d'un langage préétabli, dévolu à l'assemblage, pose la question du rôle de sa syntaxe sur les possibilités de composition des programmes et par conséquent celle de la sémantique véhiculée par cette syntaxe. La thèse traite de questions sémantiques générées par l'assemblage. L'hypothèse sous-jacente au travail, est que le langage d'assemblage constitue une interface sémantique entre les programmes. Pour notre étude, nous avons mis au point une trame d'analyse originale établie sur la base de travaux en cybernétique, ingénierie logicielle et intelligence artificielle. La trame considère les niveaux morphologiques, syntaxiques et sémantiques des langages d'assemblage. Trois supports génériques d'assemblage (MODCOM, OpenMI, et VLE) et trois plateformes logicielles agronomiques (APES, DSSAT, et SEAMLESS-IF) ont été analysées (chapitre A). Au travers de l'analyse, nous montrons que les règles syntaxiques inhérentes aux langages d'assemblages limitent l'aptitude de ceux-ci à représenter certains systèmes complexes. Nous montrons aussi que l'efficience des métadonnées et ontologies, destinées à faire coïncider les entrées / sorties, dépend de la sémantique du vocabulaire employé dans les programmes. Pour accéder à cette sémantique, nous partons de l'hypothèse que c'est la description du contenu du programme qui permet de construire le vocabulaire. Pour ce faire, nous proposons un modèle de description, établi à partir de la linguistique pragmatique et de travaux en morphosyntaxe (chapitre B). L'interrogation partielle en mode direct permet de conférer une structure de description basée sur les sept pronoms et adverbes que propose la langue française. A chacun de ces pronoms et adverbes interrogatifs, nous associons une typologie de réponses à partir de la bibliographie en linguistique. L'organisation de ces typologies, selon le principe d'incidence, nous permet d'établir une structure formelle de description. Dans le chapitre C, nous discutons de l'utilisation d'un formalisme de réseau sémantique existant (graphes conceptuels) comme support d'implémentation du modèle de description et l'intérêt du travail est illustré. En conclusion, nous statuons sur nos apports en regard des questions posées et livrons des questions de recherche en perspective à ce travail