Knowledge Tree

thesis

Une plateforme d'aide à l'acquisition et à la maintenance des règles métier à partir de textes règlementaires

Defense date:

Jan. 1, 2013

Edit

Institution:

Paris 13

Disciplines:

Computer sciences

Authors:

Abdoulaye Guissé

Directors:

François Lévy

Abstract EN:

Decision support systems are usually based on a set of business rules that constrain the information system data of a company. They can cope with e. G. Computing the amount of taxes that is owed by a taxpayer as well as awarding benefits to clients of a company or controling the quality of an industrial process. This thesis has taken place in the framework of the European project OntoRule (ONTOlogies meet business RULEs). It focuses on the acquisition of rules from original regulatory texts written by business experts, belonging to the company or not. Our goal is to help experts, who best understant these texts, to translate rules from natural language toward a simpler and less ambiguous language. Moreover, we propose to help diagnosing maintenance problems caused by incoherencies happening either along the translation of rules, or when the original texts evolve. These rules are generally available in documents written in natural language, and their regulatory character marks the form of this language. In order to translate them into executable rules and to integrate them in decision making systems, text fragments embeding rules must first be identified. Then a transformation must be driven from natural language rules to formal rules. The problem is then to reduce the burden of this transformation, at the more heavy since this complex language can only be safely handled and interpreted by experts. We propose to equip the task of explicitating initial rules into an easily understandable expression, so that, relying on this expression, formalization and implementation work can start. In order to do so, we propose to business experts an interactive framework which helps them structuring and organizing better the explicitation work. This framework consists of : – a two-steps acquisition methodology : a first step organizes a search in the syntactic and semantic representations of texts in order to identify sentences which are relevant as rules ; and a second step consists in normalizing these sentences, through a controlled natural language as SBVR-SE, in order to simplify them, disambiguate them and make easier their translation into a formal language. – A documented semantic model that defines a navigation structure to assist acquisition and articulate regulatory texts, business concepts described by an ontology and the set of extracted rules. This structure, relying on its tracing functionality, also supports the management of incoherency in rules relatively to needs as identified in the initial, and of changes when initial texts evolve. The model is formally represented according to Semantic Web technologies (RDF, RDFS, RDFa, OWL, SPARQL) through an RDF graph. – a platform ; SemEx, which provides on the one hand interfaces to navigate and query an RDF graph with the help of the CORESE inference engine, on the other hand an interface to edit rules according to the acquisition methodology. SemEx is an open source application written in Java.

Abstract FR:

Les systèmes décisionnels reposent généralement sur un ensemble de règles métier qui contraignent et conditionnent les données du système d’information d’une entreprise. Elles peuvent concerner aussi bien le calcul de l’impôt d’un contribuable que l’attribution de points de fidélité à des clients ou le contrôle de qualité d’un processus industriel. Cette thèse a été conduite dans le cadre du projet européen ONTORULE (ONTOlogy meets business RULEs). Elle s’intéresse à l’acquisition des règles à partir des textes règlementaires originaux produits par des experts métier, de l’entreprise ou extérieurs. Notre objectif est d’aider les experts, qui comprennent le mieux ces textes, à traduire les règles du langage naturel vers un langage plus simple et moins ambigu. De plus, nous proposons d’aider au diagnostic des problèmes de maintenance causés par des incohérences produites tout au long de la transformation des règles ou lorsque les textes évoluent. Ces règles sont généralement disponibles dans des documents rédigés dans une forme de langage naturel souvent marquée par leur valeur réglementaire. Afin de les traduire en règles exécutables et de les intégrer dans des systèmes d’aide à la décision, il est nécessaire d’identifier dans les textes les fragments textuels représentant des règles. Puis il faut conduire une transformation des règles en langage naturel en des règles formelles. Se pose alors le problème d’alléger la charge de cette transformation, d’autant plus lourde que la complexité du langage employé en réserve l’interprétation et la manipulation à des experts. Nous proposons d’outiller l’explicitation des règles initiales en une expression facilement compréhensible, à partir de laquelle peut commencer le travail de formalisation et d’implémentation. Pour se faire, nous proposons aux experts métier un cadre interactif qui les aide à mieux structurer et organiser le travail d’explicitation. Ce cadre comporte : – une méthodologie d’acquisition en deux étapes : la première consiste en une fouille à partir de la représentation syntaxique et sémantique des textes afin d’identifier les phrases représentant des règles ; et la seconde étape consiste à normaliser ces phrases via un langage naturel contrôlé comme SBVR SE afin de les simplifier, les désambiguïser et faciliter leur traduction dans un langage formel. – un modèle sémantique documenté qui définit une structure de navigation pour assister l’acquisition et articuler les textes règlementaires, les concepts métier de domaine décrits par une ontologie et l’ensemble de règles extraites. Cette structure, sur la base de ses fonctionnalités de traçabilité, sert aussi pour la gestion des incohérences dans les règles et de l’évolution des textes. Le modèle est formellement représenté avec des standards du Web sémantique (RDF, RDFs, RDFa, OWL, SPARQL) à travers un graphe RDF. – une plateforme, SemEx, qui fournit d’une part des interfaces pour la navigation et l’interrogation d’un graphe RDF en utilisant le moteur de raisonnement CORESE, d’autre part une interface d’édition de règles implémentant la méthodologie d’acquisition. SemEx est une application open source en Java.