Transformations d'arbres XML avec des modèles probabilistes pour l'annotation
Institution:
Lille 3Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette thèse traite de l'apprentissage de transformations d'arbres XML à l'aide de modèles probabilistes pour l'annotation. Pour cela, nous adaptons dans un premier temps au cas des arbres le modèle des champs aléatoires conditionnels (CRF), souvent utilisé pour l'apprentisssage d'annotations de séquences. Cette adaptation porte à la fois sur le modèle de dépendances et sur les algorithmes d'inférence exacte d'apprentissage. Nous apportons aussi deux méthodes d'amélioration de la complexité de ces algorithmes afin de permettre leur utilisation dans le cadre d'applications à grande échelle. Ces méthodes s'appuient toutes deux sur les connaissances du domaine pour améliorer la complexité, et consistent d'un côté en l'intégration de contraintes sur l'annotation, et de l'autre en l'approximation d'un CRF par plusieurs CRFs de complexité moindre.