thesis

Multiflot simultane et multimedia : outil, etude et optimisation

Defense date:

Jan. 1, 2001

Edit

Institution:

Paris 11

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Du fait du manque de parallelisme d'instructions et de l'ecart toujours croissant entre la vitesse des processeurs et le temps d'acces de la memoire dynamique, un unique flot d'instructions ne peut utiliser efficacement le materiel maintenant integrable dans un processeur. Une solution est d'executer plusieurs flots d'instructions a travers le multiflot simultane (smt), qui permet a tous les flots presents sur le processeur d'acceder simultanement a toutes les unites d'execution, est une approche prometteuse. Dans cette these, nous etudions les performances d'applications multimedias sur cette architecture. Ces applications, en plein developpement actuellement, possedent des caracteristiques particulieres qui font du smt une plate-forme interessante pour les executer. Dans un premier temps, nous presentons popspy, un instrumenteur de code executable pour le powerpc. Popspy permet notamment la generation de traces multiflot de programmes dont les sources ne sont pas disponibles, comme certains programmes utilises dans cette these. Il permet egalement la generation de traces altivec, l'extension multimedia du powerpc. Nous evaluons ensuite les performances de l'architecture smt sur nos applications en considerant differents dimensionnements du cur superscalaire et de la hierarchie memoire. Nous montrons que le smt permet de masquer la latence du cache de second niveau et est efficace sur ces applications, meme avec un grand nombre de flots. Les jeux d'instructions multimedia presents dans les processeurs ainsi que le prechargement de donnees sont deux moyens d'ameliorer les performances de ces applications. Nous analysons le benefice de l'association de ces deux mecanismes avec le smt, a la fois separement et conjointement, en fonction des caracteristiques de la hierarchie memoire. Nous montrons notamment que l'utilisation d'unites multimedia se justifie de moins en moins a mesure que le nombre de flots augmente ou que le d'ebit memoire diminue. Enfin, nous nous penchons sur l'optimisation particuliere du multiflot simultane pour la 3d polygonale temps-reel en tirant parti de la structure du pipeline graphique qui constitue le cur de cette application. Nous mettons a jour une pollution des stations de reservation du fait des echecs dans le cache de second niveau, et proposons un mecanisme de prediction pour controler l'emission des flots et eviter cette pollution. Nous obtenons ainsi des gains de performance significatifs.