thesis

Apprentissage statistique contre des agents stratégiques et non-stratégiques, avec application à la théorie des enchères

Defense date:

Dec. 17, 2019

Edit

Disciplines:

Authors:

Directors:

Abstract EN:

The common thread of this manuscript is the study of some of the main automatic decision processes using data provided by either strategic or non-strategic agents. In the first part of the manuscript, we study the learning of revenue-maximizing auctions on data provided by the bidders. We first introduce this framework by a detailed overview of the classical results of the auction literature. We prove that if one bidder is aware that his bid distribution is used in order to optimize the seller's revenue, he can take advantage of this data-driven mechanism and increase his utility. To do so, we introduce a simple and generic variational approach to design novel bidding strategies. This strategy works with general value distributions, with asymmetric bidders and for different revenue-maximizing mechanisms. Furthermore, it can be made robust to sample approximation errors on the seller part. This results in a large increase in utility for bidders whether they have a full or partial knowledge of their competitors. This approach naturally yields itself to numerical optimization and algorithms for designing the strategies. We show that these algorithms can be extended to tackle more complicated setups such as the multi-item setting, where no analytical solutions are known. We also study the economical consequences of the existence of such shading strategies on recent results on collusion in revenue-maximizing auctions. This represents a new contribution to the recent line of research at the frontier of game theory, economics and statistics showing how the use of modern statistical learning algorithms on the large amount of data available on internet platforms modifies classical economics interactions.In the second part of the manuscript, we study practical decisions processes enabling to take informed decisions when data are provided by non-strategic agents. We focus on the A/B testing setting where an agent needs to choose between two alternatives. We introduce a new algorithm interpolating between two classical objectives of the multi-armed bandit literature: regret minimization and best-arm identification. Finally, we study some of the main counterfactual estimators used by practitioners when they have access to randomized data. We provide a large overview of most of these estimators, exhibit some of their theoretical properties, their interest in practice and some of their main limitations. This second part provides a large overview of practical statistical tools that can be be used in modern industrial applications.

Abstract FR:

Le fil directeur de cette thèse est l'étude de mécanismes de décision automatique utilisant des données recueillies en interagissant avec des agents stratégiques ou non-stratégiques. Dans la première partie, nous nous intéressons à l'un des problèmes fondateur de la théorie des mécanismes d'incitation, l'apprentissage de l'enchère maximisant le revenu du vendeur. Cette théorie suppose l'existence d'une distribution de valeur qui permet au vendeur d'optimiser son mécanisme. Pour estimer cette distribution de valeur, les vendeurs utilisent en pratique pour la plupart la distribution des enchères passées des différents acheteurs. En considérant cette hypothèse, nous prouvons qu'il existe des stratégie simples qui permettent aux acheteurs d'augmenter très fortement leur utilité si le vendeur utilise ses enchères passées pour optimiser son mécanisme. Nous commençons par une étude détaillée des principaux résultats de la littérature des enchères. Nous introduisons une forme variationnelle qui permet à la fois de calculer analytiquement des équilibres de Nash mais aussi de mettre en place des méthodes numériques. Nous prouvons que notre approche est robuste par rapport au nombre d'exemples accessibles au vendeur et à une connaissance partielle de la distribution de la compétition. Notre approche numérique nous permet de considérer d'autres configurations plus complexes comme les enchères simultanées de plusieurs objets. Nos travaux sont une nouvelle contribution à l'ensemble des recherches récentes qui s'intéressent à comment certains résultats à la frontière entre la théorie des jeux et l'économie doivent être repensés au moment où des algorithmes d'apprentissage statistique sont utilisés pour exploiter la masse de données disponibles sur la plupart des grandes plateformes internet. Dans la seconde partie, indépendante de la première, nous nous intéressons à ce qu'il est possible de faire pour un agent qui a accès à des données qui n'ont pas été manipulées par un agent stratégique, comme dans un essai clinique par exemple. Nous introduisons un nouvel algorithme qui permet d'arbitrer entre la longueur et le coût d'un A/B test ou de toute expérimentation statistique. Lorsque l'expérimentateur a accès à des données récoltées de façon aléatoire, il est aussi capable de faire des raisonnements contrefactuels. Nous étudions les différents estimateurs qui permettent de faire ce type de raisonnement et proposons un nouvel estimateur plus adapté à l'étude des systèmes de recommandations. Cette seconde partie se concentre sur certains des principaux outils statistiques aujourd'hui utilisés pour mettre en place des systèmes automatisés de prises de décisions.