Poste de recherche

Les bandits fiduciaires

Résumé

Les systèmes de recommandation sont souvent confrontés à des compromis d'exploration-exploitation : le système ne peut apprendre l'intérêt de nouvelles options qu'en les recommandant à un utilisateur. De tels systèmes peuvent donc être modélisés comme des bandits à plusieurs bras ; cependant, les utilisateurs sont intéressés et ne peuvent pas être obligés de suivre les recommandations. Nous nous demandons si l'exploration peut néanmoins être effectuée d'une manière qui respecte scrupuleusement les intérêts des agents, c'est-à-dire par un système qui agit comme un fiduciaire. Plus formellement, nous introduisons un modèle dans lequel un système de recommandation est confronté à un compromis d'exploration-exploitation sous la contrainte qu'il ne peut jamais recommander une action dont il sait qu'elle donne une récompense inférieure à celle qu'un agent obtiendrait s'il agissait seul. Notre principale contribution est un résultat positif : un algorithme de recommandation asymptotiquement optimal, compatible avec les incitations et ex ante individuellement rationnel.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !