Institut de l'intelligence artificielle de l'Alberta

Apprentissage responsable du bandit via l'utilité de la volatilité moyenne avec protection de la vie privée

Publié

24 mars 2024

Auteurs

Bei Jiang

Linglong Kong

Xiaodong Yan

Shanshan Zhao

Wenhai Cui

Partager