Apprentissage responsable du banditisme par le biais d'une utilité de volatilité moyenne protégée par la confidentialité - Alberta Machine Intelligence Institute

Apprentissage responsable du bandit via l'utilité de la volatilité moyenne avec protection de la vie privée

Publié

24 mars 2024

Auteurs

Xiaodong Yan

Shanshan Zhao

Wenhai Cui