Poste de recherche
L'exploration efficace dans les bandits est un problème fondamental d'apprentissage en ligne. Nous proposons une variante de l'échantillonnage de Thompson qui apprend à mieux explorer lorsqu'elle interagit avec des instances de bandits tirées d'une antériorité inconnue. L'algorithme méta-apprend le préalable et nous l'appelons donc MetaTS. Nous proposons plusieurs implémentations efficaces de MetaTS et l'analysons dans les bandits gaussiens. Notre analyse montre l'avantage du méta-apprentissage et présente un intérêt plus large, car nous déduisons une nouvelle limite de regret de Bayes dépendant de l'antériorité pour l'échantillonnage de Thompson. Notre théorie est complétée par une évaluation empirique, qui montre que MetaTS s'adapte rapidement à l'antériorité inconnue.
15 février 2022
Poste de recherche
Lisez ce document de recherche, co-écrit par Osmar Zaiane, boursier Amii et président du CIFAR AI au Canada : UCTransNet : Repenser les connexions de saut dans U-Net d'une perspective de canal avec Transformer.
27 septembre 2021
Poste de recherche
17 septembre 2021
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.