Poste de recherche
Nous étudions deux algorithmes randomisés pour les bandits linéaires généralisés. Le premier, GLM-TSL, échantillonne un modèle linéaire généralisé (GLM) à partir de l'approximation de Laplace de la distribution postérieure. Le second, GLM-FPL, ajuste un GLM à un historique aléatoirement perturbé des récompenses passées. Nous analysons les deux algorithmes et déduisons 𝑂̃ (𝑑𝑛log𝐾‾‾‾‾‾‾‾√)O~(dnlogK) limites supérieures de leur regret à 𝑛n tours, où 𝑑d est le nombre de caractéristiques et 𝐾K est le nombre de bras. Le premier améliore les travaux antérieurs tandis que le second est le premier pour les perturbations de bruit gaussien dans les modèles non linéaires. Nous évaluons empiriquement le GLM-TSL et le GLM-FPL dans les bandits logistiques, et nous appliquons le GLM-FPL aux bandits à réseaux neuronaux. Notre travail met en évidence le rôle de la randomisation, au-delà de l'échantillonnage postérieur, dans l'exploration.
15 février 2022
Poste de recherche
Lisez ce document de recherche, co-écrit par Osmar Zaiane, boursier Amii et président du CIFAR AI au Canada : UCTransNet : Repenser les connexions de saut dans U-Net d'une perspective de canal avec Transformer.
27 septembre 2021
Poste de recherche
17 septembre 2021
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.