Poste de recherche
Nous considérons l'évaluation de la politique hors contexte dans le cadre de bandits contextuels dans le but d'obtenir une stratégie robuste de sélection de la politique hors contexte, où la stratégie de sélection est évaluée en fonction de la valeur de la politique choisie dans un ensemble de politiques proposées (cibles). Nous proposons une nouvelle méthode pour calculer une borne inférieure sur la valeur d'une politique cible arbitraire compte tenu de certaines données enregistrées dans des bandits contextuels pour une couverture souhaitée. La limite inférieure est construite autour de l'estimateur dit de pondération d'importance auto-normalisée (SN). Elle combine l'utilisation d'une inégalité de queue semi-empirique Efron-Stein pour contrôler la concentration et l'inégalité de Harris pour contrôler le biais. La nouvelle approche est évaluée sur un certain nombre d'ensembles de données synthétiques et réelles et s'avère supérieure à ses principaux concurrents, tant en termes de rigueur des intervalles de confiance que de qualité des politiques choisies.
15 février 2022
Poste de recherche
Lisez ce document de recherche, co-écrit par Osmar Zaiane, boursier Amii et président du CIFAR AI au Canada : UCTransNet : Repenser les connexions de saut dans U-Net d'une perspective de canal avec Transformer.
27 septembre 2021
Poste de recherche
17 septembre 2021
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.