Poste de recherche
Un ensemble de travaux récents traite des contraintes de sécurité dans les systèmes d'exploration-exploitation. De telles contraintes apparaissent lorsque, par exemple, l'exploration est effectuée par des individus dont le bien-être doit être équilibré par rapport au bien-être global. Dans cet article, nous adoptons un modèle inspiré de travaux récents sur un cadre de type bandit pour les recommandations. Nous contribuons à cette ligne de littérature en introduisant une contrainte de sécurité qui doit être respectée à chaque tour et qui détermine que la valeur attendue à chaque tour est supérieure à un seuil donné. En raison de notre modélisation, la politique d'exploration et d'exploitation sûre mérite une planification minutieuse, sinon, elle conduira à un bien-être sous-optimal. Nous concevons un algorithme asymptotiquement optimal pour ce paramètre et analysons son taux de convergence en fonction de l'instance.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.