Poste de recherche
Dans cet article, nous étudions la dynamique du suivi du leader régularisé dans les jeux séquentiels à information imparfaite (IIG). Nous généralisons les résultats existants de la récurrence de Poincaré des jeux de forme normale aux jeux d'information imparfaits à deux joueurs à somme nulle et à d'autres paramètres de jeux séquentiels. Nous étudions ensuite comment l'adaptation de la récompense (en ajoutant un terme de régularisation) du jeu peut donner de fortes garanties de convergence dans les jeux monotones. Nous continuons en montrant comment cette technique d'adaptation de la récompense peut être exploitée pour construire des algorithmes qui convergent exactement vers l'équilibre de Nash. Enfin, nous montrons comment ces idées peuvent être directement utilisées pour construire des algorithmes sans modèle de pointe pour les jeux à somme nulle et à deux joueurs à information imparfaite (IIG).
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.