Poste de recherche
Une métrique standard utilisée pour mesurer l'optimalité approximative des politiques dans les jeux à information imparfaite est l'exploitabilité, c'est-à-dire la performance d'une politique contre son adversaire dans le pire des cas. Cependant, l'exploitabilité est difficile à calculer dans les grands jeux car elle nécessite une traversée complète de l'arbre de jeu pour calculer la meilleure réponse à la politique donnée. Nous introduisons une nouvelle métrique, l'exploitabilité approximative, qui calcule une métrique analogue en utilisant une meilleure réponse approximative ; l'approximation est faite en utilisant la recherche et l'apprentissage par renforcement. Il s'agit d'une généralisation de la meilleure réponse locale, une métrique d'évaluation spécifique au domaine utilisée au poker. Nous fournissons des résultats empiriques pour une instance spécifique de la méthode, démontrant que notre méthode converge vers l'exploitabilité dans les paramètres d'approximation tabulaire et de fonction pour les petits jeux. Dans les grandes parties, notre méthode apprend à exploiter les agents forts et faibles, en apprenant à exploiter un agent AlphaZéro.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.