Poste de recherche
La théorie comportementale des jeux cherche à décrire la façon dont les personnes réelles (par rapport aux agents "rationnels" idéalisés) agissent dans des situations stratégiques. Nos propres travaux récents ont identifié les modèles itératifs (tels que la hiérarchie cognitive quantique) comme l'état de l'art pour prédire le jeu humain dans les jeux non répétés à mouvements simultanés [Wright et Leyton-Brown 2012]. Les modèles itératifs prédisent que les agents raisonnent de manière itérative sur leurs adversaires, en partant d'une spécification du comportement non stratégique appelée niveau 0. Le modélisateur est en principe libre de choisir n'importe quelle description du comportement de niveau 0 qui a du sens pour le contexte donné ; cependant, en pratique, presque tous les travaux existants spécifient ce comportement comme une distribution uniforme sur les actions. Dans la plupart des jeux, il n'est pas plausible que même les agents non stratégiques choisissent une action uniformément au hasard, ni que les autres agents s'attendent à ce qu'ils le fassent. Un modèle plus précis pour le comportement du niveau 0 a le potentiel d'améliorer considérablement les prédictions du comportement humain, puisqu'une fraction substantielle des agents peut jouer des stratégies de niveau 0 directement, et de plus puisque les modèles itératifs fondent toutes les stratégies de niveau supérieur en réponse à la stratégie de niveau 0. Notre travail considère des "méta-modèles" du comportement du niveau 0 : des modèles de la façon dont les agents de niveau 0 construisent une distribution de probabilité sur les actions, étant donné un jeu arbitraire. Nous avons évalué plusieurs de ces méta-modèles, chacun d'entre eux faisant sa prédiction en se basant uniquement sur des caractéristiques générales qui peuvent être calculées à partir de n'importe quel jeu de forme normale. Nous avons évalué les effets de la combinaison de chaque nouveau méta-modèle de niveau 0 avec divers modèles itératifs, et dans de nombreux cas, nous avons observé de grandes améliorations dans la précision de prédiction des modèles. Au final, nous recommandons un méta-modèle qui a obtenu d'excellentes performances dans tous les domaines : une pondération linéaire des caractéristiques qui nécessite l'estimation de cinq poids.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.