Poste de recherche
En raison des récents succès remportés dans la résolution de jeux à somme nulle à deux joueurs, les travaux d'intelligence artificielle sur les jeux se sont de plus en plus concentrés sur les algorithmes qui produisent des stratégies basées sur l'équilibre. Toutefois, cette approche s'est avérée moins efficace pour produire des joueurs compétents dans les jeux à somme globale ou ceux qui comptent plus de deux joueurs que dans les jeux à somme nulle à deux joueurs. Une alternative séduisante consiste à envisager des algorithmes adaptatifs qui garantissent de bonnes performances a posteriori par rapport à ce qui aurait pu être obtenu avec un comportement modifié. Cette approche conduit également à une analyse de la théorie des jeux, mais dans le jeu corrélé qui découle de la dynamique d'apprentissage conjointe plutôt que du comportement de l'agent facturé à l'équilibre. Nous développons et défendons ce cadre de rationalité a posteriori de l'apprentissage dans des contextes généraux de prise de décision séquentielle. À cette fin, nous réexaminons l'équilibre médié et les types de déviation dans les jeux de forme extensive, ce qui nous permet d'acquérir une compréhension plus complète et de résoudre les idées fausses du passé. Nous présentons une série d'exemples illustrant les forces et faiblesses distinctes de chaque type d'équilibre dans la littérature, et nous prouvons qu'aucun concept traçable ne subsume tous les autres. Cette ligne d'investigation culmine dans la définition des classes de déviation et d'équilibre qui correspondent aux algorithmes de la famille de la minimisation du regret contrefactuel (CFR), les reliant à tous les autres dans la littérature. L'examen plus détaillé de la CFR conduit à une nouvelle définition récursive de la rationalité dans le jeu corrélé qui étend la rationalité séquentielle d'une manière qui s'applique naturellement à l'évaluation rétrospective.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.