Poste de recherche
Pour que les systèmes d'apprentissage artificiellement intelligents puissent être largement appliqués dans le monde réel, il est important qu'ils soient capables de fonctionner de manière décentralisée. Malheureusement, le contrôle décentralisé est difficile -- calculer même une politique commune epsilon-optimale est un problème NEXP complet. Néanmoins, une idée récemment redécouverte, à savoir qu'une équipe d'agents peut se coordonner par le biais de connaissances communes, a donné naissance à des algorithmes capables de trouver des politiques conjointes optimales dans de petits jeux à gains communs. Le décodeur d'action bayésien (BAD) exploite cette idée et l'apprentissage par renforcement profond pour s'adapter à des jeux aussi grands que le Hanabi à deux joueurs. Cependant, les approximations qu'il utilise pour ce faire l'empêchent de découvrir des politiques conjointes optimales, même dans des jeux suffisamment petits pour trouver des solutions optimales par force brute. Ce travail propose CAPI, un nouvel algorithme qui, comme BAD, combine la connaissance commune avec l'apprentissage par renforcement profond. Cependant, contrairement à BAD, CAPI donne la priorité à la propension à découvrir des politiques conjointes optimales plutôt qu'à l'évolutivité. Bien que ce choix empêche CAPI de s'adapter à des jeux aussi grands que Hanabi, les résultats empiriques démontrent que, sur les jeux auxquels CAPI s'adapte, il est capable de découvrir des politiques conjointes optimales même lorsque d'autres algorithmes modernes d'apprentissage par renforcement multi-agents sont incapables de le faire. Le code est disponible à cette URL https.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.