Poste de recherche
L'apprentissage par renforcement du jeu autonome a donné naissance à des agents capables de jouer dans un certain nombre de domaines complexes tels que le go et les échecs. Ces joueurs ont été évalués par rapport à d'autres agents de pointe et à des joueurs humains professionnels et ont démontré une compétence dépassant ces adversaires. Mais une forte performance en compétition signifie-t-elle également que les agents peuvent (faiblement ou fortement) résoudre le jeu ? Ou même résoudre approximativement le jeu ? Aucun travail existant ne s'est penché sur cette question. Nous proposons d'aligner notre évaluation des agents auto-joueurs avec des mesures de stratégies de résolution fortes/faibles afin de fournir une mesure de la force d'un agent. À l'aide de petits jeux, nous établissons une méthodologie pour mesurer la force d'un agent autodidacte et son écart par rapport à un agent à forte résolution, qui joue de manière optimale quelles que soient les décisions de l'adversaire. Nous fournissons des métriques qui utilisent des données de base provenant de petits jeux résolus pour quantifier la force d'un agent et sa capacité à généraliser à un domaine. Nous effectuons ensuite une analyse d'un agent autodidacte en utilisant des versions réduites des dames chinoises.
24 février 2022
Poste de recherche
1er février 2022
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Michael Bowling, boursiers Amii et titulaires de la chaire d'IA du CIFAR Canada : Repenser les modèles formels de prise de décision multi-agents partiellement observables.
6 décembre 2021
Poste de recherche
Lisez ce document de recherche, coécrit par Neil Burch et Micheal Bowling, boursiers Amii et titulaires de chaires d'IA au CIFAR : Le joueur de jeux
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.