Poste de recherche

Mesurer la force de solution des agents d'apprentissage dans les jeux d'information parfaite adversariaux.

Résumé :

L'apprentissage par renforcement du jeu autonome a donné naissance à des agents capables de jouer dans un certain nombre de domaines complexes tels que le go et les échecs. Ces joueurs ont été évalués par rapport à d'autres agents de pointe et à des joueurs humains professionnels et ont démontré une compétence dépassant ces adversaires. Mais une forte performance en compétition signifie-t-elle également que les agents peuvent (faiblement ou fortement) résoudre le jeu ? Ou même résoudre approximativement le jeu ? Aucun travail existant ne s'est penché sur cette question. Nous proposons d'aligner notre évaluation des agents auto-joueurs avec des mesures de stratégies de résolution fortes/faibles afin de fournir une mesure de la force d'un agent. À l'aide de petits jeux, nous établissons une méthodologie pour mesurer la force d'un agent autodidacte et son écart par rapport à un agent à forte résolution, qui joue de manière optimale quelles que soient les décisions de l'adversaire. Nous fournissons des métriques qui utilisent des données de base provenant de petits jeux résolus pour quantifier la force d'un agent et sa capacité à généraliser à un domaine. Nous effectuons ensuite une analyse d'un agent autodidacte en utilisant des versions réduites des dames chinoises.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !