Séminaire sur l'IA - Dustin Morrill
En ligne
En ligne
Résumé : Une approche réussie pour jouer à des jeux à somme nulle à deux joueurs a été de déployer un artefact statique ressemblant à un équilibre de Nash, ce qui a conduit les travaux en intelligence artificielle à se concentrer sur le calcul de tels artefacts. Cette approche est moins solide et a connu moins de succès dans les jeux multi-joueurs à somme globale. Nous suggérons plutôt de mettre en place des algorithmes d'apprentissage qui garantissent de bonnes performances a posteriori par rapport à des "déviations", c'est-à-dire des modifications de comportement prédéfinies. Une société de tels agents "rationnels a posteriori" converge vers l'équilibre médié, une notion traditionnelle d'équilibre basée sur le jeu corrélé moyen plutôt que sur le comportement facturé, contrairement à l'équilibre de Nash. Nous réexaminons les types de déviation et les équilibres médiats dans les jeux de forme extensive afin d'obtenir une compréhension plus complète et de résoudre les idées fausses du passé. Nous introduisons un nouveau type de déviation qui a implicitement constitué la base de l'algorithme de minimisation du regret contrefactuel (CFR). Nous généralisons l'algorithme CFR à l'algorithme de minimisation du regret de forme extensive (EFR) qui est rétrospectivement rationnel pour tout type de déviation donné dans une classe large et naturelle. Cette classe contient de nouveaux types de déviation puissants qui sont efficaces dans les jeux de longueur moyenne. Nous présentons une analyse empirique des performances de l'EFR avec différents types de déviations dans des jeux de référence courants, montrant que les types de déviations les plus forts donnent généralement de meilleures performances, même dans les jeux à somme nulle à deux joueurs.
Biographie du présentateur : Dustin est un candidat au doctorat à l'Université de l'Alberta et à l'Alberta Machine Intelligence Institute (Amii), travaillant avec le professeur Michael Bowling. Il travaille sur l'apprentissage multi-agent et les algorithmes d'apprentissage fiables et évolutifs. Il est coauteur de[DeepStack] et a créé[l'interface de correspondance publique de Cepheus]. Il a obtenu un B.Sc. et un M.Sc. en informatique à l'université d'Alberta, où son M.Sc. était également supervisé par Michael Bowling. En tant qu'étudiant de premier cycle, il a collaboré avec le groupe de recherche sur le poker informatique (CPRG) pour créer une[interface Web à code source ouvert permettant de jouer contre des robots de poker] et pour développer le jeu de poker Kuhn à trois joueurs qui a remporté la première place lors de la compétition annuelle de poker informatique (ACPC) de 2014.
Le séminaire sur l'intelligence artificielle (IA) de l'Université de l'Alberta est une réunion hebdomadaire où les chercheurs (y compris les étudiants, les développeurs et les professeurs) intéressés par l'IA peuvent partager leurs recherches actuelles. Les présentateurs comprennent des conférenciers locaux de l'Université de l'Alberta et de l'industrie ainsi que d'autres institutions. Les séminaires abordent un large éventail de sujets liés de près ou de loin à l'intelligence artificielle, depuis les travaux théoriques fondamentaux jusqu'aux applications novatrices des techniques d'IA à de nouveaux domaines et problèmes.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.