Séminaire sur l'IA - Emilie Kaufmann
En ligne
En ligne
Titre : Sur la complexité de l'apprentissage de bonnes politiques avec et sans récompenses
Résumé : Cet exposé tournera autour de deux critères de performance qui ont été étudiés dans le contexte de l'apprentissage par renforcement épisodique : un ancien, le Best Policy Identification (BPI) [Fiechter, 1994], et un nouveau, le Reward Free Exploration (RFE) [Jin et al., 2020]. Nous allons voir qu'une variante du tout premier algorithme BPI peut en fait être utilisée pour le problème plus difficile de l'exploration sans récompense. Cet algorithme RFE sans récompense, qui explore de manière adaptative le MDP et décide de manière adaptative quand arrêter l'exploration, nécessite moins d'épisodes d'exploration que les algorithmes de l'état de l'art. Nous présenterons ensuite des algorithmes alternatifs pour l'objectif BPI et discuterons de la complexité relative de BPI et RFE.
Bio : Emilie Kaufmann est chercheuse CNRS au sein du laboratoire CRIStAL de l'Université de Lille. Elle est également membre de l'équipe Inria Scool (anciennement SequeL), dont l'expertise porte sur la prise de décision séquentielle. Elle a beaucoup travaillé sur le problème du bandit multi-armé stochastique, en particulier pour mieux comprendre la différence entre la maximisation des récompenses et les problèmes d'exploration pure. Elle a également travaillé récemment sur l'exploration pour l'apprentissage par renforcement.
Le séminaire sur l'intelligence artificielle (IA) de l'Université de l'Alberta est une réunion hebdomadaire où les chercheurs (y compris les étudiants, les développeurs et les professeurs) intéressés par l'IA peuvent partager leurs recherches actuelles. Les présentateurs comprennent des conférenciers locaux de l'Université de l'Alberta et de l'industrie ainsi que d'autres institutions. Les séminaires abordent un large éventail de sujets liés de près ou de loin à l'intelligence artificielle, depuis les travaux théoriques fondamentaux jusqu'aux applications novatrices des techniques d'IA à de nouveaux domaines et problèmes.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.