Présentateur : Yangchen Pan, Département des sciences de l'ingénieur, Université d'Oxford
Titre: Unification de l'apprentissage supervisé et de l'apprentissage par renforcement via une formulation MRP : apprentissage TD généralisé
Résumé : Cette présentation remet en question l'hypothèse traditionnelle i.i.d. dans l'apprentissage statistique en modélisant les données comme étant interconnectées par un processus de récompense de Markov (MRP). Nous reformulons l'apprentissage supervisé comme une évaluation de politique en cours dans l'apprentissage par renforcement (RL) et proposons un algorithme d'apprentissage par différence temporelle (TD) généralisé. Notre analyse théorique relie les solutions linéaires de TD aux moindres carrés ordinaires (OLS), montrant l'avantage de TD lorsque le bruit est corrélé. Nous prouvons la convergence en cas d'approximation de la fonction linéaire. Des études empiriques valident notre approche, montrant son utilité dans des tâches telles que la régression et la classification d'images basée sur l'apprentissage profond.
Bio du présentateur : Yangchen Pan est maître de conférences en apprentissage automatique au département des sciences de l'ingénieur de l'université d'Oxford. Il a obtenu son doctorat à l'Université de l'Alberta sous la direction des professeurs Martha White et Amir-massoud Farahmand. Ses recherches portent sur l'obtention d'une généralisation efficace sur le plan de l'échantillonnage avec un calcul évolutif, avec un intérêt particulier pour les contextes d'apprentissage impliquant des changements de distribution, y compris l'apprentissage robuste, l'apprentissage par renforcement et l'apprentissage continu.
Animé par: Dr. Martha White
À propos du séminaire sur l'IA
Organisé par Amii, Séminaire sur l'IA est une réunion hebdomadaire au cours de laquelle des étudiants, des développeurs et des professeurs dans le domaine de l'IA partagent leurs recherches actuelles. Les présentateurs sont issus de l'Université de l'Alberta, de l'industrie locale et d'autres institutions du Canada et de l'étranger. Une fois par mois, Technology Alberta participe en tant que co-organisateur et présente de nouvelles entreprises technologiques albertaines très prometteuses.
Pour en savoir plus et voir tous les séminaires à venir, consultez le site web du séminaire sur l'IA.