Institut de l'intelligence artificielle de l'Alberta

Séminaire sur l'IA : Dr. Yangchen Pan

Date

13 décembre 2024

L'heure

12 - 13 heures MT

Localisation

Hybride : En ligne ou CS Centre Salle 3-33, Université de l'Alberta, Edmonton

Type de contenu

Technique

Présentateur : Yangchen Pan, Département des sciences de l'ingénieur, Université d'Oxford

Titre: Unification de l'apprentissage supervisé et de l'apprentissage par renforcement via une formulation MRP : apprentissage TD généralisé

Résumé : Cette présentation remet en question l'hypothèse traditionnelle i.i.d. dans l'apprentissage statistique en modélisant les données comme étant interconnectées par un processus de récompense de Markov (MRP). Nous reformulons l'apprentissage supervisé comme une évaluation de politique en cours dans l'apprentissage par renforcement (RL) et proposons un algorithme d'apprentissage par différence temporelle (TD) généralisé. Notre analyse théorique relie les solutions linéaires de TD aux moindres carrés ordinaires (OLS), montrant l'avantage de TD lorsque le bruit est corrélé. Nous prouvons la convergence en cas d'approximation de la fonction linéaire. Des études empiriques valident notre approche, montrant son utilité dans des tâches telles que la régression et la classification d'images basée sur l'apprentissage profond.

Bio du présentateur : Yangchen Pan est maître de conférences en apprentissage automatique au département des sciences de l'ingénieur de l'université d'Oxford. Il a obtenu son doctorat à l'Université de l'Alberta sous la direction des professeurs Martha White et Amir-massoud Farahmand. Ses recherches portent sur l'obtention d'une généralisation efficace sur le plan de l'échantillonnage avec un calcul évolutif, avec un intérêt particulier pour les contextes d'apprentissage impliquant des changements de distribution, y compris l'apprentissage robuste, l'apprentissage par renforcement et l'apprentissage continu.

Animé par: Dr. Martha White

Assister

En personne

RSVP avant 9 heures le jour de l'événement

En ligne

Mot de passe : Spr!ng2023

À propos du séminaire sur l'IA

Organisé par Amii, Séminaire sur l'IA est une réunion hebdomadaire au cours de laquelle des étudiants, des développeurs et des professeurs dans le domaine de l'IA partagent leurs recherches actuelles. Les présentateurs sont issus de l'Université de l'Alberta, de l'industrie locale et d'autres institutions du Canada et de l'étranger. Une fois par mois, Technology Alberta participe en tant que co-organisateur et présente de nouvelles entreprises technologiques albertaines très prometteuses.

Pour en savoir plus et voir tous les séminaires à venir, consultez le site web du séminaire sur l'IA.

Partager