Le séminaire sur l'intelligence artificielle est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (IA) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications innovantes des techniques d'IA à de nouveaux domaines et problèmes.
Résumé : Les processus décisionnels markoviens contraints (CMDP) constituent un cadre d'apprentissage par renforcement essentiel pour garantir la sécurité et les objectifs critiques tout en maximisant les récompenses. Cependant, l'apprentissage efficace dans les CMDP avec des états infinis et l'approximation de fonction reste un défi. Nous abordons ce problème en utilisant une approximation de fonction linéaire sous q_pi-réalisabilité, où toutes les fonctions de valeur des politiques peuvent être représentées par une carte de caractéristiques connue. En utilisant un modèle d'accès local, nous proposons un algorithme primal-dual avec une complexité d'échantillonnage polynomiale qui satisfait strictement les contraintes et renvoie une politique quasi-optimale.
Bio du présentateur : Tian Tian est doctorante en informatique à l'Université de l'Alberta. Elle travaille sous la direction de Rich Sutton et collabore avec Ling F. Yang de UCLA et Csaba Szepesvári. Elle a obtenu sa maîtrise à l'Université de l'Alberta sous la direction de Rich Sutton, après avoir obtenu sa licence en ingénierie informatique et en statistiques dans la même institution. Les recherches de Tian Tian portent principalement sur la théorie de l'apprentissage par renforcement.