Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 23 février, Yi Wan, étudiant en master au département d'informatique de l'université d'Alberta, a présenté "Towards Adaptive Model-Based Reinforcement Learning" lors du séminaire sur l'IA.
Ces dernières années, un nombre croissant de méthodes d'apprentissage par renforcement basées sur des modèles profonds ont été introduites. L'intérêt pour les méthodes d'apprentissage par renforcement basées sur des modèles profonds n'est pas surprenant, étant donné leurs nombreux avantages potentiels, tels qu'une efficacité d'échantillonnage plus élevée et la possibilité d'une adaptation rapide aux changements de l'environnement. Cependant, Wan démontre, à l'aide d'une version améliorée de la configuration LoCA (Local Change Adaptation) récemment introduite, que les méthodes basées sur des modèles bien connus, telles que PlaNet et DreamerV2, sont peu performantes dans leur capacité à s'adapter aux changements locaux de l'environnement. Si l'on ajoute à cela les travaux antérieurs qui ont fait une observation similaire sur l'autre méthode populaire basée sur un modèle, MuZero, une tendance semble se dessiner, suggérant que les méthodes actuelles basées sur des modèles profonds ont de sérieuses limites. Wan plonge plus profondément dans les causes de cette mauvaise performance, en identifiant les éléments qui nuisent au comportement adaptatif et en les reliant aux techniques sous-jacentes fréquemment utilisées dans le RL à base de modèles profonds. Il valide empiriquement ces idées dans le cas de l'approximation des fonctions linéaires en démontrant qu'une version modifiée de Dyna linéaire permet une adaptation efficace aux changements locaux. En outre, Wan donne un aperçu détaillé des défis que pose la construction d'une méthode adaptative non linéaire basée sur un modèle, en expérimentant une version non linéaire de Dyna.
Regardez la présentation complète ci-dessous :
Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.
Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.
2 mai 2024
Nouvelles
Lisez notre mise à jour mensuelle sur la croissance de l'écosystème de l'intelligence artificielle en Alberta et sur les possibilités d'y participer.
8 avril 2024
Nouvelles
Les boursiers d'Amii partagent des conseils sur la manière de tirer le meilleur parti de votre expérience de la conférence.
26 mars 2024
Nouvelles
Dans l'épisode de ce mois-ci, Alona explique comment ChatGPT a changé la perception qu'a le public de ce que les modèles de langage d'IA peuvent faire, rendant instantanément obsolètes la plupart des références antérieures, et parle de l'excitation et de l'intensité du travail dans un domaine qui évolue rapidement comme l'IA.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.