Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 23 février, Yi Wan, étudiant en master au département d'informatique de l'université d'Alberta, a présenté "Towards Adaptive Model-Based Reinforcement Learning" lors du séminaire sur l'IA.
Ces dernières années, un nombre croissant de méthodes d'apprentissage par renforcement basées sur des modèles profonds ont été introduites. L'intérêt pour les méthodes d'apprentissage par renforcement basées sur des modèles profonds n'est pas surprenant, étant donné leurs nombreux avantages potentiels, tels qu'une efficacité d'échantillonnage plus élevée et la possibilité d'une adaptation rapide aux changements de l'environnement. Cependant, Wan démontre, à l'aide d'une version améliorée de la configuration LoCA (Local Change Adaptation) récemment introduite, que les méthodes basées sur des modèles bien connus, telles que PlaNet et DreamerV2, sont peu performantes dans leur capacité à s'adapter aux changements locaux de l'environnement. Si l'on ajoute à cela les travaux antérieurs qui ont fait une observation similaire sur l'autre méthode populaire basée sur un modèle, MuZero, une tendance semble se dessiner, suggérant que les méthodes actuelles basées sur des modèles profonds ont de sérieuses limites. Wan plonge plus profondément dans les causes de cette mauvaise performance, en identifiant les éléments qui nuisent au comportement adaptatif et en les reliant aux techniques sous-jacentes fréquemment utilisées dans le RL à base de modèles profonds. Il valide empiriquement ces idées dans le cas de l'approximation des fonctions linéaires en démontrant qu'une version modifiée de Dyna linéaire permet une adaptation efficace aux changements locaux. En outre, Wan donne un aperçu détaillé des défis que pose la construction d'une méthode adaptative non linéaire basée sur un modèle, en expérimentant une version non linéaire de Dyna.
Regardez la présentation complète ci-dessous :
Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.
Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.
7 novembre 2024
Nouvelles
Amii s'associe à pipikwan pêhtâkwan et à sa jeune entreprise wâsikan kisewâtisiwin pour exploiter l'IA afin de lutter contre la désinformation au sujet des peuples autochtones et d'inclure ces derniers dans le développement de l'IA. Le projet est soutenu par l'engagement de PrairiesCan à accélérer l'adoption de l'IA par les PME de la région des Prairies.
7 novembre 2024
Nouvelles
Russ Greiner, boursier Amii et titulaire de la chaire CIFAR AI du Canada, et David Wishart, chercheur et collaborateur de l'Université de l'Alberta, ont reçu le prix Brockhouse Canada pour la recherche interdisciplinaire en sciences et en ingénierie, décerné par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
6 novembre 2024
Nouvelles
Jonathan Schaeffer, membre fondateur d'Amii, a passé 40 ans à avoir un impact considérable sur la théorie des jeux et l'IA. Aujourd'hui, il se retire du monde universitaire et partage certaines des connaissances qu'il a acquises au cours de son impressionnante carrière.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.