Nouvelles
Les Tea Time Talks sont de retour ! Tout au long de l'été, assistez à des exposés de 20 minutes sur des idées de départ, des recherches futures et des sujets techniques présentés par des étudiants, des professeurs et des invités. Présentées par Amii et le laboratoire RLAI de l'Université de l'Alberta, les conférences sont une manière détendue et informelle d'entendre les leaders de l'IA discuter des futures lignes de recherche qu'ils pourraient explorer.
Regardez maintenant une sélection de conférences de la troisième semaine de la série :
Résumé : La conception de lois de commande adaptables qui peuvent être transférées entre différents robots est un défi en raison des différences cinématiques et dynamiques, ainsi que dans les scénarios où des capteurs externes sont utilisés. Dans cette présentation, Michael Przystupa explique le travail de son équipe qui étudie empiriquement la capacité d'un réseau neuronal à approximer la matrice jacobienne pour une application dans les schémas de contrôle cartésien. Plus précisément, ils s'intéressent à l'approximation du jacobien cinématique, qui découle des équations cinématiques reliant les angles des articulations d'un manipulateur à l'emplacement de l'effecteur final.
Résumé : La façon dont la généralisation est mesurée dans l'apprentissage par renforcement (RL) repose sur des concepts de l'apprentissage supervisé. Cependant, contrairement à un modèle d'apprentissage supervisé, un agent d'apprentissage par renforcement doit généraliser des états, des observations et des actions à partir d'une rétroaction limitée basée sur les récompenses. Dans cet exposé, Alex Lewandowski décrit comment son équipe a reformulé le problème de la généralisation de l'apprentissage par renforcement dans un environnement unique en considérant des processus de décision contextuels avec des observations provenant d'un ensemble de données d'apprentissage supervisé. Le résultat est un MDP qui, bien que simple, nécessite une approximation de fonction pour l'abstraction d'état tout en fournissant des étiquettes précises de vérité du terrain pour les politiques optimales et les fonctions de valeur. Les auteurs caractérisent ensuite la généralisation dans la RL sur différents axes : espace d'état, espace d'observation et espace d'action. En utilisant l'ensemble de données MNIST avec un processus de décision contextuel, ils évaluent rigoureusement la généralisation de DQN et QR-DQN dans l'espace d'observation et d'action avec un apprentissage en ligne et hors ligne.
Cette conférence présente un panel de chercheurs en apprentissage par renforcement (RL) - tous boursiers Amii, titulaires de chaires d'IA du CIFAR et professeurs de l'Université d'Alberta. Michael Bowling est le modérateur de ce panel composé de Rich Sutton, Martha White, Patrick Pilarski et Rupam Mahmood.
Vous aimez ce que vous apprenez ici ? Plongez plus profondément dans le monde de l'apprentissage par renforcement avec la spécialisation en apprentissage par renforcement, proposée par l'Université d'Alberta et Amii. Enseignée par Martha White et Adam White, cette spécialisation explore la façon dont les solutions d'apprentissage par renforcement aident à résoudre des problèmes du monde réel par le biais d'une interaction par essais et erreurs, en montrant aux apprenants comment mettre en œuvre une solution d'apprentissage par renforcement complète du début à la fin. Inscrivez-vous à cette spécialisation dès maintenant!
7 novembre 2024
Nouvelles
Amii s'associe à pipikwan pêhtâkwan et à sa jeune entreprise wâsikan kisewâtisiwin pour exploiter l'IA afin de lutter contre la désinformation au sujet des peuples autochtones et d'inclure ces derniers dans le développement de l'IA. Le projet est soutenu par l'engagement de PrairiesCan à accélérer l'adoption de l'IA par les PME de la région des Prairies.
7 novembre 2024
Nouvelles
Russ Greiner, boursier Amii et titulaire de la chaire CIFAR AI du Canada, et David Wishart, chercheur et collaborateur de l'Université de l'Alberta, ont reçu le prix Brockhouse Canada pour la recherche interdisciplinaire en sciences et en ingénierie, décerné par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
6 novembre 2024
Nouvelles
Jonathan Schaeffer, membre fondateur d'Amii, a passé 40 ans à avoir un impact considérable sur la théorie des jeux et l'IA. Aujourd'hui, il se retire du monde universitaire et partage certaines des connaissances qu'il a acquises au cours de son impressionnante carrière.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.