Nouvelles
Maintenant que les 2020 Tea Time Talks sont sur Youtube, vous pouvez toujours avoir le temps de prendre le thé avec Amii et le laboratoire RLAI! Animées par le Dr Richard S. Sutton, conseiller scientifique en chef d'Amii, ces conférences de 20 minutes sur des sujets techniques sont données par des étudiants, des professeurs et des invités. Les conférences sont une manière détendue et informelle d'entendre les leaders de l'IA discuter des futures lignes de recherche qu'ils pourraient explorer, avec des sujets allant des idées qui commencent à prendre racine aux projets entièrement terminés.
La septième semaine des discussions de l'heure du thé :
Les prédictions, en particulier celles des fonctions de valeur générales (GVF), ont donné lieu à de nombreux axes de recherche et de réflexion au laboratoire RLAI. Bien que de nombreux nouveaux algorithmes d'apprentissage des fonctions de valeur générale aient vu le jour ces dernières années, leur utilisation soulève encore de nombreuses questions. Dans cet exposé, Matthew présente les concepts fondamentaux du codage prédictif hiérarchique (Rao, 1999), un schéma qui utilise les prédictions pour inhiber les signaux de feed-forward par le biais d'une rétroaction corrective. Il discute également d'une instanciation du modèle de codage prédictif hiérarchique à l'aide de techniques d'apprentissage profond.
Les environnements sont préconfigurés avec des hyperparamètres, tels que les taux de discrétisation et les sauts d'images, qui déterminent la fenêtre d'abstraction temporelle d'un agent. À son tour, cette fenêtre temporelle influence l'ampleur de l'écart d'action et a un impact considérable sur l'apprentissage. Alex présente les travaux en cours qui utilisent un réseau neuronal récurrent pour apprendre de manière flexible des séquences d'action dans une fenêtre temporelle.
Dans cet exposé, Shibhansh explore l'interaction entre les techniques de génération et de test et de descente de gradient pour résoudre les problèmes d'apprentissage supervisé. Il commence par présenter un nouveau cadre idéalisé dans lequel la fonction cible est stationnaire mais beaucoup plus complexe que l'apprenant, et dans lequel la distribution des entrées varie lentement. Ensuite, il montre que si la fonction cible est plus complexe que l'approximateur, le suivi est meilleur que tout ensemble fixe de poids. Enfin, il explique que la rétropropagation conventionnelle est peu performante dans ce contexte, mais que ses performances peuvent être améliorées si nous utilisons la recherche aléatoire pour remplacer les caractéristiques de faible utilité.
Dans son exposé, M. Dhawal explore la possibilité d'utiliser les techniques de pas adaptatifs de la communauté de l'apprentissage profond pour l'utilisation de l'apprentissage par différence temporelle (TD). Les méthodes de pas adaptatifs offrent-elles un répit dans les problèmes de divergence de l'apprentissage par différence temporelle, principalement en raison de l'inadéquation entre le comportement et la politique cible ? Cela mérite-t-il même d'être étudié, ou faut-il développer des techniques de pas complètement distinctes pour l'apprentissage par différence temporelle ?
Les Tea Time Talks sont désormais terminés pour l'année, mais restez à l'écoute car nous mettrons en ligne les autres conférences dans les semaines à venir. En attendant, vous pouvez revoir ou rattraper les conférences précédentes sur notre liste de lecture Youtube.
7 novembre 2024
Nouvelles
Amii s'associe à pipikwan pêhtâkwan et à sa jeune entreprise wâsikan kisewâtisiwin pour exploiter l'IA afin de lutter contre la désinformation au sujet des peuples autochtones et d'inclure ces derniers dans le développement de l'IA. Le projet est soutenu par l'engagement de PrairiesCan à accélérer l'adoption de l'IA par les PME de la région des Prairies.
7 novembre 2024
Nouvelles
Russ Greiner, boursier Amii et titulaire de la chaire CIFAR AI du Canada, et David Wishart, chercheur et collaborateur de l'Université de l'Alberta, ont reçu le prix Brockhouse Canada pour la recherche interdisciplinaire en sciences et en ingénierie, décerné par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
6 novembre 2024
Nouvelles
Jonathan Schaeffer, membre fondateur d'Amii, a passé 40 ans à avoir un impact considérable sur la théorie des jeux et l'IA. Aujourd'hui, il se retire du monde universitaire et partage certaines des connaissances qu'il a acquises au cours de son impressionnante carrière.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.