Nouvelles
Maintenant que les 2020 Tea Time Talks sont sur Youtube, vous pouvez toujours avoir le temps de prendre le thé avec Amii et le laboratoire RLAI! Animées par le Dr Richard S. Sutton, conseiller scientifique en chef d'Amii, ces conférences de 20 minutes sur des sujets techniques sont données par des étudiants, des professeurs et des invités. Les conférences sont une manière détendue et informelle d'entendre les leaders de l'IA discuter des futures lignes de recherche qu'ils pourraient explorer, avec des sujets allant des idées qui commencent à prendre racine aux projets entièrement terminés.
La douzième semaine des discussions de l'heure du thé :
La motivation intrinsèque et les fonctions de valeur générales (FVG) sont deux domaines passionnants dans le domaine de l'apprentissage par renforcement. Dans cet exposé, Matthew discute de l'intersection de ces deux sous-domaines et des raisons pour lesquelles ils peuvent être complémentaires l'un de l'autre. Il analyse ce problème avec un processus de décision de Markov (MDP) tabulaire et discute des premiers résultats intéressants.
Dans cet exposé, Shiva parle de l'apprentissage par renforcement pour la robotique et de la manière dont nous pouvons améliorer la formation. Elle propose une méthode pour réduire l'écart avec la réalité dans un environnement simulé à l'aide d'un agent contradictoire qui génère de nouveaux environnements créatifs.
Un modèle d'espérance à une étape de la dynamique de l'environnement produit une estimation de l'état suivant attendu. C'est moins général que d'estimer la distribution complète des états suivants possibles (ou un échantillon aléatoire de celle-ci) et plus général que de modéliser le monde comme déterministe. Les modèles d'espérance sont limités dans les types d'opérations de planification et d'approximations de fonctions de valeur qu'ils peuvent utiliser, mais ils sont bien adaptés à l'apprentissage. Dans cet exposé, Katya discute de ce que l'on sait des modèles d'attentes dans le contexte de l'apprentissage par renforcement basé sur des modèles et des états non markoviens. Elle montre que la planification à l'aide de modèles d'attente ne peut se faire qu'avec des valeurs d'état et non des valeurs d'action.
Les discussions de l'heure du thé sont maintenant terminées pour l'année ! Vous pouvez revoir ou rattraper les discussions précédentes sur notre liste de lecture Youtube.
7 novembre 2024
Nouvelles
Amii s'associe à pipikwan pêhtâkwan et à sa jeune entreprise wâsikan kisewâtisiwin pour exploiter l'IA afin de lutter contre la désinformation au sujet des peuples autochtones et d'inclure ces derniers dans le développement de l'IA. Le projet est soutenu par l'engagement de PrairiesCan à accélérer l'adoption de l'IA par les PME de la région des Prairies.
7 novembre 2024
Nouvelles
Russ Greiner, boursier Amii et titulaire de la chaire CIFAR AI du Canada, et David Wishart, chercheur et collaborateur de l'Université de l'Alberta, ont reçu le prix Brockhouse Canada pour la recherche interdisciplinaire en sciences et en ingénierie, décerné par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
6 novembre 2024
Nouvelles
Jonathan Schaeffer, membre fondateur d'Amii, a passé 40 ans à avoir un impact considérable sur la théorie des jeux et l'IA. Aujourd'hui, il se retire du monde universitaire et partage certaines des connaissances qu'il a acquises au cours de son impressionnante carrière.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.