Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 12 mai, Brett Daley, étudiant en doctorat à l'université de l'Alberta, a présenté "Trajectory-Aware Eligibility Traces for Off-Policy Reinforcement Learning" lors du séminaire sur l'IA.
L'apprentissage hors politique à partir de retours multi-étapes est crucial pour un apprentissage par renforcement efficace sur le plan de l'échantillonnage, mais il est difficile de contrecarrer le biais hors politique sans exacerber la variance. Classiquement, le biais hors politique est corrigé par décision : les erreurs de différence temporelle passées sont repondérées par le ratio d'échantillonnage d'importance instantané après chaque action via les traces d'éligibilité. De nombreux algorithmes hors politique s'appuient sur ce mécanisme, ainsi que sur différents protocoles de découpage des ratios IS pour lutter contre la variance de l'estimateur IS. Malheureusement, une fois qu'une trace a été entièrement coupée, l'effet ne peut être inversé. Cela a conduit au développement de stratégies d'attribution de crédits qui tiennent compte de plusieurs expériences passées à la fois. Ces méthodes tenant compte de la trajectoire n'ont pas fait l'objet d'une analyse approfondie et leur justification théorique reste incertaine.
Dans cet exposé, M. Daley propose un cadre unificateur pour les méthodes de prise en compte des décisions et des trajectoires, et établit les premières conditions générales de convergence pour la prise en compte des trajectoires dans le cadre tabulaire. Il présente également un nouvel algorithme appelé Recency-Bounded Importance Sampling (RBIS), qui tire parti de la prise en compte de la trajectoire pour obtenir des résultats robustes en fonction des hyperparamètres dans plusieurs tâches de contrôle hors politique.
Regardez la présentation complète ci-dessous :
Vous voulez savoir comment donner un coup de fouet à votre carrière dans l'IA ? En savoir plus sur l'accélérateur de carrière d'Amii pour en savoir plus.
7 novembre 2024
Nouvelles
Amii s'associe à pipikwan pêhtâkwan et à sa jeune entreprise wâsikan kisewâtisiwin pour exploiter l'IA afin de lutter contre la désinformation au sujet des peuples autochtones et d'inclure ces derniers dans le développement de l'IA. Le projet est soutenu par l'engagement de PrairiesCan à accélérer l'adoption de l'IA par les PME de la région des Prairies.
7 novembre 2024
Nouvelles
Russ Greiner, boursier Amii et titulaire de la chaire CIFAR AI du Canada, et David Wishart, chercheur et collaborateur de l'Université de l'Alberta, ont reçu le prix Brockhouse Canada pour la recherche interdisciplinaire en sciences et en ingénierie, décerné par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
6 novembre 2024
Nouvelles
Jonathan Schaeffer, membre fondateur d'Amii, a passé 40 ans à avoir un impact considérable sur la théorie des jeux et l'IA. Aujourd'hui, il se retire du monde universitaire et partage certaines des connaissances qu'il a acquises au cours de son impressionnante carrière.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.