Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 28 avril, Jiamin He, étudiant en maîtrise à l'université d'Alberta, a présenté "Consistent Emphatic Temporal-Difference Learning" lors du séminaire sur l'IA.
L'évaluation des politiques hors politique est un problème critique et difficile dans l'apprentissage par renforcement, et l'apprentissage par différence temporelle (TD) est l'une des approches les plus importantes pour le résoudre. La recherche d'algorithmes de TD hors politique cohérents et garantis pour trouver le point fixe de TD sur politique a suscité un grand intérêt. Notamment, le TD par échantillonnage d'importance complet est la seule méthode de TD hors politique cohérente existante dans le cadre d'une approximation de fonction linéaire générale mais, malheureusement, elle présente une variance élevée et n'est guère pratique.
Ce problème notoire de variance élevée a motivé l'introduction de la DT emphatique, qui réduit la variance mais dont le point fixe est biaisé. Inspiré par ces deux méthodes, il propose un nouvel algorithme cohérent appelé Average Emphatic TD (AETD) avec un biais transitoire, qui établit un équilibre entre le biais et la variance. En outre, il unifie l'AETD avec plusieurs algorithmes existants et obtient une nouvelle famille d'algorithmes cohérents appelés Consistent Emphatic TD (CETD), qui peuvent contrôler un compromis biais-variance en douceur en faisant varier la vitesse à laquelle le biais transitoire s'estompe. Grâce à une analyse théorique et à des expériences sur un exemple didactique, il valide la cohérence de l'algorithme CETD. En outre, il montre que la CETD converge plus rapidement vers l'erreur la plus faible dans une tâche complexe à forte variance.
Regardez la présentation complète ci-dessous :
Vous voulez savoir comment donner un coup de fouet à votre carrière dans l'IA ? En savoir plus sur l'accélérateur de carrière d'Amii pour en savoir plus.
24 juillet 2024
Nouvelles
Comment obtenir les meilleurs résultats lorsque l'IA et les êtres humains travaillent ensemble ? Dans cet épisode d'Approximately Correct, nous nous penchons sur l'IA en boucle avec Matt Taylor, boursier de l'Amii et titulaire de la chaire d'IA du CIFAR au Canada.
22 juillet 2024
Nouvelles
Lisez notre mise à jour mensuelle sur la croissance de l'écosystème de l'intelligence artificielle en Alberta et sur les possibilités d'y participer.
18 juillet 2024
Nouvelles
Amii annonce sa collaboration avec Communitech, un centre d'innovation de la région de Waterloo, afin de fournir aux fondateurs de startups les outils et les ressources d'IA dont ils ont besoin pour intégrer l'IA et développer des capacités internes avec succès. La collaboration s'appuiera sur l'expertise et les ressources d'Amii en matière d'IA et sera centrée sur le programme d'exploration de l'apprentissage automatique (ML Exploration) d'Amii.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.