Les travaux des chercheurs d'Amii seront présentés lors de la 38e conférence internationale annuelle sur l'apprentissage automatique (ICML), qui se déroule cette année en ligne du 18 au 24 juillet.
La conférence ICML est le premier rassemblement de professionnels qui se consacrent à l'avancement de la branche de l'IA connue sous le nom d'apprentissage automatique (ML). Réputée dans le monde entier pour la présentation et la publication de travaux de recherche de pointe sur tous les aspects de l'apprentissage automatique et les domaines d'application, la conférence figure parmi les dix conférences sur l'apprentissage automatique et l'IA les mieux classées au monde sur la base de l'indice h et du score d'impact (voir : Google Scholar et Guide2Research).
Les boursiers Amii et les chaires d'IA du CIFAR du Canada - des professeurs de l'Université d'Alberta, de l'Université de Colombie-Britannique et de l'Université Carleton - ainsi que d'autres chercheurs Amii ont 23 articles inclus dans les actes :
Articles acceptés
* indique un chercheur ou un ancien élève d'Amii
Une analyse de l'apprentissage méta en fonction de la distribution
Mikhail Konobeev*, Ilja Kuzborskij, Csaba Szepesvári*
Évaluation de politique hors politique de récompense moyenne avec approximation de fonction
Shangtong Zhang, Yi Wan*, Richard Sutton*, Shimon Whiteson
Wesley Chung, Valentin Thomas, Marlos C. Machado*, Nicolas Le Roux
Bootstrapping de l'évaluation Q ajustée pour l'inférence hors politique
Botao Hao, Xiang Ji, Yaqi Duan, Hao Lu, Csaba Szepesvári*, Mengdi Wang
Caractériser l'écart entre l'acteur-critique et le gradient politique
Junfeng Wen*, Saurabh Kumar, Ramki Gummadi, Dale Schuurmans*
Dustin Morrill*, Ryan D'Orazio*, Marc Lanctot*, James Wright*, Michael Bowling*, Amy Greenwald
Algorithmes emphatiques pour l'apprentissage par renforcement profond
Ray Jiang, Tom Zahavy, Zhongwen Xu, Adam White*Matteo Hessel, Charles Blundell, Hado van Hasselt
Julien Perolat, Remi Munos, Jean-Baptiste Lespiau, Shayegan Omidshafiei, Mark Rowland, Pedro Ortega, Neil Burch*, Thomas Anthony, David Balduzzi, Bart De Vylder, Georgios Piliouras, Marc Lanctot*, Karl Tuyls
Nevena Lazic, Dong Yin, Yasin Abbasi-Yadkori, Csaba Szepesvári*
Apprentissage et planification dans les processus de décision de Markov à récompense moyenne
Yi Wan*, Abhishek Naik*, Richard Sutton*
Hongyu Ren, Hanjun Dai, Bo Dai, Xinyun Chen, Michihiro Yasunaga, Haitian Sun, Dale Schuurmans*Jure Leskovec, Denny Zhou
Tirer parti de la non-uniformité dans l'optimisation non convexe du premier ordre
Jincheng Mei*, Yue Gao*, Bo Dai, Csaba Szepesvári*, Dale Schuurmans*
Branislav Kveton, Mikhail Konobeev*, Manzil Zaheer, Chih-wei Hsu, Martin Mladenov, Craig Boutilier, Csaba Szepesvári*
Sur l'optimalité des algorithmes d'optimisation des politiques par lots
Chenjun Xiao*, Yifan Wu*, Jincheng Mei*, Bo Dai, Tor Lattimore*, Lihong Li*, Csaba Szepesvári*, Dale Schuurmans*
Wentao Cui, Yuhong Guo*
Hiroki Furuta, Tatsuya Matsushima, Tadashi Kozuno*, Yutaka Matsuo, Sergey Levine, Ofir Nachum, Shixiang Gu
Haque Ishfaq, Qiwen Cui, Viet Nguyen, Alex Ayoub*, Zhuoran Yang, Zhaoran Wang, Doina Precup, Lin Yang
Révision du Q(λ) de Peng pour l'apprentissage par renforcement moderne
Tadashi Kozuno*, Yunhao Tang, Mark Rowland, Remi Munos, Steven Kapturowski, Will Dabney, Michal Valko et David Abel.
RNNRepair : Réparation automatique des RNN via une analyse basée sur un modèle
Xiaofei Xie, Wenbo Guo, Lei Ma*, Wei Le, Jian Wang, Lingjun Zhou, Yang Liu, Xinyu Xing
Apprentissage asymétrique robuste dans les POMDPs
Andrew Warrington, Jonathan Lavington*, Adam Ścibior, Mark Schmidt*, Frank Wood
Botao Hao, Yaqi Duan, Tor Lattimore*, Csaba Szepesvári*, Mengdi Wang
Descente par gradient naturel structuré traçable utilisant des paramétrages locaux
Wu Lin*, Frank Nielsen, Khan Emtiyaz, Mark Schmidt*
Inférence causale valide avec (certains) instruments non valides
Jason Hartford*, Victor Veitch, Dhanya Sridhar, Kevin Leyton-Brown*
Ateliers
L'apprentissage par renforcement pour la vie réelle
Co-organisé par Yuxi Li, Minmin Chen, Omer Gottesman, Lihong Li, Zongqing Lu, Rupam Mahmood*, Niranjani Prasad, Zhiwei (Tony) Qin, Csaba Szepesvári*, Matthew Taylor*.
Atelier sur la théorie de l'apprentissage par renforcement
Co-organisé par Shipra Agrawal, Simon Du, Niao He, Csaba Szepesvári*, Lin Yang
Autres activités
Soirée Trivia organisée par Amii
Date : Vendredi 23 juillet (15 h - 16 h 30 MST)
Description : Rejoignez-nous pour une soirée trivia virtuelle et profitez-en pour en apprendre davantage sur le travail que nous accomplissons à Amii ! Des équipes seront constituées au cours de l'événement et l'équipe gagnante remportera une carte-cadeau de 25 dollars pour un repas de fête offert par UberEATS.
Programme de mentorat
Date : Du 19 au 23 juillet
Description : Les chercheurs du monde entier sont invités à participer à ces sessions spéciales avec des chercheurs de premier plan en IA et en ML. Les mentors partageront leurs recherches, leurs conseils de carrière et de vie, et répondront aux questions. Consultez la liste des mentors exceptionnels ici, y compris nos propres Marlos C. Machado, Nidhi Hegde, Matthew E. Taylor, Michael Bowling, Adam White et Robert Holte!
Service
Outre le fait que son travail a été présenté à la conférence de l'ICML, Adam White a également occupé la fonction de président social.